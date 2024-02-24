Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3142
Para un profesor nuevo, no.
Intento resolver el problema del engrosamiento de los valores predictores. Me parece que puede producirse un error de clasificación si el valor del predictor es ligeramente diferente del valor con el que se entrenó el modelo. Una vez intenté convertir todos los predictores en forma nominal con el mismo maestro, pero no dio ningún resultado. Sin embargo, el número de valores de las variables nominales era uno. ¿Tal vez necesitemos varios cientos? Estoy trabajando, pero hay muchas otras cuestiones interesantes en el camino.
"
Un modelo ideal debería tener un sesgo y una varianza bajos. Sin embargo, en la realidad existe un "compromiso" entre sesgo y varianza. Aumentar la complejidad del modelo (por ejemplo, añadiendo más parámetros) puede reducir el sesgo pero aumentar la varianza. A la inversa, simplificar el modelo puede reducir la varianza pero aumentar el sesgo.
"Hipotéticamente, se puede doblar el cigüeñal hasta un nivel satisfactorio y afilar las holguras, pero eso no llegará muy lejos porque ya no es "por diseño".
"
Por alguna razón, a menudo se olvida el tercer componente: el error irrecuperable. Si es lo suficientemente grande (y me parece que tenemos muchos por la proximidad de los precios a SB), puede ser más importante que los dos primeros.
En cualquier caso, se trata de cosas muy importantes que se pueden resumir en una pregunta: ¿Cuál es la máxima información que se puede extraer de la muestra de precios (y otros datos disponibles) que tenemos?
así que no deberíamos intentar predecir todos los casos, sino extraer los que se predicen a través de mo
esto se denomina "efecto de trituración heterogénea", que puede compararse no con doblar un cigüeñal, sino con encontrar piezas que funcionen y descartar las que no.
entonces los atributos de X pasan a ser contextuales y no son "predictores" de Y en el sentido clásico. Por eso en kozul se denominan "covariables".
El resultado responderá a su pregunta (dependiendo de en qué se mida) sobre el máximo de información. Normalmente se mide en ATE o CATE.
Una pregunta: ¿cuál es la cantidad máxima de información que se puede extraer de la muestra de precios disponible (y de otros datos disponibles)?
Esa es una cuestión de investigación disertable, no de construir un robot que acribille pasta.
No necesitamos un máximo de información, sino un mínimo suficiente. Por lo tanto, podemos limitarnos a lo siguiente:
1. Crear un modelo que dé un error de clasificación inferior al 20% en la fase de clasificación. Y debe entenderse que el "modelo" incluye el preprocesamiento completo de los predictores, así como las herramientas para la evaluación del modelo.
2. 2. Inserte el modelo en un Asesor Experto que ofrezca al menos la misma proporción de operaciones perdedoras/rentables. Si el factor de beneficio es superior a 4, queda un paso más por dar.
3. Asegúrese de que en el OOS nada ha cambiado, y entender las razones de tal estabilidad en el OOS, que se encuentra en el preprocesamiento, no en el modelo.
Y qué errores se metieron en el 20% - ¿es interesante?
¿No sería más fácil clasificar los errores?
cuantos más errores encontremos, mejor quedará el modelo. no maximización de la información, sino cualitativa (perdón por el juego de palabras).
Creo que Snalo tiene que definir bien la tarea.
En mi opinión, la opción de Maxim arriba es muy buena. Como bien señaló San Sanych, lo importante no es la información en sí, sino cómo ayuda a multiplicar el depósito).
Si para simplificar consideramos una estrategia comercial como un tritente e Y como un beneficio, entonces la definición (TS maximizando la expectativa de beneficio) se vuelve bastante banal.
Y qué errores se metieron en el 20% - ¿es interesante?
Uno no interfiere con el otro de ninguna manera. Obviamente, el máximo no sólo es inalcanzable, sino incluso imposible de calcular, pero podemos intentar estimarlo de alguna manera y compararlo al menos aproximadamente con la dispersión, por ejemplo. Me refiero a una variante del máximo como la propuesta por Maxim.
La información está en la cabeza de una persona, pero no hay información fuera de la cabeza.
Cada persona tiene diferentes cabezas: alguien ve tendencias en una cotización, que, por cierto, hay muchas diferentes, y alguien ve incrementos. Y personas diferentes ven muchas otras cosas en la cotización inicial.
Si es por tendencias, ¿entonces el volante es más informativo que la ZZ, porque se apoya en el borde derecho, mientras que la ZZ no?
Completamente vaga declaración del problema, que es innecesario. Así que tal vez no hay tal problema?
Pues bien, no es exactamente así, o incluso no lo es en absoluto) La información, como concepto mensurable, suele estudiarse en el contexto de su transmisión de un lugar a otro) Y si algunos lugares no la reciben, no es problema de la información, sino de su posible receptor).