Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 352

 
Maxim Dmitrievsky:

Qué error, está creando un modelo de clasificación. Cuanto mayor sea la muestra, más fuerte será la generalización, el modelo será más robusto en general y menos preciso en particular, respectivamente, cuanto menor sea el beneficio

Pongámoslo en términos de eficiencia. Si la eficiencia del sistema disminuye como resultado de una mayor complejidad, el sistema no es interesante. Una disminución de los beneficios + pérdidas indica una disminución de la eficiencia.

Con el aumento de la sostenibilidad, la eficiencia debería aumentar. La eficiencia puede definirse como el ratio beneficio/(beneficio+pérdida). También puede tomar la eficiencia por comercio.

 
Yuriy Asaulenko:

Pongámoslo en términos de eficiencia. Si la eficiencia del sistema disminuye como resultado de una mayor complejidad, el sistema no es interesante. Una disminución de los beneficios + pérdidas indica una disminución de la eficiencia.

Con el aumento de la sostenibilidad, la eficiencia debería aumentar. La eficiencia puede definirse como el ratio beneficio/(beneficio+pérdida). También se pueden considerar los KPI por operación.


No se puede aplicar a VS)) resulta que la eficiencia a largo plazo aumenta y la eficiencia a corto plazo disminuye) Si quieres poner un ejemplo... Hay una estrategia y una táctica... El aprendizaje a corto plazo ayuda a NS a ganar tácticamente, y a largo plazo - la estrategia, diferentes factores pueden influir en ella...
 
Yuriy Asaulenko:

Pongámoslo en términos de eficiencia. Si la eficiencia del sistema disminuye como resultado de una mayor complejidad, el sistema no es interesante. Una disminución de los beneficios + pérdidas indica una disminución de la eficiencia.

Con el aumento de la sostenibilidad, la eficiencia debería aumentar. La eficiencia puede definirse como el ratio beneficio/(beneficio+pérdida). También puede tomar KPI por operación.

Evitemos las bicicletas llamadas KPI.

La econometría utiliza criterios de información.

Esta es la definición

El criterio informativo es una medida de calidad relativa de los modelos econométricos (estadísticos) aplicada en econometría (estadística) que tiene en cuenta el grado de "ajuste" del modelo a los datos corregido (penalizado) por el número de parámetros estimados utilizados. Es decir, los criterios se basan en un compromiso entre la precisión del modelo y la complejidad.

Los criterios informativos se utilizan exclusivamente para comparar modelos entre sí, sin dar una interpretación significativa a sus valores. No permiten probar los modelos en el sentido de la prueba de hipótesis estadística. Engeneral, cuanto más bajos sean los valores de los criterios, mayor será la calidad relativa del modelo.


Si tomamos un paquete en el que se asume la selección del modelo, se utilizará uno de los criterios de información.

 
Dimitri:


Faa escribe el punto correcto, pero no lo expone correctamente.

Tienes una serie y un conjunto de predictores. Se divide la serie en tres partes: una muestra de entrenamiento y un avance (el caso más sencillo).

Se construyen, por ejemplo, 20 modelos.

La cuestión es que la selección de un modelo de la lista no se realiza por el mejor en la muestra de entrenamiento y no por el mejor en la de avance. Y seleccionamos el modelo que da casi las mismas puntuaciones de calidad en la muestra de entrenamiento y en la de avance.

Ambos tenemos razón.

Se utiliza un criterio informativo para seleccionar el más sencillo, pero el criterio informativo no excluye en absoluto la prueba de avance.

 
SanSanych Fomenko:

Dejemos de lado las bicicletas llamadas KPI.

La econometría utiliza criterios de información.

Una no interfiere en absoluto con la otra ni la sustituye. En economía existen criterios de eficiencia en el sentido absolutamente correspondiente a los KPI. No es necesario inventar nada.

En este caso, estamos evaluando el resultado, no el proceso. Ya no nos importan los criterios del proceso. El sistema es una caja negra. Por eso comparamos las características de las cajas.

También hay criterios de evaluación: eficacia por 1 rublo de inversión, eficiencia media de una operación, etc. Todo el negocio funciona con estos criterios. ¿Qué hacemos al final?

 
Maxim Dmitrievsky:
Bien. Ha aumentado la estabilidad del sistema: ha eliminado las detracciones. El beneficio total ni siquiera ha bajado, sino que se ha mantenido constante. La pregunta es: ¿Qué pasó con los acuerdos que le permitieron salir de esos pozos? Si no los hubiera eliminado, sólo habrían aumentado el beneficio del sistema.
 
Yuriy Asaulenko:
Bien. Ha aumentado la estabilidad del sistema al eliminar las detracciones. Incluso si el beneficio total no ha bajado, sino que se mantiene constante. La pregunta es: ¿Qué pasó con los acuerdos que le permitieron salir de esos pozos? Si no los hubiera eliminado, sólo habrían aumentado el beneficio del sistema.

Si entrenas la neurona en diferentes plazos, obtendrás resultados diferentes, no hay nada que comparar. Las señales serán diferentes, el modelo se entrenará de forma diferente y no hay nada que puedas hacer para influir en ello. No he quitado nada)
 
Maxim Dmitrievsky:

Si se entrena la neurona en diferentes intervalos de tiempo, se obtendrán resultados diferentes, no hay nada que comparar siquiera... las señales serán diferentes, el modelo se entrenará de forma diferente y no se podrá influir en él en absoluto. No he quitado nada)

Es comprensible que se elimine el optimizador. Pero la repetibilidad de los resultados es un requisito de cualquier experimento. Es decir, si tenemos resultados diferentes en el test al entrenar en diferentes secciones, es una razón para pensar.

Imagínese que enseñamos a NS idénticas a reconocer el habla utilizando la misma TdR y luego decidimos que ni siquiera se pueden comparar, porque fueron entrenadas de forma diferente.

 
Yuriy Asaulenko:

Es comprensible que se elimine el optimizador. Pero la repetibilidad de los resultados es un requisito de cualquier experimento. Es decir, si tenemos resultados diferentes en el test al entrenar en diferentes secciones, es una razón para pensar.

Imagínese que enseñamos a NS idénticas a reconocer el habla utilizando la misma TdR y luego decidimos que ni siquiera se pueden comparar, porque fueron entrenadas de forma diferente.


Bueno más o menos sí, pero en el modelo actual no es posible, no es tan complejo como para aproximar de la misma manera un pequeño conjunto de datos y un enorme
 
Maxim Dmitrievsky:

Bueno, más o menos, sí, pero en el modelo actual es imposible, no es tan complejo aproximar de la misma manera un conjunto pequeño de datos y uno enorme.

En general, si hablamos de minutos, el mercado es estadísticamente homogéneo, es decir, las estadísticas cambian poco (son estables) de una semana a otra, de un mes a otro. No lo sé, no he estudiado la cuestión. Por lo que recuerdo, estás trabajando en 1 minuto.

En principio, los sistemas simples deberían converger más rápido si son convergentes. Es decir, tienen un máximo alto. Por cierto, nosotros mismos generamos estos máximos utilizando predictores "erróneos".

Razón de la queja: