Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1144

 
Grial:

Yo no diría "exactamente así", la fórmula en sí es correcta, pero no debería calcularse por los rendimientos de las operaciones, sino por los rendimientos diarios (horarios, etc.). No lo creo, la fórmula en sí es correcta, pero hay que comparar las estrategias no por los rendimientos de las operaciones, sino por los rendimientos diarios (horarios, etc.), por el mismo paso, para todas las estratagemas, entonces podemos compararlas por rendimiento en función de este valor del coeficiente, de lo contrario si este número se calcula por operaciones y su número significativamente diferente, no es importante, por ejemplo 0,01 Sharpe para una estrategia y 5 para otra, no está claro cuál de ellas es mejor o peor, sólo es importante el signo (por encima o por debajo de cero Sharpe).

Así que, aunque Pantural no está hablando exactamente del clásico Sharpe Ratio, pero aun así ha planteado una cuestión importante al respecto. Aunque personalmente no prefiero utilizar el Ratio de Sharpe, prefiero el Ratio de Beneficio a la Reducción Máxima como medida del rendimiento de la estrategia.

Yo diría que depende del EA. Si genera un orden de operaciones distinto, es decir, cuando se abre o se cierra una posición y su volumen no cambia entre la apertura y el cierre, es mejor contar por operaciones. Si el volumen de la posición cambia suavemente a lo largo del tiempo, la identificación de los momentos de una operación es menos significativa y puede calcularse con su propio método.

El método pantural es mejor para vender TCs y encontrar inversores) Así que con el tiempo supongo que se cambiarán a él)

 
Aleksey Nikolayev:

Yo diría que depende del Asesor Experto. Si genera una secuencia clara de operaciones, es decir, cuando una posición se abre y se cierra y su volumen no cambia entre la apertura y el cierre, es mejor contar por operaciones. Si el volumen de la posición cambia suavemente a lo largo del tiempo, la identificación de los momentos de una operación es menos significativa y puede calcularse con su propio método.

El método pantural es mejor para vender la ST y encontrar inversores) Así que con el tiempo, supongo que se cambiarán a él)

en cualquier caso, pantural ya no tiene forma de objetar :))

¿Qué estás haciendo ahora, vagando por ahí? ¿No quieres discutir algunas cosas normales en el campo del MO? :) Necesito una persona que sepa mucho de fórmulas. El tema se ha quedado vacío, no hay nadie con quien discutir.
 
Maxim Dmitrievsky:

¿Qué haces ahora, deambulando al azar? ¿No quieres discutir cosas normales en el ámbito del Ministerio de Defensa? :) Necesito a alguien que domine las fórmulas. El tema se ha vaciado y no hay nadie con quien discutir.

En principio, estoy dispuesto a dar mi opinión sobre cualquier tema. Pero la disponibilidad de sentido para usted en mis declaraciones no puedo garantizar)

 
Maxim Dmitrievsky:

¿Te he tirado la información del bandido? Un tema muy interesante, pero muchas fórmulas.

Sí, eso creo. Pero actualiza el enlace y escribe lo que aproximadamente interesa.

 
Aleksey Nikolayev:

Sí, solía haber algo así, creo. Pero actualizar el enlace y escribir lo que, intrínsecamente interesado.

el enlace de arriba, interesado en bandidos adversarios para procesos no estacionarios, con algoritmos combinatorios (aparentemente, algo así como mgua). yo mismo en el proceso de familiarizarse con la información todavía

Más adelante se hablará de ello

 
Maxim Dmitrievsky:

En su libro me encontré con esto inmediatamente:

Todo lo que el alumno sabe es que el verdadero entorno se encuentra en un conjunto E llamado clase de entorno.

¿Cómo ve este conjunto E para el comercio?

 
Aleksey Nikolayev:

En su libro me lo encontré enseguida:

Todo lo que el alumno sabe es que el verdadero entorno se encuentra en un conjunto E llamado clase de entorno.

¿Cómo ve este conjunto E para el comercio?

Bueno, es un entorno de conjunto arbitrario para un bandido, por ejemplo un conjunto de indicadores

por ejemplo, un indicador rsi, para simplificar, un conjunto de múltiples incrementos de precios
 
Maxim Dmitrievsky:

Bueno, es un entorno arbitrario para el bandido, como un conjunto de indicadores

por ejemplo, un indicador rsi, para simplificar, un conjunto de varios incrementos de precios

Sin embargo, no entiendo cómo se relaciona su modelo con el comercio. De su definición de estrategia (política) se deduce que sólo se fijan en las acciones realizadas y en sus resultados. En el medio ambiente (en su opinión - un conjunto de indicadores) no lo hacen o ni siquiera pueden verlo.

At sólo debe depender de la historia Ht-1 = (A1 , X1 , . . . , At-1 , Xt-1 ). Una política es un mapa de historias a acciones.

Además, su entorno parece incluso capaz de rastrear nuestro comportamiento, por lo que la recompensa no sólo dependerá de la acción en sí, sino también de toda su prehistoria.

Un entorno es un mapeo desde las secuencias de la historia que terminan en acciones hasta las recompensas.

 
Aleksey Nikolayev:

Sin embargo, no entiendo la relación entre su modelo y el comercio. De su definición de estrategia (política) se deduce que sólo se fijan en las acciones realizadas y en sus resultados. No miran el entorno (en su opinión, un conjunto de indicadores) o ni siquiera pueden verlo.

At sólo debe depender de la historia Ht-1 = (A1 , X1 , . . . , At-1 , Xt-1 ). Una política es un mapa de historias a acciones.

Además, su entorno parece incluso capaz de rastrear nuestro comportamiento, por lo que la recompensa no sólo dependerá de la acción en sí, sino también de toda su prehistoria.

Un entorno es un mapeo desde las secuencias de la historia que terminan en acciones hasta las recompensas.

Si la política es aproximada por algún modelo (digamos lineal) entonces simplemente obtenemos una solución sobre los nuevos datos y ya está, sustituyéndola en el modelo

lo que describes es un proceso de búsqueda de las mayores recompensas

El principal problema de la no estacionariedad es cuando deja de funcionar con los nuevos datos. Allí se describen los bandidos inestables, pero aún no he llegado a ellos. Hay que reconocer que no hay nada que no sepa ya, como se ve :) Pero necesito algunas ideas{soluciones en cuanto a cómo dar recompensas correctamente

Por cierto, ayer implementé exactamente el bandido lineal, el resultado es algo así:

De hecho, el ejemplo sigue estando descrito en mi artículo, pero utiliza un bosque aleatorio en lugar de uno lineal. La línea debería estar menos sobreentrenada

 
Maxim Dmitrievsky:


Enseñar sobre el futuro y examinar sobre el pasado es algo que sólo se ve en este foro)))

Razón de la queja: