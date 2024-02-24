Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1144
Yo no diría "exactamente así", la fórmula en sí es correcta, pero no debería calcularse por los rendimientos de las operaciones, sino por los rendimientos diarios (horarios, etc.). No lo creo, la fórmula en sí es correcta, pero hay que comparar las estrategias no por los rendimientos de las operaciones, sino por los rendimientos diarios (horarios, etc.), por el mismo paso, para todas las estratagemas, entonces podemos compararlas por rendimiento en función de este valor del coeficiente, de lo contrario si este número se calcula por operaciones y su número significativamente diferente, no es importante, por ejemplo 0,01 Sharpe para una estrategia y 5 para otra, no está claro cuál de ellas es mejor o peor, sólo es importante el signo (por encima o por debajo de cero Sharpe).
Así que, aunque Pantural no está hablando exactamente del clásico Sharpe Ratio, pero aun así ha planteado una cuestión importante al respecto. Aunque personalmente no prefiero utilizar el Ratio de Sharpe, prefiero el Ratio de Beneficio a la Reducción Máxima como medida del rendimiento de la estrategia.
en cualquier caso, pantural ya no tiene forma de objetar :))¿Qué estás haciendo ahora, vagando por ahí? ¿No quieres discutir algunas cosas normales en el campo del MO? :) Necesito una persona que sepa mucho de fórmulas. El tema se ha quedado vacío, no hay nadie con quien discutir.
¿Qué haces ahora, deambulando al azar? ¿No quieres discutir cosas normales en el ámbito del Ministerio de Defensa? :) Necesito a alguien que domine las fórmulas. El tema se ha vaciado y no hay nadie con quien discutir.
En principio, estoy dispuesto a dar mi opinión sobre cualquier tema. Pero la disponibilidad de sentido para usted en mis declaraciones no puedo garantizar)
¿Te he tirado la información del bandido? Un tema muy interesante, pero muchas fórmulas.
Sí, eso creo. Pero actualiza el enlace y escribe lo que aproximadamente interesa.
el enlace de arriba, interesado en bandidos adversarios para procesos no estacionarios, con algoritmos combinatorios (aparentemente, algo así como mgua). yo mismo en el proceso de familiarizarse con la información todavía
Más adelante se hablará de ello
En su libro me encontré con esto inmediatamente:
Todo lo que el alumno sabe es que el verdadero entorno se encuentra en un conjunto E llamado clase de entorno.
¿Cómo ve este conjunto E para el comercio?
Bueno, es un entorno de conjunto arbitrario para un bandido, por ejemplo un conjunto de indicadorespor ejemplo, un indicador rsi, para simplificar, un conjunto de múltiples incrementos de precios
Sin embargo, no entiendo cómo se relaciona su modelo con el comercio. De su definición de estrategia (política) se deduce que sólo se fijan en las acciones realizadas y en sus resultados. En el medio ambiente (en su opinión - un conjunto de indicadores) no lo hacen o ni siquiera pueden verlo.
At sólo debe depender de la historia Ht-1 = (A1 , X1 , . . . , At-1 , Xt-1 ). Una política es un mapa de historias a acciones.
Además, su entorno parece incluso capaz de rastrear nuestro comportamiento, por lo que la recompensa no sólo dependerá de la acción en sí, sino también de toda su prehistoria.
Un entorno es un mapeo desde las secuencias de la historia que terminan en acciones hasta las recompensas.
Si la política es aproximada por algún modelo (digamos lineal) entonces simplemente obtenemos una solución sobre los nuevos datos y ya está, sustituyéndola en el modelo
lo que describes es un proceso de búsqueda de las mayores recompensas
El principal problema de la no estacionariedad es cuando deja de funcionar con los nuevos datos. Allí se describen los bandidos inestables, pero aún no he llegado a ellos. Hay que reconocer que no hay nada que no sepa ya, como se ve :) Pero necesito algunas ideas{soluciones en cuanto a cómo dar recompensas correctamente
Por cierto, ayer implementé exactamente el bandido lineal, el resultado es algo así:
De hecho, el ejemplo sigue estando descrito en mi artículo, pero utiliza un bosque aleatorio en lugar de uno lineal. La línea debería estar menos sobreentrenada
Enseñar sobre el futuro y examinar sobre el pasado es algo que sólo se ve en este foro)))