Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2536

 
Aleksey Nikolayev #:

Un reputado científico escribió que el precio debe ser necesariamente logarítmico y todos los teóricos siguen ciegamente con ello.

¿John Tukey? ¿O Box y Cox?

 
transcendreamer #:

¿John Tukey? ¿O Box y Cox?

Tal vez Eugene Fama en su tesis, pero no estoy seguro.

 
Renat Akhtyamov #:

Creo que ya ha estado aquí.

Bueno, el problema de los planos y las tendencias volverá a rodar


...........

El método es el siguiente:

1)Tiene algún tipo de modelo (por ejemplo, regresión lineal)

2) Usted tiene una serie de observaciones de las que no está seguro.

A continuación, cree un poco de ruido aleatorio y combínelo con un conjunto de observaciones, repítalo varias veces.

A continuación, compara el comportamiento del modelo en los diferentes conjuntos resultantes y saca algunas conclusiones.

Opcionalmente, podemos seleccionar el comportamiento más estable como el preferido.

Esto no es una varita mágica, sino sólo una herramienta para el análisis y la posible mejora ligera, no hace que el modelo equivocado sea correcto.

 
LenaTrap #:

...........

El método es el siguiente:

1)Tiene algún tipo de modelo (por ejemplo, regresión lineal)

2)Un conjunto de observaciones de las que no está seguro

A continuación, cree un poco de ruido aleatorio y combínelo con un conjunto de observaciones, repítalo varias veces.

A continuación, compara el comportamiento del modelo en los diferentes conjuntos resultantes y saca algunas conclusiones.

Opcionalmente, podemos seleccionar el comportamiento más estable como el preferido.

No se trata de una varita mágica, sino sólo de una herramienta de análisis y de posibles ligeras mejoras, no convierte un modelo equivocado en uno correcto.

No está claro. Existe una serie determinista y un modelo que la describe con una precisión del 100%. Si añades ruido, la precisión del modelo es del 52%. ¿Qué sentido tiene esta acción?
 
Dmytryi Nazarchuk #:
No está claro. Existe una serie determinista y un modelo que la describe con una precisión del 100%. Si añades ruido, la precisión de la descripción del modelo es del 52%. ¿Qué significa esta acción?

En el código morse y los comunicadores. viene de ahí.

 
LenaTrap #:

...........

El método es el siguiente:

1)Tiene algún tipo de modelo (por ejemplo, regresión lineal)

2)Un conjunto de observaciones de las que no está seguro

A continuación, cree un poco de ruido aleatorio y combínelo con un conjunto de observaciones, repítalo varias veces.

A continuación, compara el comportamiento del modelo en los diferentes conjuntos resultantes y saca algunas conclusiones.

Opcionalmente, podemos seleccionar el comportamiento más estable como el preferido.

No se trata de una varita mágica, sino simplemente de una herramienta de análisis y de posibles ligeras mejoras, no convierte el modelo equivocado en el correcto.

Sólo en determinadas situaciones, y hay un conjunto de situaciones en las que no funciona. La única esperanza es que por lógica, que no siempre es así, haya menos situaciones en las que no funcione.

 
Dmytryi Nazarchuk #:
No está claro. Existe una serie determinista y un modelo que la describe con una precisión del 100%. Si añades ruido, la precisión de la descripción del modelo es del 52%. ¿Qué significa esta acción?

Si puedes obtener valores exactos de esta serie, no tiene sentido. Si sólo puede obtener valores aproximados, la cuestión es bastante sencilla, comprobar si el resultado del modelo es el error de sus mediciones inexactas de la serie original (ideal). Hay fórmulas y definiciones matemáticas precisas para esto, pero no las entiendo.

 
LenaTrap #:

Si puedes obtener valores exactos de esta serie, no tiene sentido. Si sólo puede obtener valores aproximados, entonces el punto es bastante simple, para comprobar si el resultado del modelo es un error de sus mediciones inexactas de la serie original (ideal). Hay fórmulas y definiciones matemáticas precisas para esto, pero no las entiendo.

La cuestión es la fiabilidad de aislar lo buscado, no la exactitud de los valores. Está lo deseado, mezclar en 10 por ciento, seleccionar 99, mezclar en 50, seleccionar 80 o 20... todo depende del algoritmo de selección de los datos buscados.

Bueno, depende de la calidad del ruido, por supuesto. Puedes velar cualquier señal si conoces la señal.
 
LenaTrap #:

Si puedes obtener valores exactos de esta serie, no tiene sentido. Si sólo puede obtener valores aproximados, entonces el punto es bastante simple, para comprobar si el resultado del modelo es un error de sus mediciones inexactas de la serie original (ideal). Hay fórmulas y definiciones matemáticas precisas para ello, pero no las entiendo.

No es para la regresión
 
elibrarius #:
He rellenado los predictores y la salida al azar. Sólo para asegurarse de que el aprendizaje no es posible. Me aseguré de que fuera 50/50%.
Con las cotizaciones y con el objetivo en TP=SL también es 50/50%.

¿Pero qué pasa si el objetivo no se fija al azar?

Aquí he probado un experimento: mi muestra suele estar dividida en 3 partes, así que las he fusionado en una sola muestra y he entrenado el modelo con 100 árboles, luego he comprobado qué predictores no se han utilizado y los he bloqueado. A continuación, entrené el modelo como de costumbre con una parada en el sobreentrenamiento en la segunda muestra, y comparé los resultados en la tercera muestra con la variante cuando entreno sin excluir predictores. Resultó que los resultados fueron mejores en los predictores seleccionados, y aquí me parece difícil concluir este efecto pensando "la selección de diferentes predictores se debe a la diferencia de muestras en el intervalo, al entrenar en toda la muestra seleccionamos automáticamente los predictores que no pierden su significación con el tiempo." Sin embargo, ¿significa esto que cuanto mayor sea la muestra, más robusto será el modelo a largo plazo? ¿Se pueden seleccionar los predictores para el aprendizaje de esta manera, es decir, no contribuye al sobreaprendizaje? En general escuché la recomendación de los fundadores de CatBoost de que es necesario encontrar los hiperparámetros del modelo, y luego estúpidamente entrenar en todas las muestras accesibles para la aplicación del modelo en el trabajo.


elibrarius #:
Había una variante con un error del 47,5%, parecía genial, pero cuando la conecté al probador de MT resultó ser una caída en lugar de un crecimiento. Resulta que no tuve en cuenta la comisión, se comió ese 2% de ventaja.

Aquí está pensando en cómo contabilizar la comisión...
Quería añadir 4 puntos a la diferencia. Pero eso no es correcto. Debido a que el TP y el SL a veces se activan por la sobreestimación de la Ask, no en esa barra, donde debería estar en el probador, debido a esto el orden de las operaciones posteriores puede cambiar.
Pero el probador utiliza la extensión mínima en la barra, también diferirá de la realidad.

Todavía no he descubierto la mejor manera.

Si el mercado se moviera en la dirección de A por 100 puntos, entonces la dependencia del spread no debería existir en absoluto - el resultado financiero depende sólo del spread - creo que no debería tenerse en cuenta en la formación. Supongamos que tengo entradas en el mercado, después de que el modelo las confirme o no, y al marcarlas tengo la posibilidad de ampliar virtualmente el spread, es decir, si el beneficio es menor que el número de puntos especificado, entonces no entrar. También se tiene en cuenta el spread en el análisis del modelo, cuando el resultado se calcula puramente por muestreo - simplemente se resta un número determinado de puntos del resultado financiero de la operación.

En Moex los stops se activan donde estaba el precio, así que por supuesto es más fácil con eso.

Razón de la queja: