Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3168

 

Este método de entrenamiento consiste en la detección de líneas favorables a la exclusión de la muestra (puesta a cero) por segmento cuántico.

Cada paso es una adición de una regla. Las reglas tienen este aspecto if( arr_Q [n0][i]==1 || arr_Q [n1][i]==1 || arr_Q[nn][i ]==1 ) Propusk=true;

Esto es un gif - es necesario hacer clic en él para que funcione.

Balance - beneficio en pips - cinco dígitos.

Sí, esto es sólo un pedazo de muestra para la formación, no he hecho más allá todavía - experimentando.

Añadido: Y aquí hay otro criterio para evaluar la elección del segmento cuántico, por el que se excluirá la señal - parece que aquí la eliminación de las líneas no rentables fue más alegre.


 
Aleksey Vyazmikin #:

Eso es, me gustaría encontrar alguna regularidad en la dinámica de los cambios de orden de las secuencias, o al menos una estimación del cambio con la identificación del punto de ruptura. Y hablo de predictores binarios triviales. Por ejemplo, identificar 5 secuencias que se han encontrado en los últimos cinco años, mirar su estabilidad de predisposición al valor objetivo, y además, si hay cambios significativos tanto en las secuencias como en la predisposición, entonces excluir el predictor del entrenamiento o del modelo. He leído/visto muchos métodos durante el último medio año, pero no es realista para mí codificarlo todo para las pruebas - hay mucho trabajo que hacer. Lo más triste es cuando trabajas en algo y luego te das cuenta de que el resultado no es el esperado.

En mi opinión, es un mal enfoque en el sentido combinatorio. Un conjunto de secuencias demasiado rico puede conducir a un sobreentrenamiento: siempre habrá secuencias aleatorias "buenas".

Aleksey Vyazmikin #:

¿Cuál crees que es la ventaja de CHAID?

En primer lugar, la reflexión desde el punto de vista de matstat. Se trata de detener la construcción del árbol cuando se alcanza un determinado nivel de significación, en lugar de una regla de mano izquierda. Y el uso de la corrección de Bonferoni, etc. Es simplemente agradable desde el punto de vista estético ver un modelo tan bien pensado) Aunque, por supuesto, utilizar sólo características nominales no me conviene en absoluto, así que estoy buscando (intentando construir) otro.

 
Aleksey Vyazmikin #:

Eso es, me gustaría encontrar alguna regularidad en la dinámica de los cambios de orden de las secuencias, o al menos una estimación del cambio con la identificación del punto de ruptura. Y estoy hablando de predictores binarios triviales. Por ejemplo, identificar 5 secuencias que se han encontrado en los últimos cinco años, mirar su estabilidad de predisposición al valor objetivo, y además, si hay cambios significativos tanto en las secuencias como en la predisposición, entonces excluir el predictor del entrenamiento o del modelo. He leído/visto muchos métodos durante el último medio año, pero no es realista para mí codificarlo todo para las pruebas - hay mucho trabajo que hacer. Lo más triste es cuando trabajas en algo y luego te das cuenta de que el resultado no es el esperado.

¿Cuál cree que es la ventaja de CHAID?

1) Si procedemos de la siguiente manera, ¿obtendremos el mismo resultado que usted (en términos de significado)?
Tomamos una hoja (después de 5 divisiones), ordenamos todos los ejemplos en ella por tiempo, si primero hay un crecimiento y luego una caída por encima de cierto valor, eliminamos la hoja de su uso.

2) ¿Tienen OOS en sus gráficos?

3) Las reglas/hojas se clasifican en función de los datos de la línea de seguimiento o de la validación/prueba.

 
Aleksey Nikolayev #:

En mi opinión, es un mal enfoque en el sentido combinatorio. Un conjunto de secuencias demasiado rico puede conducir a un sobreentrenamiento: siempre habrá secuencias "buenas" que se produzcan aleatoriamente.

La cuestión aquí es detectar la estabilidad, si existe en el historial, entonces hay al menos alguna razón para esperarla en el uso real de características en el modelo. Y el método para detectarla puede ser diferente. Pero, la estimación de la distribución no es suficiente, no permite estimar la estabilidad. O necesita limpieza. Y también me encontré con el hecho de que si se toman intervalos, digamos un mes, no hay suficientes señales para cualquier conclusión estadística. De momento, le he puesto un signo de puntuación.... En cualquier caso, es importante evaluar la distribución de los acontecimientos a lo largo del tiempo.

Aleksey Nikolayev

Pensamiento en términos de matstat, en primer lugar. Esto es detener la construcción del árbol al alcanzar un determinado nivel de significación en lugar de alguna regla de la izquierda. Y el uso de la corrección de Bonferoni, etc. Es simplemente estéticamente agradable mirar un modelo tan bien pensado) Aunque, por supuesto, el uso de sólo características nominales no me conviene en absoluto, así que estoy buscando (tratando de construir) otro.

Tendré que intentarlo. ¿Has hecho comparaciones con otras opciones de construcción de árboles, el resultado es realmente mejor?

 
Forester #:

1) Si procedemos de la siguiente manera - ¿obtendremos el mismo resultado que el suyo (en términos de significado)?
Tomamos una hoja (después de 5 divisiones), ordenamos todos los ejemplos en ella por tiempo, si hay crecimiento al principio y luego una caída por encima de cierto valor - borramos la hoja de uso.

2) ¿Tienen OOS en sus gráficos?

3) Las reglas/hojas se clasifican en función de los datos de la línea de seguimiento o de la validación/prueba.

1) El rechazo es normal, la cuestión aquí es la ciclicidad si se trata de una hoja de la que estamos hablando ( tengo un segmento cuántico - literalmente una hoja de dos divisiones F>=X1 && F<X2 ). Es decir, si son oscilaciones incluso cercanas a cero, no está mal, pero no deben ser muy altas en una dirección (para la estimación tomo intervalos de 10 muestras). O literalmente, como usted escribe, al principio hubo crecimiento, y luego en su mayoría declive - esto es inmediatamente en la basura. Pero esto es todo acerca de las hojas, y si la sección cuántica, hay selección por sesgo de probabilidad del 5% de la media de la clase como uno de los criterios de selección inicial.

2. No, por supuesto que no, escribí que se trata de una muestra de entrenamiento. No hay formación de cualquier modelo en sí - Supongo que hay más para ser entrenados.

3. Sobre la traine en el ejemplo. Pero no cribado, pero sólo la selección de los que van a ser como un filtro, es decir, para conducir a cero la respuesta del modelo. Bueno, y excluir cadenas/ejemplos del entrenamiento, por lo visto.

Y en general, si nos centramos en la identificación de segmentos cuánticos estables (considere - predictores binarios), a continuación, más un "modelo" de este tipo funcionará sin entrenamiento por cualquier clasificador. Y mientras no se pueda hacer, no tiene mucho sentido utilizar clasificadores. Por supuesto, nadie anula la aleatoriedad, y se pueden encontrar algunos modelos exitosos, pero será difícil considerar razonablemente tal método.

Entre las desventajas del método está la caída del Recall, pero no es más fuerte que la del modelo CatBoost - aproximadamente hasta 0,5 en el ejemplo.

 
Aleksey Vyazmikin #:

¿Y has hecho comparaciones con otras opciones de construcción de árboles, el resultado es realmente mejor?

Lo que he encontrado ya hecho no es muy adecuado para el mercado, y el hecho en casa no está listo. Pero no tengo muchas esperanzas, así que no tengo prisa.

 

Este es el tipo de cosas que pasan. A la izquierda OOS pasa, a la derecha - no. Y el lado derecho, literalmente, se sumerge de inmediato.


Sucede casi siempre.

Es decir, literalmente inmediatamente inmersión significativa. La naturaleza de la inmersión no está claro. Parece que debería haber algo cerca de SB, pero veo una imagen tan a menudo.


Creo que si después de la optimización ejecuto un TS invertido, puede que ni siquiera pierda.

 
fxsaber #:

Este es el tipo de cosas que pasan. A la izquierda OOS pasa, a la derecha - no. Y en el lado derecho, literalmente, "inmersión" inmediatamente.


Sucede casi siempre.

Es decir, literalmente inmediatamente inmersión significativa. La naturaleza de la inmersión no está claro. Creo que debería ser algo cercano a SB, pero veo una imagen tan a menudo.


Parece que si después de la optimización de ejecutar un TS invertido, puede que ni siquiera perder.

Hace unos dos años publiqué este efecto aquí
 
mytarmailS #:
Hace unos dos años, publiqué aquí un post sobre este efecto.

Casi todos los usuarios de pruebas lo han visto. Estoy interesado en la explicación.

Foro sobre trading, sistemas automatizados de trading y testeo de estrategias de trading.

Aprendizaje automático en el trading: teoría, modelos, práctica y algoritmos de trading

fxsaber, 2023.08.16 11:38 AM

Este es el tipo de despropósitos que ocurren. A la izquierda OOS pasa, a la derecha - no. Y el lado derecho, literalmente, inmediatamente "inmersiones".

En esta imagen, la significación estadística es bastante grande: más de 3000 posiciones no superpuestas.

Supongo que este es el efecto de los cambios en el mercado dentro de la propia Muestra. Por ejemplo, había un patrón real en la Muestra al principio, y luego no había nada. Pero el ajuste se produjo en toda la Muestra.

Tenemos que evitar de alguna manera tales rupturas dentro de la Muestra.


También se produce el efecto contrario: a la izquierda el OOS está bajando, a la derecha el OOS está subiendo. Es decir, no se encontró ningún patrón en la pieza inicial de la Muestra, sino sólo encaje.

 
fxsaber #:

Este es el tipo de cosas que pasan. A la izquierda OOS pasa, a la derecha - no. Y en el lado derecho, literalmente, "inmersión" inmediatamente.


Sucede casi siempre.

Es decir, literalmente inmediatamente inmersión significativa. La naturaleza de la inmersión no está clara. Creo que debería ser algo cercano a SB, pero veo una imagen tan a menudo.


Da la sensación de que si después de la optimización se ejecuta un TS invertido, ni siquiera puede drenar.

El probador es inútil en general, incluso Renat admitió que habrá una nueva, la pregunta es ¿cuándo?

Hace un par de días estaba buscando mi tema allí, y me encontré con 2019, alguien escribió allí que el probador sólo funciona en los indicadores estándar.

es realmente cierto, han añadido tantas funcionalidades que el tester no puede con el entusiasmo de los usuarios.
Razón de la queja: