Discusión sobre el artículo "Creación de una estrategia de retorno a la media basada en el aprendizaje automático"

 

Artículo publicado Creación de una estrategia de retorno a la media basada en el aprendizaje automático:

Este artículo propone otro enfoque original para crear sistemas comerciales basados en el aprendizaje automático, usando la clusterización y el etiquetado de transacciones para estrategias de retorno a la media.

Antes de clusterizar nada, debemos decidir por qué necesitamos esto. Imaginemos un gráfico de cotizaciones donde tenemos tendencias, flat, periodos de volatilidad alta y baja, diversos patrones y otras características. Es decir, el gráfico de cotizaciones no es algo homogéneo donde se muestren los mismos patrones. Incluso podríamos decir que existen o pueden existir patrones diferentes en distintos periodos temporales que desaparecen en otros.

La clusterización permite dividir la serie temporal original en varios estados según determinadas características, de modo que cada uno de estos estados describa observaciones similares. Esto puede facilitar la construcción del sistema comercial, ya que el aprendizaje tendrá lugar sobre datos más homogéneos y similares. Al menos, así es como podemos imaginarlo. Naturalmente, el sistema comercial no funcionará en todo el periodo histórico, sino en una parte seleccionada, compuesta por diferentes momentos del tiempo cuyos valores de características caen dentro de este grupo concreto.

Tras la clusterización, solo los ejemplos seleccionados podrán dividirse, es decir, solo a estos se les podrán asignar etiquetas de clase únicas, para construir el modelo final. Si un clúster contiene datos homogéneos con observaciones similares, su etiquetado también debería ser más homogéneo y, en consecuencia, más predecible. Podemos tomar varios clústeres de datos, dividir cada clúster por separado y, a continuación, entrenar modelos de aprendizaje automático con los datos de cada clúster y validarlos con datos de entrenamiento y de prueba. Si encontramos una clusterización que permita al modelo entrenarse bien, es decir, generalizar y predecir sobre nuevos datos, la construcción del sistema comercial puede considerarse casi terminada.


Autor: Maxim Dmitrievsky

 

No es crítico en absoluto, pero aún así me gustaría no tener wargames fuera de la caja.

 

La principal diferencia entre el filtro Savitsky-Golei y la media móvil habitual es que no se retrasa con respecto a los precios.

Es un error utilizar este filtro en línea sobre series temporales no estacionarias, ya que los últimos valores pueden redibujarse, pero es bastante adecuado para marcar operaciones sobre datos existentes.

¿Por qué no ZZ?


Cierto, he encontrado una pequeña explicación.

Este marcado tiene sus propias peculiaridades:

  • no todas las operaciones marcadas son rentables, porque los cambios de precios posteriores, después de cruzar las cintas, no siempre van en la dirección opuesta. Por lo tanto, puede haber ejemplos que se marquen falsamente como compra o venta.
  • En teoría, esta desventaja se compensa por el hecho de que el marcado es homogéneo y no aleatorio, por lo que los ejemplos marcados falsamente pueden considerarse errores en el entrenamiento o en el sistema de negociación en su conjunto, lo que puede dar lugar a un menor reentrenamiento en la salida.
Probablemente, eliminar algunos vértices de la fila ZZ tendría el mismo efecto.
[Eliminado]  
fxsaber #:

¿Por qué no ZZ entonces?


Sin embargo, he encontrado una pequeña explicación.

Probablemente lanzar algunos vértices fuera de la fila ZZ tendría el mismo efecto.
Nunca he usado zz, gracias por la idea. Escribiré un sampler de este tipo.
[Eliminado]  
fxsaber #:

No es crítico en absoluto, pero aún así me gustaría no tener wargames fuera de la caja.

Me olvidé de eso, lo guardaré.
 
La asimetría (o asimetría) en las distribuciones es una característica que describe el grado en que la distribución de los datos es asimétrica con respecto a su media. La asimetría indica cuánto se desvía una distribución de una distribución simétrica (por ejemplo, una distribución normal). La asimetría se mide utilizando el coeficiente de asimetría (skewness). Кластеризация по скосу permite identificar grupos de datos con características de distribución similares, lo que ayuda a identificar estos modos. Por ejemplo, una asimetría positiva puede indicar periodos con picos de precios raros pero grandes (por ejemplo, durante las crisis), mientras que una asimetría negativa puede indicar periodos con cambios más suaves.

Tal vez esté viendo las cosas superficialmente, pero ¿la agrupación por pendiente no es una mirada al futuro?

Pensaba que la agrupación de mercados debía hacerse por características en tiempo real: tiempo, deslizamiento, etc.

[Eliminado]  
fxsaber #:

Tal vez esté viendo las cosas superficialmente, pero ¿no es la agrupación en bisel un vistazo al futuro?

Pensaba que la agrupación de mercados debía hacerse por atributos en tiempo real: tiempo, deslizamiento, etc.

Los biseles son para las últimas n barras (10 en el artículo), es decir, en una ventana deslizante.
 
Maxim Dmitrievsky #:
Biseles de las últimas n barras (10 en el artículo), es decir, en una ventana deslizante.

El clúster correspondiente, ¿incluye lo que está a la derecha de estas 10 barras o estas mismas barras?

[Eliminado]  
fxsaber #:

¿El grupo adecuado incluye lo que está a la derecha de estas 10 barras o estas mismas barras?

10 barras atrás, de la actual. De lo contrario, incluso en el probador MT5 no coincidiría, porque no ve el futuro :)

La lógica es la misma que en el bucle del encludnik. De lo contrario, las lecturas de los probadores divergirían (la mía y MT5)
 
Maxim Dmitrievsky #:
10 barras atrás de la actual. De lo contrario, incluso en el probador MT5 no coincidiría, porque no ve el futuro :)

Suena lógico. Parece que no nos hemos entendido.

 
  • catmodel EURGBP_H1 0.onnx  — основная модель, которая дает сигналы на покупку и продажу
  • catmodel_m EURGBP_H1 0.onnx  — дополнительная модель, которая разрешает или запрещает торговлю

Terminado de leer hasta este punto y no entendía donde el origen.