Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 55

 
Vadim Shishkin:

Añadiré intriga... no tienes que lanzar un cambio en el tipo de cambio de un artículo comercializado.

Es como arrastrarse por el pelo fuera de un pantano.

Busque también otras fuentes de datos.

¡Que el Beneficio te acompañe!

:)

¿Si es eso a lo que te refieres? Bueno, es un descubrimiento americano. Estaría encantado de incluir más información, pero aparte del historial de precios, es difícil conseguir algo más en este volumen.

Y arrastrar por los pelos es un error. Los datos contienen la señal. Y hay suficiente para cubrir los costes y obtener beneficios. Se ha confirmado prácticamente, aunque en la historia. Y los que no pueden extraerlo bailan con la pandereta. Tengo algo de experiencia en el vidrio pero aún no estoy seguro de poder hacer algo con ellos.

 

***El problema es que no hay nada que pueda hacer...

¿Habrá un Estado?

 
Alexey Burnakov:

Sugiero la lectura de algunos buenos apuntes sobre la construcción de sistemas de trading desde una posición de quant (un quant senior en un gran fondo de inversión). Las ideas me parecían razonables.

...

¿Con qué estás de acuerdo o no? ¿Qué le gustaría estudiar mejor?

Bueno, al menos con una división estricta en muestra de entrenamiento y prueba por fechas en lugar de una mezcla aleatoria preliminar de muestras con igual distribución en la muestra general y luego dividirla en partes. Puede ocurrir que una parte de la muestra contenga mayoritariamente tendencias verticales, mientras que la otra parte contenga tendencias laterales. Si aplicamos la mezcla aleatoria, la probabilidad de reunir patrones similares en diferentes partes de la muestra disminuye.

Por cierto, esta desventaja también está presente en el probador de estrategias incorporado de MetaTrader, es decir, divide la muestra de entrenamiento y la prueba de avance estrictamente por fechas. Como resultado, los cambios de tendencia del mercado cerca de la línea divisoria pueden llevar a un sobreentrenamiento deliberado.

 
Vadim Shishkin:
Chico, sal de aquí.
 
Combinador:
Chico, sal de aquí.
¿Es eso? No tienes nada más que decir aparte de la grosería, ¿verdad?
 
Alexey Burnakov:

En particular, me ha gustado este:

Porlo tanto, se separa estrictamente el conjunto dentro de la muestra y el conjuntofuera de la muestra; - se separa estrictamente el conjunto de entrenamiento y el conjunto devalidación

se ciega a los intervalos de fechas; - separa los datos exactamente por fechas (antes de X día - formación, después - validación)

utiliza Monte Carlo para evitar sesgos en el punto de partida; - genera varios resultados de la estrategia de negociación, por lo que no se ajustará a los puntos de entrada-salida.

y pruebas varios trucos de robustez. - Aplicar técnicas de robustez.

¿Qué más haces para asegurarte de que no te engañas a ti mismo?

Todo parece correcto (pero no he probado todo yo), excepto la primera. Me parece que si se utiliza estrictamente un conjunto de datos de entrenamiento, y se eligen predictores para él, se obtiene un sobreajuste de estos mismos predictores, que pueden no ser fiables en otros intervalos de tiempo. Ahora creo una nueva muestra de entrenamiento y validación cada vez antes de entrenar el modelo al seleccionar los predictores. Es mejor volver a crear muestras 3 veces y entrenar el modelo y tomar la precisión media que utilizar siempre las mismas muestras de entrenamiento y validación.

Me gusta el de las redes neuronales de proteínas :) . A veces, debido a una topología desafortunada, producen resultados muy inadecuados.

 
Vadim Shishkin:

***El problema es que no hay nada que pueda hacer...

¿Habrá un Estado?

No. Hay que ser más inteligente para darse cuenta de eso hace mucho tiempo. Aquí hay desarrollo.
 
Alexey Burnakov:
No. Hay que ser más inteligente para entenderlo hace tiempo. Hay un desarrollo.
Sí, ¿podría decir en qué año se está desarrollando y dónde se pueden ver sus resultados? :)
 
Dr.Trader:

Todo parece correcto (pero no he probado todo yo), excepto la primera. Me parece que utilizar estrictamente un conjunto de datos de entrenamiento y ajustar los predictores a él dará lugar a un sobreajuste de estos mismos predictores, que pueden no ser válidos en otros plazos. Ahora creo una nueva muestra de entrenamiento y validación cada vez antes de entrenar el modelo al seleccionar los predictores. Es mejor volver a crear muestras 3 veces y entrenar el modelo y tomar la precisión media que utilizar siempre las mismas muestras de entrenamiento y validación.

Me gusta el de las redes neuronales de proteínas :) . A veces, debido a una topología desafortunada, producen resultados muy inadecuados.

Sí. Me gustaría ver sus resultados. Tengo algo que mostrar.

¿Y tú?

Sin embargo, la pregunta parece ser retórica.

 
Vadim Shishkin:
Sí. ¿Puede decirme cuántos años de desarrollo lleva y dónde puedo ver los resultados? :)
Varios años. Aquí en el hilo está el resultado.
Razón de la queja: