Discusión sobre el artículo "Remuestreo avanzado y selección de modelos CatBoost con el método de fuerza bruta" - página 4

 
Maxim Dmitrievsky:

no es buscar patrones en el futuro, sino buscar dependencias en una serie. La secuencia no es importante. Puedes buscar en el medio y probar delante y detrás, no cambiará nada.

es tan sencillo de entender que no requiere más explicaciones.

La ventaja es que el patrón encontrado puede desaparecer con el tiempo. En este caso, es preferible aprender de datos recientes

no es fácil. Siempre parece que cuanto más cerca, más cierto. Sustitución de concepto. En realidad, lo mismo para la tarea de encontrar patrones).

 
Stanislav Korotky:

No se trata de una serie abstracta. Hay "dependencias" evidentes (la misma palabra, pero el significado es distinto para entendernos) de izquierda a derecha (del pasado al futuro), pero no al revés. Apenas hay publicaciones científicas sobre previsión de cotizaciones, en las que se hagan pruebas sobre el pasado.

Si los signos tuvieran una tendencia lineal o cualquier otra dependencia temporal, sería correcto. El modelo del artículo no tiene en cuenta el tiempo de ninguna manera, la consistencia no es importante

Y si te fijas en enfoques econométricos más recientes como el bootstrap o las redes neuronales, ahí se mezclan secuencias. Es decir, no hay dependencias temporales.

 

В первую очередь необходимо провести кластеризацию исходных данных, включая метки классов

Creo que conduce a mirar.
Ejecutarlo en una cuenta demo con una señal, durante un mes para probarlo.

 
Stanislav Korotky:

No se trata de una serie abstracta. Hay "dependencias" evidentes (la misma palabra, pero el significado es distinto para entendernos) de izquierda a derecha (del pasado al futuro), pero no al revés. Apenas hay publicaciones científicas sobre previsión de cotizaciones, en las que se hagan pruebas sobre el pasado.

En la previsión no he conocido, pero en la investigación luego 13 años en minutos 4 millones de puntos. El índice CaP. Del 84 al 96. El comienzo de la econofísica. Demostraron su no estacionariedad, la presencia de SB, y su similitud con los procesos físicos.

 
elibrarius:

Creo que conduce a mirar.
Ejecutarlo en una cuenta demo con una señal durante un mes para probarlo.

La fuente bot se adjunta, puede probarlo.

No hay peeking.

 
Maxim Dmitrievsky:

El código fuente del bot está adjunto, puedes probarlo.

No hay mirones.

Lo he pensado. Estoy de acuerdo.

Otro punto.
Eliges el que da el mejor resultado en la prueba de 50 entrenamientos aleatorios. Esto podría llamarse ajuste a la prueba. Puede que no sea tan bueno con datos nuevos.
Deberías hacer un promedio de los 50 modelos.
 
elibrarius:
Lo he pensado un poco más. Estoy de acuerdo.

Otro punto.
Eliges el que da el mejor resultado en el test de entre 50 sesiones de entrenamiento aleatorias. Esto podría llamarse ajuste a la prueba. Puede que no sea tan bueno con datos nuevos.
Más bien deberías hacer un promedio de los 50 modelos.

Hago otra prueba con datos anteriores, una prueba independiente. Si el resultado es malo, lo desecho.

Por ejemplo, el entrenamiento se hace en 2 meses, el modelo se selecciona en un periodo de un año. Luego, una prueba independiente: de 5 a 10 años.

He esbozado el enfoque en el artículo, pero todavía se puede mejorar.

No veo el sentido de promediar
 
Maxim Dmitrievsky:

Hago otra prueba con los datos anteriores, independiente. Si el resultado es malo, lo desecho.

He esbozado el planteamiento en el artículo, pero aún se puede mejorar.

¿Falla el peor modelo? ¿Y el intermedio?

 
elibrarius:

¿Drena el peor modelo? ¿Y el del medio?

de forma diferente

 
Maxim Dmitrievsky:

de forma diferente

Entonces, sin duda debe calcular el promedio. De lo contrario, será "diferente" en los nuevos datos.