Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2878

 
Aleksey Nikolayev #:

Ok, Feliz Año Nuevo a todos :)

Igualmente :)

 

No sé muy bien qué has sacado en claro de la conversación sobre GPT.

A veces responde mal. He aquí un ejemplo

В идеале, алгоритм должен получать на вход всю доступную историю, которая очевидно со временем растёт. Он сам должен определять на какие куски её нарезать и что с ними делать.

*Sí, idealmente el algoritmo debería ser capaz de manejar cualquier número de características

Usted preguntó sobre la variación de la longitud de las filas, y él respondió sobre la variación de la longitud de las columnas.

En la práctica, la longitud del historial puede cambiarse volviendo a entrenar el modelo. Por ejemplo, entrenar en 1 día, 3, 7, mes, 2, ... 1 año, 2, 3... Sea cual sea la longitud del historial que prediga bien, utilícela.
 
Aleksey Nikolayev #:

Es una pregunta muy importante, siempre estoy pensando en ello) Hablemos de la longitud del historial utilizado. Debería haber un compromiso razonable entre relevancia y longitud para los cálculos. Cuanto más corto, más relevante, pero cuanto más largo, más precisos serán los cálculos. A veces, un buen compromiso es en principio inalcanzable.

Yo también me planteé esta cuestión hace mucho tiempo; en mi opinión, es uno de los momentos más importantes para construir un ST que funcione. En mi caso, utilizo este enfoque: analizo a grandes rasgos algunas características de un activo financiero en un amplio historial conocido, encuentro las coordenadas de las tendencias de cambio -tendencia, volatilidad, etc.- y, a continuación, trabajo a partir del último punto de cambio, suponiendo que esta característica global se mantendrá durante algún tiempo.

 
elibrarius filas y te contestó sobre la variación de la longitud de las columnas.
Prácticamente se puede cambiar la longitud del historial volviendo a entrenar el modelo. Por ejemplo, entrenar en 1 día, 3, 7, mes, 2, ... 1 año, 2, 3... Cualquiera que sea la longitud del historial que prediga bien, utilícela.

Aún no se ha hablado en absoluto de las columnas, todavía queda mucho camino por recorrer. La confusión se debe a la falta de decir que las señales son precio (barras, renko, etc). Es decir, estamos hablando de una longitud arbitraria de un vector de atributos homogéneos. Si además de la longitud arbitraria del vector de atributos queremos tener tipos arbitrarios de atributos, ya es una clara exageración.

 
Aleksey Nikolayev #:

El problema es que SB es bastante bueno en hacer que parezca que hay reglas - el único problema es que serán diferentes en diferentes sitios.

entonces si lo piensas, no es un problema de un número arbitrario de características, es un problema de invariancia de características en primer lugar.

https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf
 
Aleksey Nikolayev #:

Es una pregunta muy importante, siempre estoy pensando en ello) Hablemos de la longitud del historial utilizado. Debería haber un compromiso razonable entre relevancia y longitud para los cálculos. Cuanto más corto, más relevante, pero cuanto más largo, más precisos serán los cálculos. A veces, un buen compromiso es en principio inalcanzable.

Se necesita un criterio, y el único criterio es el error de ajuste del modelo.

He aquí una imagen


Se trata de una muestra de 2000 barras, 43 variables. Vemos que no tiene sentido aumentar el número de árboles por encima de 100. He cambiado el tamaño de la muestra. El resultado es que la imagen no cambia por encima de 1500 barras. Esto significa que el número de patrones en mis predictores para mi profesor es de unas 100 piezas y todas ellas se pueden encontrar en 1500 compases de historia. Además, estos patrones se repiten.

 
mytarmailS #:

entonces, si lo piensas, no es un problema de un número arbitrario de características, es un problema de invariancia de características en primer lugar

https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf

Si lo comparamos con el reconocimiento de imágenes, se trata más o menos de encontrar, para cada punto, el límite del objeto (blob) en el que se encuentra ese punto.

El problema es que la imagen es de muy mala calidad y no está muy claro lo que aparece en ella.

En estas condiciones, no es realista seleccionar un objeto pequeño, y un objeto grande se seleccionará de forma ambigua.

 
СанСаныч Фоменко #:

Se necesita un criterio, y el único criterio es el error de ajuste del modelo.

He aquí una imagen


Se trata de una muestra de 2000 barras, 43 variables. Vemos que es inútil aumentar el número de árboles por encima de 100. He cambiado el tamaño de la muestra. El resultado es que el cuadro no cambia por encima de 1500 barras. Esto significa que el número de patrones en mis predictores para mi profesor es de unas 100 piezas y todas ellas se pueden encontrar en 1500 compases de historia. Además, estos patrones se repiten.

1500 compases es la temperatura media del hospital. Habrá puntos de ruptura, cuando las mitades de la historia son muy diferentes y cuando es mejor no contar y operar nada.

 
Aleksey Nikolayev #:

1500 barras es la "temperatura media del hospital". Habrá puntos de ruptura, cuando las mitades de la historia son muy diferentes y cuando es mejor simplemente no contar y operar cualquier cosa.

No hay matemáticas para las fracturas - no hay nada que discutir.

 
СанСаныч Фоменко #:

No hay matemáticas para las fracturas: nada que discutir.

El papel de las matemáticas en las roturas de divisas siempre está presente, pero ¿quién lo rastrea realmente? ¿Y mucho menos quién lo muestra?

No lo veo en el dominio público ni por asomo. Pero es una bomba para los mercados.

Razón de la queja: