Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 402

[Eliminado]  
Aliosha:

XGB - https://en.wikipedia.org/wiki/Xgboost es el arma termonuclear del aprendizaje automático.

3 meses para hft no es suficiente, para un ciclo de simulación completo, ya que el modelo necesita ser probado en diferentes mercados, cambios de régimen, techos de flash y diferentes cisnes, las pruebas de estrés sintéticas no pueden hacer eso como el mercado real. El modelo final, en su mayor parte, no utilizará más que los datos de una semana, pero para configurarlo habrá que ejecutarlo con muestras de 1 a 3 años para asegurarse de que no lo estropea todo. En 3 meses se pueden entrenar los datos y si los datascientists saben lo que hacen, resultará ser una máquina de hacer dinero regular, pero un día, tal vez en 3 meses tal vez en medio año, todo puede romper abruptamente, por razón "desconocida", o más bien conocida, ya que el modelo no se ha encontrado con tal meta-estado del mercado y se ha encendido de forma amateur.


ah, hay que volver a formarse sistemáticamente, qué sentido tiene formar a un hft en 5 años, no hacen falta ni los nervios ni los recursos

Ah, el aumento del gradiente... te escuché, te escuché, pero no lo he hecho. Cuanto más se adentra en el bosque, más se complican los términos.

 
Maxim Dmitrievsky:


No tienen sentido formar a hft en 5 años, no tienen ni el nervio ni los recursos para hacerlo.

Tal vez los chicosde LTCM también hayan esgrimido ese argumento). Dicen que si hubieran mirado dos veces hacia atrás en sus modelos, no se habrían fusionado tan ferozmente.

En cualquier caso, el entrenamiento no va inmediatamente a toda la muestra de 5 años, está claro que la ventana deslizante toma una muestra, con el aprendizaje constante, pero es importante saber qué tan rápido el modelo "sabe" cuando algo cambia fuertemente en el mercado y no es un valor atípico, no la estupidez de alguien, y no va a llenar valientemente contra una tendencia repentina, la llamada de Kolya.

 
Aliosha:

Tal vez los chicosde LTCM también hayan esgrimido ese argumento). Dicen que si hubieran mirado dos veces hacia atrás en sus modelos, no se habrían fusionado tan ferozmente.

El aprendizaje en cualquier caso no va inmediatamente a toda la muestra de 5 años, está claro que la ventana deslizante toma una muestra, con el aprendizaje constante, pero es importante saber lo rápido que el modelo "sabe" cuando algo cambia fuertemente en el mercado y esto no es un valor atípico, no la estupidez de alguien, y no va a llenar valientemente contra una tendencia repentina, la llamada Kolya.


Mdya...... te las arreglas para cagarte en el trabajo, mientras tú mismo hablas de embudos completamente diferentes. Por regla general, el modelo no es bueno cuando rompe la línea de apoyo de la curva de equilibrio, y entonces se recupera, como he mostrado antes... Confiar o no en el trabajo del modelo es una cuestión filosófica. Nadie dice que tres meses de datos sean pocos. PERO tengo una pregunta, ¿cómo sabes cómo los colecciono y a qué se refieren?????? Sólo por curiosidad. ¿Qué le hace pensar de repente que el modelo perderá su sentido si se le han presentado todas las posibles evoluciones del mercado durante tres meses?????

Hay que entender qué es antes de poder predecir el mercado. Sí, el mercado cambia en un periodo global, pero utilizo datos que causan el precio, es decir, son estos datos los que cambian el precio y no al revés. Además, después de la carga, utilizo un procedimiento único de limpieza de datos para eliminar la basura, y así obtengo los mismos modelos. Aunque mi oficio en sí no es tan malo. Necesito urgentemente un ROBOT. Y una pregunta para el público... ¿Alguien tiene un esqueleto de robot que tenga en cuenta los requotes, los ouds, y otras cosas en el comercio real?????

 
Mihail Marchukajtes:


Nadie dice que tres meses de datos sean pocos. PERO mi pregunta es cómo sabes que los colecciono y con qué se relacionan?????? Sólo por curiosidad. ¿Qué le hace pensar de repente que el modelo no tendría sentido si se le presentaran todas las posibles evoluciones del mercado en tres meses? ?????

Si se ha entrenado con datos de 3 meses, no se puede esperar que el modelo dure mucho más. El mercado que el modelo ha visto, es el que podrá operar. Su conjunto de datos no tiene sentido, comerciar con él es como adivinar con los posos del café. Lo mismo ocurre con la "máquina de Reshetov" que obtiene coeficientes para un modelo lineal, mientras que los datos no son lineales en absoluto. Hay que ser nada distante para creer en esa tontería de que en un conjunto de datos de <500 puntos un modelo lineal tardó semanas en aprender, porque es "IA")))))))))..... No sé.... es más basura que la martingala y el "impulso de la deposición".

 
Aliosha:

Si se ha entrenado con 3 meses de datos, no se puede esperar que el modelo dure mucho más. Lo que el mercado ha visto el modelo, será capaz de comerciar. Su conjunto de datos no tiene sentido, y operar con ellos es como adivinar con posos de café. Lo mismo ocurre con la "máquina de Reshetov" que obtiene coeficientes para un modelo lineal, mientras que los datos no son lineales en absoluto. Hay que ser nada distante para creer en esa tontería de que en un conjunto de datos de <500 puntos un modelo lineal tardó semanas en aprender, porque es "IA")))))))))..... No sé.... es más absurdo que la martingala y el "subir el depósito".


El valor de la semana???? Alyosha, eres realmente ALESHA Ha ha.... Qué clase de gente hay hoy en día. Ladnaya Alexeyushka usted nuestro, que es nuestro primer leer el artículo aquí y usted entenderá que mis 500 puntos que recogió durante tres meses, porque no empujar el clasificador cada barra, y hacerlo en un momento determinado y por lo tanto 500 puntos cubren el mercado durante 3 meses, y que su modelo no podía entrenar en él correctamente, así que esto es porque usted tiene un sistema de "mierda" de la IA. Incluso lo he puesto entre paréntesis para que sirva de elogio :-) Eh Alyosha, Alyosha......Entonces veo que para el fin de semana los trolls también están despiertos..... Bueno, a mí personalmente me da igual, te lo diré al final de otro secreto, sólo para desarrollar, para que entiendas a quién "estás escupiendo".

¡¡¡¡¡¡¡A todos los que pensaban que mi conjunto de datos era peor que el 50%!!!!!!! ¡¡¡¡¡¡¡¡Su sistema de IA no está construido correctamente o hay un error en él OR!!!!!!!! Y luego está el redoble de tambores de .... Su sistema está limitado por la cantidad de material que está aprendiendo, está utilizando parrillas que son capaces de aprender correctamente en 2-3 semanas (tomemos como regla que no hay ningún tipo de reentrenamiento) y trabajan durante una semana o dos. ¡¡¡¡Tales sistemas existen y no hay nada malo en ellos ESTO FUNCIONA!!!! PERO cuando se le echa encima un gran conjunto de datos, se sobreentrena o se infraentrena horriblemente, lo que acaba provocando grandes errores de entrenamiento y se empieza a pensar que el conjunto de datos es una mierda, algo bastante razonable para sus sistemas de IA. PERO, cuando un sistema de IA es realmente genial, es capaz de construir un modelo (y no sobreentrenar) incluso en este conjunto de datos que TU fallaste en .... ¡¡¡¡Verás!!!! Sólo el modelo consistirá en un gran número de entradas, creo que 10-12 y el polinomio será lo suficientemente largo y créanme, tal modelo tendrá más del 50% de beneficio. O mejor dicho, incluso para el optimizador REACH hay un límite, pero es mucho más que los que fallaron..... Así.....

 

Y lo interesante es que el principal resultado de este optimizador es el porcentaje de generalización y construí modelos con un nivel de generalización del 100%. Pero con el aumento del porcentaje de la muestra empieza a caer, y en el momento en el que cae por debajo del 50% el modelo empezará a agotarse. Pero es más probable que se acerque a la marca de los 50. De todos modos, si hay un pez en los datos, lo encontrará, si no, entonces es un lío.....

También es muy bueno para responder a la pregunta de cómo de buenos son los datos para la variable seleccionada, si los datos están llenos de mierda, se verá inmediatamente....

Me hace gracia, he dividido el conjunto de datos que he colgado y una de las muestras tiene 138 líneas, lo he ejecutado, estoy esperando.... Publicaré los resultados si me interesa....

 
Mihail Marchukajtes:


Me refiero a las semanas???? Alyosha, realmente eres Alyosha Ha ha .... ¿Qué clase de gente hay hoy en día? Ladnaya Alexeyushka que nuestro, que es nuestra primera lectura del artículo aquí y usted entenderá que mis 500 puntos que recogió durante tres meses, porque no empujar el clasificador cada bar, y hacerlo en un momento determinado y por lo tanto 500 puntos cubren el mercado durante 3 meses, y que su modelo no podía entrenar en él correctamente, así que esto es porque usted tiene su sistema de IA "basura". Incluso lo he puesto entre paréntesis para que sirva de elogio :-) Eh Alyosha, Alyosha......Entonces veo que para el fin de semana los trolls también están despiertos..... A mí personalmente me da igual, te voy a dejar al final un secreto más para que te desarrolles, para que entiendas a quién estás "engañando".

¡¡¡¡¡¡¡A todos los que pensaban que mi conjunto de datos era peor que el 50%:!!!!!!! ¡¡¡¡¡¡¡¡Su sistema de IA no está construido correctamente o hay un error en él LIBO!!!!!!!! Y luego está el redoble de tambores de .... Su sistema está limitado por la cantidad de material que está aprendiendo, está utilizando parrillas que son capaces de aprender correctamente en 2-3 semanas (tomemos como regla que no hay ningún tipo de reentrenamiento) y trabajan durante una semana o dos. ¡¡¡¡Tales sistemas existen y no hay nada malo en ellos ESTO FUNCIONA!!!! PERO cuando se le echa encima un gran conjunto de datos, se sobreentrena o se infraentrena horriblemente, lo que acaba provocando grandes errores de entrenamiento y se empieza a pensar que el conjunto de datos es una mierda, algo bastante razonable para sus sistemas de IA. PERO, cuando un sistema de IA es realmente genial, es capaz de construir un modelo (y no sobreentrenar) incluso en este conjunto de datos que TU fallaste en .... ¡¡¡¡Verás!!!! Sólo el modelo consistirá en un gran número de entradas, creo que 10-12 y el polinomio será lo suficientemente largo y créanme, tal modelo tendrá más del 50% de beneficio. O mejor dicho, incluso para el optimizador REACH hay un límite, pero es mucho más que los que fallaron..... Así.....


Y lo más interesante es que el resultado principal de este optimizador es el porcentaje de generalización y estaba construyendo modelos con un nivel de generalización del 100%. Pero con el aumento del porcentaje de la muestra empieza a caer, y llegará un momento en que caiga por debajo del 50%, y entonces el modelo se agotará. Pero es más probable que se acerque a la marca de los 50. De todos modos, si hay un pez en los datos, lo encontrará, si no, será demasiado tarde.....

También es muy bueno para responder a la pregunta de cómo de buenos son los datos para la variable seleccionada, si los datos son una mierda, será inmediatamente visible....

Me hace gracia, he dividido el conjunto de datos que he colgado y una de las muestras tiene 138 líneas, lo he ejecutado, estoy esperando.... Publicaré los resultados si me interesa....

No voy a discutir contigo, no hay nada que discutir, estás diciendo una completa tontería, "100% generalización" )))))) Creo que ni siquiera entiendes la diferencia entre modelo lineal y no lineal. Y la "máquina de Reshetov" es lineal, ni siquiera puede c XOR, es una estúpida optimización de los coeficientes del hiperplano divisor por alguna pseudo genética, balbuceo infantil...

Eso es, no ofendo a los niños, soy un tío malo, malvado, que le dicen que Papá Noel no existe)))

 
Aliosha:

No voy a discutir contigo, no hay nada que discutir, estás lleno de tonterías, "100% generalización" )))))) Creo que ni siquiera entiendes la diferencia entre modelo lineal y no lineal. Y la "máquina de Reshetov" es lineal, ni siquiera puede c XOR, es sólo una optimización de los coeficientes de los hiperplanos por parte de algunos pseutogenéticos, palabrería infantil...

Eso es todo, no ofendo a los niños, soy un tío malo, malvado, me dijo que Papá Noel no existe)))


¡¡¡¡¡YEAH!!!!! ¡Soy Papá Noel! Y todos los años felicito a los niños por esta hermosa fiesta. Incluso has conseguido perder contra mí aquí :-)
 
Alyosha:

No voy a discutir contigo, no hay nada que discutir, estás diciendo una completa tontería, "100% generalización" )))))). Creo que ni siquiera entiendes la diferencia entre modelo lineal y no lineal. Y la "máquina de Reshetov" es lineal, ni siquiera puede c XOR, es una estúpida optimización de los coeficientes del hiperplano divisor por alguna pseudo genética, balbuceo infantil...

Eso es todo, no ofendo a los niños, soy un tío malo, malvado, me dijo que Papá Noel no existe)))


Te voy a dar un modelo con un nivel de generalización del 100%....
 
Mihail Marchukajtes:

Le enviaré un modelo con un nivel de generalización del 100%....
No hay necesidad de soplar el grial, ¡comerciar urgentemente en él, comerciar! Todo el mundo te lo agradecerá :)