Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2384

 
Maxim Dmitrievsky

¿pudiste hacer el marcado manual? esta técnica debería ser más interesante

 
Evgeni Gavrilovi:

¿has podido hacer el marcado manual? esta técnica debe ser más interesante

No lo hice, este enfoque no me interesa.

 
mytarmailS:

He encontrado una forma de generar reglas que funcionen tanto en la bandeja como en la prueba, finalmente MLEEP....

mi corredor, mi entrenador y la prueba



¡¡¡su corredor sus datos y la prueba en 9 años pasa !!!

¡¡¡¡¡¡¡Grial encontrado!!!!!!!

Lo curioso es que mañana estaré fuera del foro, cerca de un mes, muy desafortunadamente (quiero compartir pero no tengo tiempo, cuando pueda escribir lo que hay que hacer y cómo hacerlo...


Para operar cómodamente, necesitas hacer 200-400 de estas reglas(o patrenov si quieres)

Para entender la escala, mi débil ordenador portátil puede extraer entre 5 y 8 reglas al día

No veo nada malo en minar reglas, yo quería hacer un minero visual (muy rápido) con deslizadores para buscar patrones

pero, como siempre, aún no ha terminado.

 
Maxim Dmitrievsky:

No veo nada malo en las reglas de minería, quería hacer un minero visual (muy rápido) con deslizadores, para buscar patrones

pero, como siempre, aún no lo he hecho.

¿Qué quiere producir y cómo?

 
Valeriy Yastremskiy:

¿Qué quería retirar y cómo?

como los boxplots

 
Maxim Dmitrievsky:

como los boxplots

¿Resultados de la formación o reglas del boxplot?

 
Maxim Dmitrievsky:

No veo nada malo en minar las reglas

Por supuesto que no)), e incluso si lo hicieras, no me afectaría de ninguna manera)

Maxim Dmitrievsky:

Quería hacer un minero visual (muy rápido) con deslizadores para buscar patrones

pero como siempre, aún no lo he hecho.

Pruébalo, sólo que el resultado será, en el mejor de los casos, como el renderizado de Forrest, es decir, ninguno...


La salida de Forrest es una suma de reglas activadas, las reglas no se filtran ni se rechazan de ninguna manera, y las reglas rechazadas son aproximadamente el 100%)

No se comprueba la repetibilidad de las reglas (puede haber una sola respuesta) ni su adecuación (si funciona); las reglas se ajustan a los datos (el modelo se ajusta a los datos)

El modelo se aproxima a una muestra de entrenamiento de forma aleatoria, esperando que la validación cruzada ayude, pero no lo hará por razones objetivas (hay muy pocos eventos importantes en el mercado)


He probado un enfoque diferente, no ajusto el modelo a los datos, sino que formo hipótesis y las compruebo.

1) Formo hipótesis plausibles(ya filtradas) en forma de reglas.

2) Las hipótesis se prueban con datos pequeños

3) Las hipótesis que se han probado con datos pequeños se prueban con datos grandes.

De hecho, sólo queda una de un millón de reglas plausibles

Es difícil para un lector inexperto entender la diferencia entre ambos enfoques, pero la diferencia entre ellos es abismal.

 
mytarmailS:

Por supuesto que no)), e incluso si lo hicieras, no me afectaría de ninguna manera).

Inténtelo, pero el resultado será, en el mejor de los casos, el mismo que el de Random Forest, es decir, ninguno...


La salida de Forrest es una suma de reglas activadas, las reglas no son filtradas ni rechazadas de ninguna manera, y las reglas rechazadas son aproximadamente el 100%)

No se comprueba la repetibilidad de las reglas (puede haber una sola respuesta) ni su adecuación (si funciona); las reglas se ajustan a los datos (el modelo se ajusta a los datos)

El modelo se aproxima a una muestra de entrenamiento de forma aleatoria, esperando que la validación cruzada ayude, pero no lo hará por razones objetivas (hay muy pocos eventos importantes en el mercado)


He probado un enfoque diferente, no ajusto el modelo a los datos, sino que formo hipótesis y las compruebo.

1) Formo hipótesis plausibles(ya filtradas) en forma de reglas.

2) Las hipótesis se prueban con datos pequeños

3) Las hipótesis probadas con datos pequeños se prueban con datos grandes.

De hecho, sólo queda una de un millón de reglas plausibles

Es difícil para el lector inexperto entender la diferencia entre ambos enfoques, pero la diferencia entre ellos es abismal.

Así que muéstrame los resultados del TC como ejemplo

 
Maxim Dmitrievsky:

Así que muéstrame los resultados de TC

Todavía no puedo, necesito conseguir al menos 500 reglas sucias de las que pasaré el 10% final...

Para que te hagas una idea, anoche ya tenía 2 reglas sucias


Estoy trabajando en la aceleración de la síntesis de reglas, hoy he descubierto cómo aumentar la velocidad en 5 veces y reescribí algo más de código...

 
mytarmailS:

Todavía no puedo, necesito al menos 500 reglas sucias para pasar el 10% final...

Para que lo entiendas, anoche hice dos reglas sucias.

Creo que Alexei sugirió la potencia de cálculo, le gusta hacer cálculos largos, tal vez usted puede hacer una cooperativa :)

En R sin vectorización seguirá siendo lento. Podrías utilizar algún tipo de base de datos rápida
Razón de la queja: