Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 96

 

Los datos de los pétalos del iris no son una señal, esta tabla no es adecuada para una prueba de foreca en absoluto. Sólo una serie temporal es adecuada para un lote, en el que se reciben nuevos valores a determinados intervalos y se combinan en un vector. Por esta razón, no se puede cambiar el orden de las filas en la tabla de datos para foreca. Y no se pueden eliminar al azar algunas filas para la validación, todo debe estar en estricto orden - primero los datos para el entrenamiento, luego los datos para la validación. No hay muestra.

Lo mejor que se puede hacer con iris es utilizar el número máximo de componentes min(dim(forec.dt)) = 14, pero creo que la precisión seguirá siendo inferior al 100%.

 
Dr.Trader:

Lo mejor que se puede hacer con el iris es utilizar el número máximo de componentes min(dim(forec.dt)) = 14, pero creo que la precisión seguirá siendo inferior al 100%.

hice ambas cosas, obtuve una precisión de alrededor del 85% y sólo forec mostró el 95%
 
Dr.Trader:

Los datos de los pétalos del iris no son una señal, esta tabla no es adecuada para una prueba de foreca en absoluto. Sólo una serie temporal es adecuada para un lote, en el que se reciben nuevos valores a determinados intervalos y se combinan en un vector. Por esta razón, no se puede cambiar el orden de las filas en la tabla de datos para foreca. Y no se pueden eliminar al azar algunas filas para la validación, todo debe estar en estricto orden - primero los datos para el entrenamiento, luego los datos para la validación. No hay muestra.

Lo mejor que se puede hacer con iris es utilizar el número máximo de componentes min(dim(forec.dt)) = 14, pero creo que la precisión seguirá siendo inferior al 100%.

Creo que el post sobre los lirios es muy importante.

La cuestión es que el rf es fenomenalmente propenso al sobreentrenamiento.

Y aquí resulta que la foreCA no tiene esa propensión. Así que es un paquete muy útil.

 
Dr.Trader:


¿Cuáles son sus resultados con la PA allí?
 
SanSanych Fomenko:

Me parece muy importante el post sobre los iris.

El hecho es que la rf es fenomenalmente propensa al sobreaprendizaje.

Y aquí resulta que la foreCA no tiene esa tendencia. Así que es un paquete muy útil.

Aunque se sobreentrena, si se añaden 10 columnas con valores aleatorios a 4 predictores para el iris, el bosque sigue prediciendo los nuevos datos con una precisión de casi el 100%. Me sorprende, y me alegro de que el bosque lo haya hecho bien. No he hecho nunca un experimento así, lo tendré en cuenta para el futuro.

A su vez, llamé ruido a todos los predictores con predictibilidad ~ 1% (tanto a las longitudes de los lóbulos como a los predictores de valores aleatorios), e intenté extraer alguna señal de todo ello. Creo que es inútil extraer señal de lugares donde no debería haberla, este experimento no le dice nada a foreca.

mytarmailS:
¿Cuáles son sus resultados con la PA allí?

El modelo sigue aprendiendo. Probablemente he alimentado demasiados datos, pero no quiero cancelarlo, dejarlo funcionar hasta el final, lo dejaré. Entonces, escribiré sobre los resultados cuando termine.

 
No quiero adelantarme, pero Reshetov ha hecho una cosa muy chula en la nueva versión.... Resolverá tus problemas en poco tiempo. Yo le di la idea, pero él mismo ya lo estaba pensando, así que los tontos piensan igual y el resultado es algo poderoso. No deberías desquitarte con él.....
 
Mihail Marchukajtes:
No quiero adelantarme, pero Reshetov ha hecho una cosa muy chula en la nueva versión.... . No deberías criticarlo.....

Hablar de cosas geniales...

¿Y veremos al menos una comparación con lo generalmente aceptado y conocido y reconocido?

 
SanSanych Fomenko:

Hablar de cosas geniales...

¿Veremos siquiera una comparación con lo generalmente aceptado y comúnmente conocido y reconocido?

Algún día verás uno, ¿por qué no lo harías? .....
 
Dr.Trader:

Aunque el bosque se reentrena, si añadimos otras 10 columnas de valores aleatorios a los 4 predictores de Iris, el bosque sigue prediciendo los nuevos datos con una precisión de casi el 100%. Me sorprende, y me alegro de que el bosque lo haya hecho bien. Yo no he hecho ese experimento, lo tendré en cuenta para el futuro.

Sí, yo también estoy sorprendido de que haya ignorado tan brillantemente el ruido y diferenciado de los predictores, tampoco lo había hecho nunca, era curioso ....

Así que hasta hoy no tenía ninguna confianza en la función importense

n

pero me hizo creerlo.

 
Siga sin confiar en la importancia cuando la utilice para el mercado de divisas. iris son datos muy simples, hay regularidades directas entre los datos disponibles y las clases. RF sólo tiene que encontrar un conjunto mínimo de predictores en el que se puedan definir las clases de iris y ya está.
Razón de la queja: