Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2380

 
Aleksey Vyazmikin:

Pensé erróneamente que se trataba de columnas.

Aun así, ¿no podemos hacer todo el entrenamiento en el archivo de muestra y la comprobación en un archivo diferente?

Alexei, ¡¡¡puedes hacerlo todo!!!

Pero no me interesa.

Aprenda R. Es un lenguaje fascinante, especialmente para traynig...
 
mytarmailS:

Alexei, ¡todo es posible!

Pero no me interesa.

Aprenda R. Es un lenguaje fascinante, especialmente para traynig...

Gracias por la ayuda.

La precisión (Precision) y la exhaustividad (Recall) resultaron significativamente mejores que CatBoost.

He fusionado todas las muestras en un solo archivo.

Entonces, ¿podemos seguir pensando en esta dirección?

 
Aleksey Vyazmikin:

Gracias por su ayuda.

La precisión (Precision) y la exhaustividad (Recall) son significativamente mejores que CatBoost.

He fusionado todas las muestras en un solo archivo.

Entonces, ¿podemos seguir pensando en esta dirección?

¿Es mejor con datos nuevos o con datos de entrenamiento?

¿Qué números son los de allí y los de allá?

 
elibrarius:

¿Es mejor con datos nuevos o con datos de entrenamiento?

¿Cuáles son los números de ambos?

Por desgracia, me equivoqué, la precisión es peor, no mejor.



Sin embargo, esta es una muestra difícil - no puedo entrenar adecuadamente en él - mañana voy a probar otro, donde los buenos modelos de CatBoost'a resultan. Bueno, y en los parámetros del modelo no entiendo, así que tal vez la comparación no es muy y justo.

A expensas de un gran Recall de este modelo es posible hacer el predictor separado en general. Pero no sé cómo subirlo a un archivo :)

 
Maxim Dmitrievsky:

Es una situación tan paradójica que incluso si accidentalmente aciertas, nadie lo aprecia

porque no hay criterios de evaluación )

No, no necesito el aprecio y el reconocimiento en absoluto, porque entonces seguro que no se bajan).

Más bien, lo tomo como una especie de ejercicio o rompecabezas, al tratar de encontrar un sentido común en cualquier idea del foro)

En este caso concreto, parece ser bastante aplicable si se utiliza la regresión logística para la clasificación.

 

Lo he probado en una muestra diferente - adjunto


X <- read.csv2("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                            "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:14112 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,3528)
pp <- tail(pred2 ,3528)
caret::confusionMatrix(as.factor(yy),as.factor(pp))
    Reference
Prediction    0    1
         0 1063  860
         1  567 1019
La cuestión es cómo obtener el modelo y cómo guardar la clasificación en un archivo para empezar.
Archivos adjuntos:
xxx.zip  482 kb
 
Aleksey Vyazmikin:

Lo he probado en otra muestra - aquí


La cuestión es cómo obtener el modelo y cómo guardar la clasificación en un archivo para empezar.

catbust tiene una regularización bastante fuerte, además, si las características son categóricas, deben ser declaradas como tales en el boost

 
Maxim Dmitrievsky:

catbust tiene una regularización bastante fuerte, especialmente si las características son categóricas, debe declararlas como tales en el boost

Para los binarios, no importa si son categóricos o no.

Podrías intentar reducir la regularización - buena idea - gracias.

Hasta ahora, Lasso ha mostrado mejores resultados en la parte de la muestra que se examina.

 
Maxim Dmitrievsky:

Es decir, marcar operaciones en alguna forma de onda con un periodo de 5 o diferencia de precios y ver qué pasa

las señales también se suavizarán durante el entrenamiento


inténtalo de la misma manera. Lo tengo bien en el custom tester, tengo un problema al exportar el modelo, buscaré el error más adelante.

 
Aleksey Vyazmikin:

Para los binarios no importa si son categóricos o no.

Podrías intentar reducir la regularización - buena idea - gracias.

Hasta ahora, Lasso ha obtenido mejores resultados en la parte del examen de la muestra.

Tal vez sea un trozo de suerte de la muestra del examen. Y se hace un ajuste para ello, eligiendo el modelo con los mejores parámetros para ello.

Ahora siempre hago crossvalidate (o valido con valving-forward), no hay ajuste a una pequeña porción, sino a todos los datos a la vez, creo que es la mejor opción de entrenamiento.
El doctor también aconsejó usarlo antes de desaparecer del foro.

Razón de la queja: