L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2380

 
Aleksey Vyazmikin:

J'ai cru à tort qu'il s'agissait de colonnes.

Pourtant, ne peut-on pas faire toute la formation sur le fichier échantillon et la vérification sur un fichier différent ?

Alexei, tu peux tout faire !!!

Mais je ne suis pas intéressé.

Apprenez R ! C'est un langage fascinant, surtout pour les traynig...
 
mytarmailS:

Alexei, tout est possible !

Mais je ne suis pas intéressé.

Apprenez R ! C'est un langage fascinant, surtout pour les traynig...

Merci pour votre aide.

La précision (Precision) et l'exhaustivité (Recall) se sont révélées nettement meilleures que celles de CatBoost.

J'ai fusionné tous les échantillons en un seul fichier.

Alors, peut-on encore penser dans cette direction ?

 
Aleksey Vyazmikin:

Merci pour votre aide.

La précision (Precision) et l'exhaustivité (Recall) sont nettement meilleures que celles de CatBoost.

J'ai fusionné tous les échantillons en un seul fichier.

Alors, peut-on encore penser dans cette direction ?

Est-il meilleur sur les nouvelles données ou sur les données de formation ?

Quels sont les chiffres qui sont à la fois ici et là ?

 
elibrarius:

Est-il meilleur sur les nouvelles données ou sur les données de formation ?

Quels sont les chiffres pour les deux ?

Hélas, j'avais tort, la précision est pire, pas meilleure.



Cependant, il s'agit d'un échantillon difficile - je ne peux pas m'entraîner correctement dessus - demain j'en essaierai un autre, où de bons modèles de CatBoost'a s'avèrent. Eh bien aussi dans les paramètres du modèle que je ne comprends pas, donc peut-être la comparaison n'est pas très et juste.

Au prix d'un rappel important de ce modèle, il est possible de faire le prédicteur séparé en général. Mais je ne sais pas comment le télécharger dans un fichier :)

 
Maxim Dmitrievsky:

C'est une situation tellement paradoxale que même si vous réussissez accidentellement, personne ne l'apprécie.

parce qu'il n'y a pas de critères d'évaluation )

Non, je n'ai pas du tout besoin d'appréciation et de reconnaissance - parce qu'alors ils ne s'en sortiront certainement pas).

Je le prends plutôt comme une sorte d'exercice ou de puzzle, lorsque j'essaie de trouver le bon sens dans n'importe quelle idée du forum).

Dans ce cas particulier, il semble être tout à fait applicable si la régression logistique est utilisée pour la classification.

 

Je l'ai essayé sur un autre échantillon - ci-joint


X <- read.csv2("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                            "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:14112 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,3528)
pp <- tail(pred2 ,3528)
caret::confusionMatrix(as.factor(yy),as.factor(pp))
    Reference
Prediction    0    1
         0 1063  860
         1  567 1019
La question est de savoir comment obtenir le modèle et comment enregistrer la classification dans un fichier pour commencer.
Dossiers :
xxx.zip  482 kb
 
Aleksey Vyazmikin:

Je l'ai essayé sur un autre échantillon - ici


La question est de savoir comment obtenir le modèle et comment enregistrer la classification dans un fichier pour commencer.

catbust a une régularisation assez forte, de plus, si les caractéristiques sont catégoriques, elles doivent être déclarées comme telles dans le boost.

 
Maxim Dmitrievsky:

catbust a une régularisation assez forte, surtout si les caractéristiques sont catégoriques, vous devez les déclarer comme telles dans le boost.

Pour les binaires, il importe peu qu'ils soient catégoriques ou non.

Vous pourriez essayer de réduire la régularisation - bonne idée - merci.

Jusqu'à présent, Lasso a montré de meilleurs résultats sur la partie examen de l'échantillon.

 
Maxim Dmitrievsky:

Par exemple, marquez des transactions sur une forme d'onde avec une période de 5 ou une différence de prix et voyez ce qui se passe.

les signes seront également lissés pendant la formation


essayez de la même façon. J'ai bien réussi dans le testeur personnalisé, j'ai un problème lors de l'exportation du modèle, je chercherai l'erreur plus tard.

 
Aleksey Vyazmikin:

Pour les binaires, il importe peu qu'ils soient catégoriques ou non.

Vous pourriez essayer de réduire la régularisation - bonne idée - merci.

Jusqu'à présent, Lasso a obtenu de meilleurs résultats sur la partie examen de l'échantillon.

Peut-être que c'est juste une partie chanceuse de l'échantillon de l'examen. Et vous faites un ajustement pour cela, en choisissant le modèle avec les meilleurs paramètres pour cela.

Maintenant, je fais toujours une validation croisée (ou une validation avec valving-forward), il n'y a pas d'ajustement à une petite portion, mais à toutes les données à la fois, je pense que c'est la meilleure option de formation.
Le docteur a également conseillé de l'utiliser avant de disparaître du forum.

Raison: