Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2380

 
Aleksey Vyazmikin:

Pensei, por engano, que se tratava de colunas.

Ainda assim, não podemos fazer todo o treinamento no arquivo de amostra e a verificação em um arquivo diferente?

Alexei , você pode fazer tudo!!!

Mas eu não estou interessado.

Aprende R! É uma língua fascinante, especialmente para a traynig...
 
mytarmailS:

Alexei, tudo é possível!

Mas eu não estou interessado.

Aprende R! É uma língua fascinante, especialmente para a traynig...

Obrigado pela ajuda.

A precisão (Precisão) e completude (Recall) são significativamente melhores do que CatBoost.

Eu fundi todas as amostras num só ficheiro.

Então, ainda podemos pensar nesta direcção?

 
Aleksey Vyazmikin:

Obrigado pela sua ajuda.

A precisão (Precisão) e completude (Recall) são significativamente melhores do que CatBoost.

Eu juntei todas as amostras num só ficheiro.

Então, ainda podemos pensar nesta direcção?

É melhor em dados novos ou em dados de treinamento?

Que números estão lá e lá?

 
elibrarius:

É melhor em dados novos ou em dados de treinamento?

Quais são os números de ambos?

Infelizmente, eu estava errado, a precisão é pior, não melhor.



No entanto, esta é uma amostra difícil - não consigo treinar devidamente - amanhã vou tentar outra, onde bons modelos da CatBoost'a se revelam. Bem, e nos parâmetros do modelo eu não entendo, então talvez a comparação não seja muito e justa.

Em detrimento da grande Recall deste modelo, é possível fazer o preditor separado em geral. Mas eu não sei como fazer o upload para um arquivo :)

 
Maxim Dmitrievsky:

É uma situação tão paradoxal que, mesmo que acidentalmente se consiga acertar, ninguém a aprecia

porque não há critérios de avaliação )

Não, eu não preciso de apreciação e reconhecimento - porque assim eles certamente não vão sair).

Pelo contrário, tomo isso como uma espécie de exercício ou puzzle, quando tento encontrar um senso comum em qualquer ideia de fórum)

Neste caso em particular, parece ser bastante aplicável se a regressão logística for utilizada para classificação.

 

Experimente em uma amostra diferente - anexado


X <- read.csv2("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                            "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:14112 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,3528)
pp <- tail(pred2 ,3528)
caret::confusionMatrix(as.factor(yy),as.factor(pp))
    Reference
Prediction    0    1
         0 1063  860
         1  567 1019
A questão é como obter o modelo e como salvar a classificação em um arquivo para começar.
Arquivos anexados:
xxx.zip  482 kb
[Excluído]  
Aleksey Vyazmikin:

Eu tentei em outra amostra - aqui


A questão é como obter o modelo e como salvar a classificação em um arquivo para começar.

catbust tem uma regularização bastante forte, além disso, se as características são categóricas, elas devem ser declaradas como tal no impulso

 
Maxim Dmitrievsky:

catbust tem uma regularização bastante forte, especialmente se as características são categóricas, você deve declará-las como tal no impulso

Para os binários, não importa se eles são categóricos ou não.

Você poderia tentar reduzir a regularização - boa idéia - obrigado.

Até agora, a Lasso tem mostrado melhores resultados em parte da amostra de exame.

[Excluído]  
Maxim Dmitrievsky:

Ou seja, marcar as negociações em alguma forma de onda com um período de 5 ou a diferença de preço e ver o que acontece

os sinais também serão suavizados durante o treinamento


tente da mesma forma. Tenho-o bem no testador personalizado, tenho um problema ao exportar o modelo, vou procurar o erro mais tarde.

 
Aleksey Vyazmikin:

Para os binários não importa se eles são categóricos ou não.

Você poderia tentar reduzir a regularização - boa idéia - obrigado.

Até agora, a Lasso tem tido um melhor desempenho na parte do exame da amostra.

Talvez seja apenas um pedaço da amostra do exame. E você faz um ajuste para ele, escolhendo o modelo com os melhores parâmetros para ele.

Agora eu sempre faço a validação cruzada (ou validação com valving-forward), não há ajuste para uma pequena porção, mas para todos os dados ao mesmo tempo, eu acho que esta é a melhor opção de treinamento.
Doc também é aconselhado a usá-lo antes de desaparecer do fórum.