交易中的机器学习:理论、模型、实践和算法交易 - 页 2378

 
mytarmailS:

我不知道你在那里写什么,怎么写的,但是我需要知道,在相对于样本的未来一步的目标中,到底是不是这样的?

这是令人费解的原因,在目标集上决定了当前行的预测者的结果。也就是说,没有什么需要转移的。

 
Aleksey Vyazmikin:

复杂的原因是,在目标中,当前行预测器的决策结果是在目标中。也就是说,不需要转移任何东西。

简而言之,一切都如你所愿,即使是调音。

Accuracy : 0.535  
X <- read.csv2("C:\\Users\\....\\Desktop\\test.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                      "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:1300 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,200)
pp <- tail(pred2 ,200)
caret::confusionMatrix(as.factor(yy),as.factor(pp))

扔掉它,忘记它。


"Target_P"

给出0.97的准确率

 
你会教人退步到1和0吗?
 
Maxim Dmitrievsky:
你会教人退步到1和0吗?

那么?

 
Почему линейная регрессия не подходит для классификации
  • www.machinelearningmastery.ru
  • www.machinelearningmastery.ru
Статьи, вопросы и ответы на тему: машинное обучение, нейронные сети, искусственный интеллект
 
然而,我不会阻止你去啃国防部的花岗岩 )
 
mytarmailS:

我做了你想要的一切,甚至是调音。

扔掉它,忘记它。


得到0.97个阿库拉西。

到目前为止,我什么都没有 :)已经要求20多个图书馆,我继续,但这还不够:)

这句话是什么意思。

tr <- 1:1300 #  train idx

?

 
Maxim Dmitrievsky:
你会教人退步到1和0吗?

这是一个有经验的人所表达的想法--我认为检查一下没有问题。

 
mytarmailS:

我在一个训练样本上得到了这个结果。

          Reference
Prediction  0  1
         0 83 59
         1 17 41
                                          
               Accuracy : 0.62            
                 95% CI : (0.5489, 0.6875)
    No Information Rate : 0.5             
    P-Value [Acc > NIR] : 0.0004225       
                                          
                  Kappa : 0.24            
                                          
 Mcnemar's Test P-Value : 2.563e-06       
                                          
            Sensitivity : 0.8300          
            Specificity : 0.4100          
         Pos Pred Value : 0.5845          
         Neg Pred Value : 0.7069          
             Prevalence : 0.5000          
         Detection Rate : 0.4150          
   Detection Prevalence : 0.7100          
      Balanced Accuracy : 0.6200          
                                          
       'Positive' Class : 0               
                                          

我如何将该模型应用于另一个样本/文件?

还有,如果我在训练文件中有4683行,而这里有83+59+17+41,为什么或然率表中的数字这么少?

我明白了,你提交了前200行--对吗?

yy <- tail(Y[-tr] ,200)
pp <- tail(pred2 ,200)

但他们应该是参加了培训。

 
Aleksey Vyazmikin:

哦,谢谢你!

现在让我们试着运行它 :)

无法安装glmnet包--通过R-Studio在软件库中找不到它 :(

该怎么做?

> install.packages("glmnet")
Installing package into ‘C:/Users/User/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
пробую URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/glmnet_4.1-1.zip'
Content type 'application/zip' length 2254744 bytes (2.2 MB)
downloaded 2.2 MB

package ‘glmnet’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in
        C:\Users\User\AppData\Local\Temp\RtmpsbZ5ec\downloaded_packages

正确安装

原因: