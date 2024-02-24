交易中的机器学习：理论、模型、实践和算法交易 - 页 2380

Aleksey Vyazmikin:

我误以为是关于专栏的。

但是，我们不能在样本文件上做所有的训练，而在另一个文件上做检查吗？

阿列克谢，你可以做到这一切！！！。

但我不感兴趣。

学习R！这是一门迷人的语言，尤其是对盘子里的东西。
 
mytarmailS:

阿列克谢，一切皆有可能!

但我不感兴趣。

学习R！这是一门迷人的语言，尤其是对盘子里的东西。

谢谢你的帮助。

准确性（Precision）和完整性（Recall）都明显优于CatBoost

我把所有的样本合并成一个文件。

那么，我们还能朝这个方向思考吗？

 
Aleksey Vyazmikin:

谢谢你的帮助。

准确性（Precision）和完整性（Recall）都明显优于CatBoost

我把所有的样本合并成一个文件。

那么，我们还能朝这个方向思考吗？

是在新数据上还是在训练数据上更好？

哪些数字既在那里又在那里？

 
elibrarius:

是在新数据上还是在训练数据上更好？

这两方面的数据是什么？

唉，我错了，准确性更差，而不是更好。



然而，这是一个困难的样本--我不能正确地训练它--明天我将尝试另一个，从CatBoost'a转出的好模型。好吧，在模型的参数中，我不明白，所以也许比较不是很公平。

以这个模型的大召回率为代价，有可能使单独的预测器一般。但我不知道如何把它上传到一个文件里 :)

 
Maxim Dmitrievsky:

这是一个如此矛盾的情况，即使你不小心做对了，也没有人欣赏它。

因为没有评价标准 )

不，我根本不需要赞赏和承认--因为那样他们肯定不会下车）。

相反，我把它当作某种练习或难题，当试图在任何论坛的想法中找到常识时)

在这种特殊情况下，如果使用逻辑 回归进行分类，似乎相当适用。

 

在一个不同的样本上试了一下--附后


X <- read.csv2("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                            "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:14112 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,3528)
pp <- tail(pred2 ,3528)
caret::confusionMatrix(as.factor(yy),as.factor(pp))
    Reference
Prediction    0    1
         0 1063  860
         1  567 1019
问题是如何获得该模型，以及如何将分类保存到文件中开始。
Aleksey Vyazmikin:

我在另一个样本上试了一下 - 这里


问题是如何获得该模型，以及如何将分类保存到文件中开始。

catbust有相当强的正则化，此外，如果特征是分类的，它们应该在boost中被声明为分类的。

 
Maxim Dmitrievsky:

catbust有一个相当强的正则化，特别是如果特征是分类的，你应该在提升中声明它们是分类的。

对于二进制的，是否是分类的并不重要。

你可以尝试减少正则化 - 好主意 - 谢谢。

到目前为止，Lasso在样本的考试部分显示出更好的结果。

Maxim Dmitrievsky:

即在一些周期为5 或价格差异的波形 上标记出交易，看看会发生什么。

训练期间，标志也将被抹平


试着用同样的方法。我在自定义测试器中得到了很好的效果，我在导出模型时遇到了一个问题，我稍后会寻找错误的原因。

 
Aleksey Vyazmikin:

对于二元的来说，它们是否是分类的并不重要。

你可以尝试减少正则化 - 好主意 - 谢谢。

到目前为止，Lasso在 样本的考试部分 表现更好。

也许这只是考试样本中的一个幸运块。然后你对它进行拟合，挑选出具有最佳参数的模型。

我现在总是交叉验证（或用valving-forward验证），没有对一小部分进行拟合，而是一次性对所有数据进行拟合，我想这是最好的训练选择。
医生也建议在从论坛上消失之前使用。

