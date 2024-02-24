交易中的机器学习：理论、模型、实践和算法交易 - 页 1354

Yuriy Asaulenko:

保存档案。见附件。

Learn.csv - 输入。每一行中的第一个数字是历史的约束，它应该被删除。

Cell.scv - 目标。

对这一数据的训练应产生以下图表。

滤波器大约等于EMA(16)，预测 - 5分钟。

我将在以后需要时进行测试。

我不确定这个图是训练图还是测试图。

这是测试中的CatBoost--最后的100个数值。

偏差的柱状图。

我取了4000个用于训练，2000个用于验证，还有100行用于测试。我训练了1000棵深度为6的树，RMSE公式（用Poisson 代替）。

附上样本和设置，如果要播放，你需要下载CB并把它放在设置目录中。

在训练样本上，同样的分布并不像你的那样

新增： 模型的应用不正确--概率图变成了...

附加的文件：
Setup.zip  587 kb
 
阿列克谢-维亚兹米 金。

我的图表只对整个样本进行训练。这一次没有做测试。将与训练大致相同。
X轴图上的负值去了哪里？而X值的范围 与Y值不一样？怎么说呢？
我有一个比较预测值和实际值（目标）的图表。没有分配。
 
尤里-阿索连科
我的图表只对整个样本进行训练。我还没有做过这方面的测试。将与培训大致相同。
图中X轴上的负值在哪里？而X值的范围 与Y值不一样？怎么说呢？
我有一个比较预测值和实际值的图表。

是的，我以前没有做过回归，有很多不明显的适配函数，相对于分类来说，给出的结果不同，我取错了值。

这里是测试样本。

这是训练样本--4,000行。

测试样本的偏差柱状图

下面是3个样本的总体图。

用来训练测试样本的指标

他说，我们本可以在250次迭代时停止训练，模型被重新训练。

 
阿列克谢-维亚兹米 金。

似乎没有问题。在测试中，也是如此。虽然经过了重新培训）。
 
Yuriy Asaulenko:
看起来不错。

嗯，是的，如果你愿意，你可以改进它--我只是对回归模型 没有经验。

因此，主要的预测因素是工作工具 :)

我附上了带有设置的最终版本--它训练了10个具有不同种子的模型。

附加的文件：
Setup.zip  588 kb
 
阿列克谢-维亚兹米 金。

有一个按比例的价格系列作为输入。- 20个近似值，仅此而已。这不是关于预测器的问题，而是问题的表述--它是可以解决的。而你的森林会自己想出预测因素）。
 
尤里-阿索连科
是的，这与问题的陈述有关，我同意。只是，我不认为价格是塑造馅饼的面团，需要预测因素来塑造这些馅饼。

 
马克西姆-德米特里耶夫斯基

可以改善一个模型的经典技术之一。或者说，找到最佳的一个。蒙特卡洛的原始应用。

https://en.wikipedia.org/wiki/Importance_sampling

你在你的文章中没有应用这种方法吗？

 
马克西姆-德米特里耶夫斯基

对于非政策性（政策梯度）RL

https://medium.com/@jonathan_hui/rl-importance-sampling-ebfb28b4a8c6

你能用俄语，用你自己的话解释一下这个想法吗？可以这么说，是用英语）。

 
尤里-阿索连科

我们对LPF滤波器的预测相当成功。即使现在我们两个人，甚至不只是NS，而是森林。现在让我们试着预测价格，这完全是一个毫无意义的练习）。我们宁可预测价格预期变化的低频部分，而这（预期）目前是未知的。而在这里，在各种运动的背景下，高频震荡和其他一切。

所以我们得到了以下结果：预测时间是1米TF上的5米。

像往常一样：X是预测值，Y是实际值。好吧，倾斜45度，它看起来像一个长方形，谢谢你没有成为一个圆。如果你在x上向零的右边-左边移动一点，你甚至可以玩到50%多一点的概率（见区域）。

当然，如果能建立各种回归线和分布就更好了，但有必要做切片，至少要做几片--这是后话。

PS 好吧，还有一个使用稍加修改的算法的预测。同样的5分钟在时间框架1米。

已经好多了）。从预测>2和<-2的х开始，如果我们简单地在5分钟内关闭，几乎不会出现亏损的交易。

第二张照片真的很好!算法的哪些变化使之成为可能？
