交易中的机器学习:理论、模型、实践和算法交易 - 页 2805

 
https://habr.com/ru/post/695276/ 可能对某些人有用/有趣
Хитрые методики сэмплинга данных
Хитрые методики сэмплинга данных
  • 2022.10.27
  • habr.com
Любой, кто хоть раз обучал нейронки, знает, что принято на каждой эпохе шаффлить датасет, чтобы не повторялся порядок батчей. А зачем это делать? Обычно это объясняют тем, что шаффлинг улучшает генерализацию сетей, делает точнее эстимейт градиента на батчах и уменьшает вероятность застревания SGD в локальных минимумах. Здесь можно посмотреть...
 

有时,将平衡图(蓝色)叠加到价格图(橙色)上也很有用

例如,在这种情况下,可以清楚地看到,该模型 10 年来一直只在市场下跌时获利

更完善的模型同样学会了主要在下跌时获利,但在上涨和盘整时获利较少。由于 10 年来市场一直在下跌,因此训练样本是有偏差的


 
elibrarius #:

你确定它是随机选择先验的?我不是在 "猫扑",我是在看基本 "猫扑 "示例的代码。那里使用了所有的预测因子。也就是说,取最好的一个。与之相关的预测因子会紧随其后,但稍差一些。但在其他一些分层或修正树中,另一个相关预测因子可能会更好。

有一个单独的参数允许只提取部分预测因子进行估算--它是随机提取的--这会增加模型树的数量,但理论上会加快训练速度。

如果我解析了他们的代码,我就能确定了,所以我只谈他们声明的内容--我有可能误解了开发人员的意思。

因此,他们所说的是在分割评估中加入随机化,通过这样做,他们提高了学习效率。

预处理可以消除相关的预测因子--我还没听说过。

我同意另一个预测因子可能更好或更有用,但我的目标是训练尽可能多的不同模型。我希望它们能学到东西。

 
Maxim Dmitrievsky #:
那就抛出几个有参考价值的公式让我测试一下。

我不明白,我应该把它扔给你还是扔给数据集?如果是数据集,那么它与分组相似性或相关性有什么关系,因为目标并不参与这一过程?

 
Aleksey Vyazmikin #:

我不明白,我应该把它扔给你还是扔给数据集?如果是数据集,这与相似性分组或相关性有什么关系,因为目标并不参与这一过程?

用 python 和 mql 计算好的 fiches 重现公式。我自己去取标签。

只是看看,因为我只用增量。

我可以在培训后为它们上传机器人。
 
Maxim Dmitrievsky #:

有时,在价格图表(橙色)上叠加平衡图表(蓝色)也很有用

例如,在这种情况下,可以清楚地看到,该模型 10 年来一直只在下跌的市场中盈利

更完善的模型同样学会了主要在下跌时获利,但在上涨和盘整时获利较少。由于 10 年来市场一直在下跌,因此训练样本是有偏差的


价格是建立在收盘价和开盘价之间的差额原则上,还是某种时间配比?

 
Aleksey Vyazmikin #:

价格是建立在平仓和开仓之间的三角洲原则上,还是某种时间配给?

是的,在交易时是固定的

 
Maxim Dmitrievsky #:

在 python 和 mql 中复制计算好芯片的公式。我会自己去取标签。

只是看看,因为我只用增量。

训练完成后,我可以上传机器人。

要知道,特征的 "好坏 "取决于其目标。

我在前面介绍过创建原理。MQL5 中的代码都在 MQL5 中,不存在任何通过函数转换的问题--不可能给出一个公式。

例如,经常选择当前区段的开始时间 ZZ(48)。

 
Aleksey Vyazmikin #:

要知道,特征的 "好坏 "是由目标决定的。

我在前面已经描述了创建原则。MQL5 中的代码都在 MQL5 中,不存在任何通过函数转换的问题--不可能给出一个公式。

例如,经常选择当前区段的开始时间 ZZ(48)。

嗯,主要是标准指标及其导数?

 
Maxim Dmitrievsky #:

是,交易时间固定

尝试对买入和卖出进行加价,选择一个投入数量较为均衡的模型,然后将样本一分为二,分别制作两个模型。