交易中的机器学习：理论、模型、实践和算法交易

Mikhail Mishanin 2022.10.28 07:55 #28041

https://habr.com/ru/post/695276/ 可能对某些人有用/有趣

2022.10.27
habr.com

Любой, кто хоть раз обучал нейронки, знает, что принято на каждой эпохе шаффлить датасет, чтобы не повторялся порядок батчей. А зачем это делать? Обычно это объясняют тем, что шаффлинг улучшает генерализацию сетей, делает точнее эстимейт градиента на батчах и уменьшает вероятность застревания SGD в локальных минимумах. Здесь можно посмотреть...

[删除] 2022.10.28 08:10 #28042

有时，将平衡图（蓝色）叠加到价格图（橙色）上也很有用

例如，在这种情况下，可以清楚地看到，该模型 10 年来一直只在市场下跌时获利

更完善的模型同样学会了主要在下跌时获利，但在上涨和盘整时获利较少。由于 10 年来市场一直在下跌，因此训练样本是有偏差的

Aleksey Vyazmikin 2022.10.28 08:52 #28043

elibrarius #:

你确定它是随机选择先验的？我不是在 "猫扑"，我是在看基本 "猫扑 "示例的代码。那里使用了所有的预测因子。也就是说，取最好的一个。与之相关的预测因子会紧随其后，但稍差一些。但在其他一些分层或修正树中，另一个相关预测因子可能会更好。

有一个单独的参数允许只提取部分预测因子进行估算--它是随机提取的--这会增加模型树的数量，但理论上会加快训练速度。

如果我解析了他们的代码，我就能确定了，所以我只谈他们声明的内容--我有可能误解了开发人员的意思。

因此，他们所说的是在分割评估中加入随机化，通过这样做，他们提高了学习效率。

预处理可以消除相关的预测因子--我还没听说过。

我同意另一个预测因子可能更好或更有用，但我的目标是训练尽可能多的不同模型。我希望它们能学到东西。

Aleksey Vyazmikin 2022.10.28 08:55 #28044

Maxim Dmitrievsky #:
那就抛出几个有参考价值的公式让我测试一下。

我不明白，我应该把它扔给你还是扔给数据集？如果是数据集，那么它与分组相似性或相关性有什么关系，因为目标并不参与这一过程？

[删除] 2022.10.28 08:59 #28045

Aleksey Vyazmikin #:

我不明白，我应该把它扔给你还是扔给数据集？如果是数据集，这与相似性分组或相关性有什么关系，因为目标并不参与这一过程？

用 python 和 mql 计算好的 fiches 重现公式。我自己去取标签。

只是看看，因为我只用增量。

我可以在培训后为它们上传机器人。

Aleksey Vyazmikin 2022.10.28 09:04 #28046

Maxim Dmitrievsky #:

有时，在价格图表（橙色）上叠加平衡图表（蓝色）也很有用

例如，在这种情况下，可以清楚地看到，该模型 10 年来一直只在下跌的市场中盈利

更完善的模型同样学会了主要在下跌时获利，但在上涨和盘整时获利较少。由于 10 年来市场一直在下跌，因此训练样本是有偏差的

价格是建立在收盘价和开盘价之间的差额原则上，还是某种时间配比？

[删除] 2022.10.28 09:08 #28047

Aleksey Vyazmikin #:

价格是建立在平仓和开仓之间的三角洲原则上，还是某种时间配给？

是的，在交易时是固定的

Aleksey Vyazmikin 2022.10.28 09:13 #28048

Maxim Dmitrievsky #:

在 python 和 mql 中复制计算好芯片的公式。我会自己去取标签。

只是看看，因为我只用增量。

训练完成后，我可以上传机器人。

要知道，特征的 "好坏 "取决于其目标。

我在前面介绍过创建原理。MQL5 中的代码都在 MQL5 中，不存在任何通过函数转换的问题--不可能给出一个公式。

例如，经常选择当前区段的开始时间 ZZ(48)。

[删除] 2022.10.28 09:15 #28049

Aleksey Vyazmikin #:

要知道，特征的 "好坏 "是由目标决定的。

我在前面已经描述了创建原则。MQL5 中的代码都在 MQL5 中，不存在任何通过函数转换的问题--不可能给出一个公式。

例如，经常选择当前区段的开始时间 ZZ(48)。

嗯，主要是标准指标及其导数？

Aleksey Vyazmikin 2022.10.28 09:17 #28050

Maxim Dmitrievsky #:

是，交易时间固定

尝试对买入和卖出进行加价，选择一个投入数量较为均衡的模型，然后将样本一分为二，分别制作两个模型。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2805