交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2023.04.12 13:47 #30231

Maxim Dmitrievsky #:

我建议用 python 制作这顶帽子，用 kolab 制作一棵可选择树叶的树，您可以将数据集放入其中

如果您有任何更好/更坏的建议，或只选取最好的数据或通过某些过滤的规则，请提出建议。

我想通过两种方法对一个数据集进行比较。这样我们就会明白什么是好的了:)

有趣的想法！

首先，我们需要了解哪种树的实现方式可以轻松提取树叶的规则，以便进一步处理。

然后是构建树的方式--贪婪还是遗传。我检查了所有种群的树叶（如果我没弄错的话:)

当然，您也可以使用森林树来代替基因树，但这样您就需要更多的树来搜索树叶，而且您需要根据树叶中的例子占整个样本的百分比来剪枝。森林树可能比基因树更快，而且它们的设置显然会更少。

生成新叶子的过程应该一直进行，直到达到所需的（指定的）选定叶子数量。

在这种情况下，在构建森林树之前，有必要确保生成两种类型的随机子样本--第一种是从指定大小的连续均匀区间中选取 N 部分作为训练样本的百分比，第二种是完全随机获得的子样本。

用于构建预测树的随机预测因子集。

关于所有数据的预处理--需要多加考虑。

评估树叶的标准--也可以稍后添加，但要点是指标有一个设定的阈值。我不知道你用的是什么指标，也不记得我用的是什么--我需要解析代码。您可以使用平衡、期望矩阵和恢复因子。

估算应在整个训练样本的每个区间进行，区间数已设定。如果在任何一次间隔中都没有达到所需的标准，那么该叶就会被归档或丢弃。我保留了一个树叶数据库，删除了重复的树叶，以免再次检查。

选择树叶后，应该按照相似性对它们进行分组，也许等级相关性可以正确地做到这一点。然后在组内分配权重，并决定各组的投票规则。不过，也许这已经很多了，至少值得学习一下如何选择树叶，以便对新数据有效。

我不太确定你想在哪个样本上做实验--是我给出的样本还是随机创建的样本？

无论如何，要比较各种方法，样本应该是相同的，而且时间间隔要大，这样即使不考虑周期性，也能考虑到大 TF 上不同市场阶段的趋势。

我想说的是，我使用的方法非常慢。也许最好在 MQL5 中进行叶片评估 - 这样可以分散核心的负载。

[删除] 2023.04.12 13:59 #30232

Aleksey Vyazmikin #:

有趣的想法

我先在一棵树上画一个简单的示例，然后立即进行测试，再根据需要进行扩展

在任何数据集上，您都可以通过谷歌光盘下载并测试，无需安装任何东西。

我希望它能快速工作 )

Aleksey Vyazmikin 2023.04.12 14:11 #30233

Maxim Dmitrievsky #:

我先在一棵树上画一个简单的示例，以便一次性测试，然后再根据需要进行扩展

在任何数据集上，通过谷歌光盘，您都可以下载它并在那里进行测试，而无需安装任何东西。

我希望它能快速工作 )

很好--最重要的是开始！:)

СанСаныч Фоменко 2023.04.12 15:43 #30234

Maxim Dmitrievsky #:

这已经不好玩了。

这和 "有趣 "有什么关系？

到底有没有样本外？

[删除] 2023.04.12 16:01 #30235

СанСаныч Фоменко #:

这和 "有趣 "有什么关系？

到底有没有样本外？

如果我发现

СанСаныч Фоменко 2023.04.12 16:27 #30236

Maxim Dmitrievsky #:

如果我发现

没有 "如果"。这是一个判断标准。任何没有样本外估计值的估计都是没有意义的。

Valeriy Yastremskiy 2023.04.12 16:33 #30237

Maxim Dmitrievsky #:

如果我发现

绘制十期 OOS 前向和后向图。

[删除] 2023.04.12 16:50 #30238

СанСаныч Фоменко #:

这与 "如果 "无关。这是一个判断标准。没有样本外评估的任何评估都是没有意义的。

好了，笑够了吧

[删除] 2023.04.12 17:05 #30239

Valeriy Yastremskiy #:

绘制一张 10 个周期的 OOS 前向和后向图。

即 100 年

СанСаныч Фоменко 2023.04.12 17:09 #30240

Maxim Dmitrievsky #:
笑够了吧

你是在跟埃及人说话，还是在跟我说话？

我注意到，我对你在这个话题上的表现非常满意。

交易中的机器学习：理论、模型、实践和算法交易 - 页 3024