交易中的机器学习：理论、模型、实践和算法交易

Andrey Dik 2024.01.11 20:14 #33831

Aleksey Nikolayev #:
您知道 mql5 中 CPU 上的并行计算机制是什么？

OpenCL 或多或少比较先进。

对于较低级的情况--在单独的图表上运行代理。每个图表都有单独的线程，总共将使用所有 CPU 内核。

此外，终端代理本身也可用于并行处理终端图表上的应用程序计算，但这并不为很多人所知。

在本文中，我将向您展示如何在 MQL5 中编写一个二进制 GA，以无限小的参数步长覆盖双数的所有有效数字（事实上，双数的小数位数仅限于 16 位）。甚至这还不是极限，您还可以在 MQL5 中编写标准数字类型的扩展。

Aleksey Nikolayev 2024.01.11 21:11 #33832

Andrey Dik #:

OpenCL 或多或少适合高级用户。

对于不那么高级的用户--在单独的图表上运行代理。每个图表在一个单独的线程中运行，总共将使用所有处理器内核。

此外，终端代理本身也可用于并行处理终端图表上的应用程序计算，但这一点并不为很多人所知。

在本文中，我将向您展示如何在 MQL5 中编写一个二进制 GA，以无限小的参数步长覆盖双数的所有有效数字（事实上，双数的小数位数仅限于 16 位）。甚至这还不是极限，您还可以在 MQL5 中编写标准数字类型的扩展。

这就是我要说的--你会得到一辆抽筋很多的自行车。

OpenCL 是如此优秀，以至于 metaquotes 没有在其上编写 GPU 优化器，可能只是因为我们任何人都可以轻松编写自己的优化器。

好了，我不说了，否则我要是把对你蛊惑人心的看法都说出来，就会像马克西姆一样被禁言。

Andrey Dik 2024.01.11 21:20 #33833

Aleksey Nikolayev #:

这就是我要说的--这将是一辆相当糟糕的自行车。

OpenCL 如此优秀，以至于 metaquotes 没有在它的基础上编写 GPU 优化器，可能只是因为我们任何人都可以轻松编写自己的优化器。

好了，我不说了，否则我要是把对你蛊惑人心的看法都说出来，就会像马克西姆一样被禁言。

那么到底是什么问题呢？如果您在使用 MQL5 时遇到问题，这并不是语言的错，我们为那些提出问题的人提供了专门的资料主题。

我的 "蛊惑 "是什么？应您的要求，我给您提供了大量文献，供您阅读，拓展您的视野，我告诉您并向您展示 MQL5 的具体实现和搜索策略。你还需要我做什么，才不会让我脸上挂着泔水，让你害怕被禁言？

我对人们感到非常惊讶。

mytarmailS 2024.01.15 18:54 #33834

关于渲染 forrest 的冗余的一点说明

获取虹膜数据集 + 训练 forrest + 从 forrest 中提取规则 + 创建数据集，其中每个规则都是一个特征。

我们会得到一个列有规则的矩阵（约 700 条）。

X <- iris[,-5]
target <- iris[,"Species"] 

library(inTrees)
library(RRF)

rules_dataset <- target |> 
                  RRF(x = X) |> 
                  RF2List() |> 
                  extractRules(X = X) |> 
                  sapply(\(r) eval(str2expression(r)))

ncol(rules_dataset)
[1] 698

现在找出所有线性相关的规则，并将其作为冗余规则删除。

remove_lin_comb <- caret::findLinearCombos(rules_dataset)$remove
clear_rules_dataset <- rules_dataset[, -remove_lin_comb]

得到

ncol(clear_rules_dataset)
[1] 32

整个数据集可以用 32 条规则来描述，而不是 698 条。

就是这样...

福雷斯特的冗余度是 698/32 = 21.8125 倍。

СанСаныч Фоменко 2024.01.16 17:29 #33835

mytarmailS #:

关于 "随机福雷斯特 "的冗余问题

获取虹膜数据集 + 训练森林 + 从森林中提取规则 + 创建数据集，其中每个规则都是一个特征。

得到一个列有规则的矩阵（约 700 条）

现在，找出所有线性相关的规则，并将其作为冗余规则删除。

得到

整个数据集可以用 32 条规则来描述，而不是 698 条。

就是这样。

福雷斯特的冗余度是 698/32 = 21.8125 倍。

规则从何而来？没错：输入的信息堆积如山，压缩后得到规则，然后利用规则进行预测，而不是原始信息。这就是它被称为模型的原因。

mytarmailS 2024.01.16 18:18 #33836

СанСаныч Фоменко #:

规则从何而来？没错：输入端堆积如山的信息，压缩后得到规则，然后利用规则进行预测，而不是原始信息。这就是它被称为模型的原因。

请仔细阅读原文

[删除] 2024.01.19 05:15 #33837

mytarmailS #:

你不是想写一篇关于规则的文章吗？这也许是个有趣的话题，比最小化测试功能更有趣。还是你对 OOS 的验证有问题？或者没有问题，只是你懒得写而已。

[删除] 2024.01.19 09:42 #33838

规则选择的一般方法。比如在 TC 的背景下，把树分解成规则，然后......。最佳实践和见解。这将会很有趣。

但不是随机函数和随机狼，而是更接近利润。

СанСаныч Фоменко 2024.01.19 10:19 #33839

Maxim Dmitrievsky #:
规则选择的一般方法。比如在 TC 的背景下，把树分解成规则，然后......。最佳实践和见解。我很好奇。

只是不是随机函数和随机狼，而是更接近利润。

"更接近利润 "不就是 "过度训练 "的同义词吗？
我们在随机利润上获得了很好的平衡，因为基础是随机增量值。平衡之美又从何而来？

平衡是对终端 TS 的评估，而这种平衡不仅受分类误差的影响。

但如果我们保持在 MOE 范围内，那么估值就不是轮廓了。

[删除] 2024.01.19 10:39 #33840

СанСаныч Фоменко #:

"更接近利润 "不就是 "过度训练 "的同义词吗？
我们在随机利润上得到了一个美丽的平衡，因为基础是一个随机的增量值。平衡之美从何而来？

平衡是对终端 TS 的评估，而这种平衡不仅受分类误差的影响。

如果我们保持在 MO 范围内，那么评估就不是利润

更接近利润--更接近报价，而不是进行毫无意义的培训。互联网上有大量此类测试，不同 MO 的特殊性也早已为人所知。什么更糟糕，什么更好。

我只是不明白规则提取在层次结构中的位置。

交易中的机器学习：理论、模型、实践和算法交易 - 页 3384