交易中的机器学习:理论、模型、实践和算法交易 - 页 3384

 
Aleksey Nikolayev #:
您知道 mql5 中 CPU 上的并行计算机制是什么?

OpenCL 或多或少比较先进。

对于较低级的情况--在单独的图表上运行代理。每个图表都有单独的线程,总共将使用所有 CPU 内核。

此外,终端代理本身也可用于并行处理终端图表上的应用程序计算,但这并不为很多人所知。

在本文中,我将向您展示如何在 MQL5 中编写一个二进制 GA,以无限小的参数步长覆盖双数的所有有效数字(事实上,双数的小数位数仅限于 16 位)。甚至这还不是极限,您还可以在 MQL5 中编写标准数字类型的扩展。

 
Andrey Dik #:

OpenCL 或多或少适合高级用户。

对于不那么高级的用户--在单独的图表上运行代理。每个图表在一个单独的线程中运行,总共将使用所有处理器内核。

此外,终端代理本身也可用于并行处理终端图表上的应用程序计算,但这一点并不为很多人所知。

在本文中,我将向您展示如何在 MQL5 中编写一个二进制 GA,以无限小的参数步长覆盖双数的所有有效数字(事实上,双数的小数位数仅限于 16 位)。甚至这还不是极限,您还可以在 MQL5 中编写标准数字类型的扩展。

这就是我要说的--你会得到一辆抽筋很多的自行车。

OpenCL 是如此优秀,以至于 metaquotes 没有在其上编写 GPU 优化器,可能只是因为我们任何人都可以轻松编写自己的优化器。

好了,我不说了,否则我要是把对你蛊惑人心的看法都说出来,就会像马克西姆一样被禁言。

 
Aleksey Nikolayev #:

这就是我要说的--这将是一辆相当糟糕的自行车。

OpenCL 如此优秀,以至于 metaquotes 没有在它的基础上编写 GPU 优化器,可能只是因为我们任何人都可以轻松编写自己的优化器。

好了,我不说了,否则我要是把对你蛊惑人心的看法都说出来,就会像马克西姆一样被禁言。

那么到底是什么问题呢?如果您在使用 MQL5 时遇到问题,这并不是语言的错,我们为那些提出问题的人提供了专门的资料主题。

我的 "蛊惑 "是什么?应您的要求,我给您提供了大量文献,供您阅读,拓展您的视野,我告诉您并向您展示 MQL5 的具体实现和搜索策略。你还需要我做什么,才不会让我脸上挂着泔水,让你害怕被禁言?

我对人们感到非常惊讶。

 

关于渲染 forrest 的冗余的一点说明

获取虹膜数据集 + 训练 forrest + 从 forrest 中提取规则 + 创建数据集,其中每个规则都是一个特征。

我们会得到一个列有规则的矩阵(约 700 条)。

X <- iris[,-5]
target <- iris[,"Species"] 

library(inTrees)
library(RRF)

rules_dataset <- target |> 
                  RRF(x = X) |> 
                  RF2List() |> 
                  extractRules(X = X) |> 
                  sapply(\(r) eval(str2expression(r)))
ncol(rules_dataset)
[1] 698

现在找出所有线性相关的规则,并将其作为冗余规则删除。

remove_lin_comb <- caret::findLinearCombos(rules_dataset)$remove
clear_rules_dataset <- rules_dataset[, -remove_lin_comb]

得到

ncol(clear_rules_dataset)
[1] 32


整个数据集可以用 32 条规则来描述,而不是 698 条。


就是这样...

福雷斯特的 冗余度 698/32 = 21.8125 倍

 
mytarmailS #:

关于 "随机福雷斯特 "的冗余问题

获取虹膜数据集 + 训练森林 + 从森林中提取规则 + 创建数据集,其中每个规则都是一个特征。

得到一个列有规则的矩阵(约 700 条)

现在,找出所有线性相关的规则,并将其作为冗余规则删除。

得到


整个数据集可以用 32 条规则来描述,而不是 698 条。


就是这样。

福雷斯特的 冗余度 698/32 = 21.8125 倍

规则从何而来?没错:输入的信息堆积如山,压缩后得到规则,然后利用规则进行预测,而不是原始信息。这就是它被称为模型的原因。

 
СанСаныч Фоменко #:

规则从何而来?没错:输入端堆积如山的信息,压缩后得到规则,然后利用规则进行预测,而不是原始信息。这就是它被称为模型的原因。

请仔细阅读原文

 
mytarmailS #:
你不是想写一篇关于规则的文章吗?这也许是个有趣的话题,比最小化测试功能更有趣。还是你对 OOS 的验证有问题?或者没有问题,只是你懒得写而已。
 
规则选择的一般方法。比如在 TC 的背景下,把树分解成规则,然后......。最佳实践和见解。这将会很有趣。

但不是随机函数和随机狼,而是更接近利润。
 
Maxim Dmitrievsky #:
规则选择的一般方法。比如在 TC 的背景下,把树分解成规则,然后......。最佳实践和见解。我很好奇。

只是不是随机函数和随机狼,而是更接近利润。

"更接近利润 "不就是 "过度训练 "的同义词吗?
我们在随机利润上获得了很好的平衡,因为基础是随机增量值。平衡之美又从何而来?

平衡是对终端 TS 的评估,而这种平衡不仅受分类误差的影响。

但如果我们保持在 MOE 范围内,那么估值就不是轮廓了。

 
СанСаныч Фоменко #:

"更接近利润 "不就是 "过度训练 "的同义词吗?
我们在随机利润上得到了一个美丽的平衡,因为基础是一个随机的增量值。平衡之美从何而来?

平衡是对终端 TS 的评估,而这种平衡不仅受分类误差的影响。

如果我们保持在 MO 范围内,那么评估就不是利润

更接近利润--更接近报价,而不是进行毫无意义的培训。互联网上有大量此类测试,不同 MO 的特殊性也早已为人所知。什么更糟糕,什么更好。

我只是不明白规则提取在层次结构中的位置。
原因: