交易中的机器学习：理论、模型、实践和算法交易

СанСаныч Фоменко 2016.10.29 15:12 #1851

尤里-雷舍托夫。

因为它是冷冻的。

我很抱歉，但问题和答案是一样的。

我不理解这种幽默，因为为了做出决定，分类器的输出值应该与某些东西进行比较，例如，与一个阈值进行比较。而且，由于在你的问题表述中，由于某种原因，可比较的数值是未知的，只有那些分类不需要的数值是已知的，因此，最好是做出澄清。

逝者如斯夫。

Alexey Burnakov 2016.10.29 15:51 #1852

我已经完成了我的多日计算（关于外汇的6个选定预测器（共114个） 的模型）。

这里是标题图片。在测试箱上被选为最佳模型（通过相同的衡量标准）的验证上的回归精度分布（按L1规范计算：绝对误差值之和）。

每个盒子里有99个值，每个值都是在一个独特的验证样本上的公制1-sum(abs(X-Y))/sum(abs(X-mean(X))。类似于R^2，我明白了，是的。

获得的总数是8908个模型...对于所研究的所有工具和目标。

平均误差减少0.2%（仅）。但它的意义在于...每个模型都产生了一个独特的验证样本。

我想发表的所有研究报告。还有进一步的模型MO的估计，等等，都是合乎逻辑的结局。如果我发表文章（不是在MQL上），我会给一些在这里交流的人一个链接，或者我把它贴在我的个人资料中。

那里也是如此。从实用的角度来看，这是一幅更有趣的画面。模型在测试块（交叉验证内）的数学期望值与验证的关系。

这里我们必须立即检查正相关是否显著（因为负相关根本无法合理解释），以及验证时是否有MPO的正值。嗯，你可以自己看。

这99个点是模型。

toxic 2016.10.29 17:50 #1853

Dr.Trader:

这就是一个很好的例子，说明为什么99%的天真交易者都会输，如果你移动窗口，这个混杂的点也会随机变形，所以这只是噪音，MO在这里没有帮助。

Vizard_ 2016.10.29 20:19 #1854

它将是伟大的，如果你也给它一个滴答声...脑电波)))

revers45 2016.10.29 21:15 #1855

我没有。
这就是一个很好的典型例子，说明为什么99%的天真交易者都会失败...

这条线是一个很好的、明确的例子，机器学习在交易中，只是一个理论。

Yury Reshetov 2016.10.29 21:40 #1856

不完整 的。
而这个分支是一个很好的、明确的例子，说明机器学习在交易中，只是一个理论。

如果你仔细看一下这个话题，这里的居民分为三个阵营。

R用户（在此称为 "寄生虫"）。他们类似于某种破坏性的教派。一直以来，他们都在一些包里打探消息，今天搞分类，明天搞回归，第二天搞一些聚类，如此循环下去。这种活动似乎很急躁，但却没有用，因为无论他们从事什么，他们做的每件事都不正确，都是歪打正着，因为这样他们才不会成功。这表现在他们的抱怨中，例如：关于命运、再培训的 "问题"、嘈杂的预测者和各种不承认R的 "激进分子和坏人"，如雷舍托夫。
那些不使用R的人。这样的人，通常都选择了一个特定的方向，他们擅长的地方。他们不抱怨命运，不以各种方法翻找，即不乱扔东西。他们从事的是有效的工作，并在自己选择的方向上一点一点地提高自己。
那些掉在门口的人。有时他们会插入自己的意见，但往往是不合时宜的。

Dr. Trader 2016.10.29 22:34 #1857

阿列克谢-伯纳科夫。

我已经完成了许多天的计算工作。

我关注你的研究，信息量很大，谢谢你的发布。但在我看来，虽然你成功地解决了这样复杂的问题，但你错过了准备工作，这就破坏了结果。也就是说，你忽略了对预测因素的选择。

你拿了114个预测因子，然后不知不觉地选择了6个，训练完模型后，你可以得出哪个目标更好的结论。但这个获得的结果只是一个局部最大值。你可以说不是全球范围内的 "金牛座在预测未来16个柱子方面更好"，而只是说 "一组114个预测器。(pre1, pre2, pre3,...)使用gbm最好的预测价格方向通过16条"。

如果你用神经元代替gbm，你会得到一个不同的最佳目标。如果你使用其他114个预测器，最佳目标又会有所不同。你的114个预测因子是如此重要的基础，整个实验的进一步发展过程都取决于它，而你只是从天花板上取下它们，没有任何准备。

大约半年前，SanSanych发布了一个包含他的预测器的文件。它们的特殊性在于，大多数模型都有一个小的误差，而且这个误差不会因为新的数据而增加。你可以在任何片段上训练模型，并在剩余的数据上运行os测试，看到没有任何退化。预测因素和目标是如此相关，以至于模型在任何条上都能找到它们之间唯一可能的关系。
我正试图复制这一点。我使用了一万多个初始预测器（来自mt5的不同参数和滞后期的指标），并学会选择它们与目标栏的唯一可能联系。我建议你做同样的实验，因为我相信确定或找到这种相关的预测者和目标的能力是通往圣杯的真正指针。

在MQL5中，最近有一个专家顾问生成器，当您选择一个必要的指标列表时，就会立即创建一个带有代码的专家顾问，而且很容易通过遗传学进行优化。在这样一个专家顾问中，有20个指标，根本没有机器学习模型（我们所拥有的只是分配给每个指标的重要性系数）。
我只是为遗传学健身函数添加了我的自定义代码，并包括一些标准，使目标和指标在我看来被认为是密切相关。结果是这样的。
(eurusd h1)

前2/3是回测（样本），后1/3是前测（OS）。之后的2/3时间并没有耗尽，但天平被重置为最初的天平，以便进行OOS测试。有了这么差的特征集，再简单地加上 "粗糙的、未完成的预测器和目标依赖性标准"，结果虽然不好，但也不失为一种损失。51%的成功交易是在OOXX上进行的。这不是很好吗？但我们可以使用20000个指标，而不是20个，并添加一些机器学习模型，取消mt5基因的10000次迭代限制，我们甚至会有一个盈利的专家顾问。

toxic 2016.10.30 00:06 #1858

逆转45。
这条线是一个很好的、明确的例子，机器学习在交易中，只是理论而已。

交易中的理论原则上是不能存在的，或者说理论是不能赚钱的，一个有效的市场等，一切都要考虑到价格，交换机制...但是统计学和机器学习，由于不同的数学包和库，最近变得更容易获得，让你真正看到 为什么 标准的TA如此悲伤，不是科学家，而是简单的交易者，花一个星期在R-工作室或Matlab。

如果在交易中的做法是 "只有理论"，这部分是正确的，那么TA甚至不是一个理论，而是胡说八道，就像占星术或巫术。

但这里的许多人知道，仍然有可能赚钱，一个有效的市场不仅仅是由上帝的意志决定的，而是因为有些人在获取和处理信息方面比大多数人要好。在我看来，对交易者来说，最重要的障碍是这种类型的业务的简单性的错觉，就像官方将支付他的签名，在这个论坛上，他们已经多次听到类似 "你不需要创建一个强子对撞机来交易"...

但事实证明，你做....

Alexey Burnakov 2016.10.30 00:48 #1859

Dr.Trader:

我关注你的研究，信息量很大，谢谢你的发布。但在我看来，虽然你成功地解决了这样复杂的问题，但你错过了准备工作，这就破坏了结果。也就是说，你忽略了对预测因素的选择。

你拿了114个预测因子，然后不知不觉地选择了6个，训练完模型后，你可以得出哪个目标更好的结论。但这个获得的结果只是一个局部最大值。你可以说不是全球范围内的 "金牛座在预测未来16个柱子方面更好"，而只是说 "一组114个预测器。(pre1, pre2, pre3,...)使用gbm最好的预测价格方向通过16条"。

如果你用神经元代替gbm，你会得到一个不同的最佳目标。如果你使用其他114个预测器，最佳目标又会有所不同。你的114个预测因子是如此重要的基础，整个实验的进一步发展过程都取决于它，而你只是从天花板上取下它们，没有任何准备。

大约半年前，SanSanych发布了一个包含他的预测器的文件。他们的特点是，大多数模型在鼗上有一个小的误差，同时，误差在新的数据上不会增长。你可以在任何片段上训练模型，并在剩余的数据上运行os测试，看到没有任何退化。它的预测因素和目标是如此相关，以至于模型在任何条形上都能找到它们之间唯一可能的关系。
我正试图复制这一点。我使用一万多个初始预测器（来自mt5的不同参数和滞后期的指标），并学会选择它们，使它们与目标栏有唯一可能的联系。我建议你做同样的实验，因为我相信确定或找到这种相关的预测者和目标的能力是通往圣杯的真正指针。

在MQL5中，最近有一个专家顾问生成器，当您选择一个必要的指标列表时，就会立即创建一个带有代码的专家顾问，而且很容易通过遗传学进行优化。在这样一个专家顾问中，有20个指标，根本没有机器学习模型（我们所拥有的只是分配给每个指标的重要性系数）。
我只是为遗传学健身函数添加了我的自定义代码，并包括一些标准，使目标和指标在我看来被认为是密切相关。结果是这样的。
(eurusd h1)

前2/3是回测（样本），后1/3是前测（OS）。2/3的时间后，没有排水，但余额被重置为最初的一个OOS测试。有了这样一套糟糕的选择，再简单地加上 "粗糙的、未完成的预测者和目标依赖的标准"，结果虽然不好，但也不失为一种损失。51%的成功交易是在OOXX上进行的。这不是很好吗？但我们可以不使用20个指标，而是使用20000个指标，并添加一个机器学习模型，并从mt5遗传学中删除10000次迭代的限制，我们甚至可以得到一个盈利的专家顾问。

当然，这是一个地方性的结果。没有多样化的机会。没有时间。没有资源...这正是GBM在我的预测器上给出的结果。

问题是不要用过度训练的部分经验来得出结论。而如果这个局部结果被成功验证，我就会很满意。

在这里，回归的质量得到了成功的验证。训练过的模型给出了不同于零的有意义的预测质量。没有任何模型选择问题。

而且随着交易的进行，情况会更加复杂。我还没有展示所有的东西...有一些子样本（符号-目标）在验证时给出了大于零的中位数MO...但任务是采取与验证相关的模式的尾部，以提高MO。但这也可能是一个案例...

最后将组建一个委员会，由未来的另一个样本进行验证。当然是通过蒙特卡洛。

至于预测者，也是很棘手的......说来话长...但问题是，符号-目标子样本的99个模型中的每一个都使用了它自己独特的6个预测因子集。组合的结果是有很好的各种模型（加上它们从不同的数据中学习）。一般来说，114的每一个地方都有参与。

还有，请不要忘记乐观的模型选择。所以我不明白你是如何选择照片的？通过对IS或OS的最佳结果？就是这样一个问题。但许多 "研究 "结果表明，这个问题没有答案。

polpolpol 2016.10.30 03:36 #1860

建议在哪里可以得到一个EA（机器人），在给定的时间打开交易，然后在给定的时间关闭交易。

例如，在12:59开仓，在13:59平仓，不管结果如何--盈利或亏损都一样。

交易中的机器学习：理论、模型、实践和算法交易 - 页 186