交易中的机器学习：理论、模型、实践和算法交易

СанСаныч Фоменко 2018.01.17 14:30 #5831

马克西姆-德米特里耶夫斯基。

你甚至不知道如何确定RF中预测因子的重要性，只给出了一些关于退火 之类的废话，却没有任何解释（这有什么关系？）

谁说过哪里有专门用于外汇应用的工作台？为什么是Ada而不是GBM？你的答案太过模糊抽象。实际上，随着更多的过度训练，收益不会超过5%。

在进行讨论的层面上

让我澄清一下ALGLIB的水平--集体农场的水平，诺夫哥罗德附近的一个村庄。你曾多次写道，这个水平适合你。这很可能是，对于你的任务来说，这已经足够了，但为什么要得罪呢？

你不太擅长推崇一些关于退火 和贿赂的胡言乱语。

你不应该如此...

我几乎试过所有的 R，这种退火方式是最有效的。

为什么是Ada而不是GBM？你的答案是太多模糊的抽象概念。实际上，在更多的过度训练中，收益不会超过5%。

因为我已经试过了，而不仅仅是他们。我仍然有这些协议。

是的，最好的是阿达?是的，相对于森林来说，减少5%，最多7%。而且我也不知道有什么比这更好的。

那么什么是 "大量的过度训练 "呢？你在说什么呢？至于过度训练，我想不起来你有哪一篇帖子表明你的模型没有过度训练！你是怎么做到的？

我只能重申，过度训练根本不取决于模型，它取决于。

一组预测因子
粗化模型的能力

[删除] 2018.01.17 14:45 #5832

桑桑尼茨-弗门科。

在进行讨论的层面上

我澄清了ALGLIB的水平--集体农场的水平，诺夫哥罗德附近的村庄。你曾多次写道，这个水平适合你。这很可能是，这对你的任务来说已经足够了，但为什么要得罪呢？

你不太擅长推崇一些关于退火 和贿赂的胡言乱语。

你不应该如此...

我几乎试过所有的R，这种退火方式是最有效的。

为什么是Ada而不是GBM？你的答案是太多模糊的抽象概念。实际上，在更多的过度训练中，收益不会超过5%。

因为我已经试过了，而不仅仅是他们。我仍然有这些协议。

是的，最好的是阿达?是的，相对于森林来说，减少5%，最多7%。而且我也不知道有什么比这更好的。

那么什么是 "大量的过度训练 "呢？你在说什么呢？至于过度训练，我想不起来你有哪一篇帖子表明你的模型没有过度训练！你是怎么做到的？

我只能重申，过度训练根本不取决于模型，它取决于。

一组预测因子
粗化模型的能力。

分级和提升的区别是什么？在分级中，最初的拟合较少，更多的是机会因素，而在提升中，一个人被拟合在第二个人的遗体上，然后是第三个人，如此类推。而你最终的结果是完全超标。也就是说，射频从一开始就已经可以做得很 "粗 "了，但我要仔细检查一下，我还没有时间。

我所有的模型都是重新训练的:)因为我还没有为它们找到任何永久的模式。

Alglib几乎拥有一切--卷积、PCA、聚类、神经网络集合、FOREST......所以，根据经典，一切都在那里，你还需要什么--我不明白：）更现代的东西，当然不是

而作者写道，他并没有非常崇敬地对待神经网络等，而是认为它们是通常的分类/回归的工具，并没有把它们从其他方法中挑出来。我喜欢这种现实的做法。

关于退火等等，我也不明白--是否有一个通用的方法来评估每个模型？

СанСаныч Фоменко 2018.01.17 15:04 #5833

马克西姆-德米特里耶夫斯基。

敲打和吹嘘的区别是什么？在敲打中，最初的调整较少，更多的是机会因素，但在吹嘘中，一个人是在第二个人的剩余物上进行调整，然后在第三个人的剩余物上进行调整，以此类推。而你最终的结果是完全超标。也就是说，射频从一开始就已经可以做得很 "粗 "了，但我要仔细检查一下，我还没有时间。

我所有的模型都是重新训练的:)因为我还没有为它们找到任何永久的模式。

Alglib几乎拥有一切--卷积、PCA、聚类、神经网络集合、FOREST......所以，根据经典，一切都在那里，你还需要什么--我不明白：）更现代的东西，当然不是

而作者写道，他并没有非常崇敬地对待神经网络等，而是认为它们是通常的分类/回归的工具，并没有把它们从其他方法中挑出来。我喜欢这种现实的做法。

关于退火等等，我也不明白--它是所有模型的通用方法吗？每个模型都应该有自己的评估方法，通过它可以以最好的方式训练这个特定的东西。

我曾多次试图从我的角度向你解释一些基本的东西。我失败了。

我只能建议：花几个月时间在caret上，你会有不同的思维方式，有质的变化。

Yuriy Asaulenko 2018.01.17 15:05 #5834

马克西姆-德米特里耶夫斯基。

至于退火等等，也不清楚--是对所有模型的一些通用方法还是什么？每个模型都应该有自己的评估方式，通过这个特定的东西可以以最佳方式进行训练

退火是非洲的退火，目标/目的大致相同。允许模型找到的不是局部的最小值，而是全局的最小值。

我不知道ADA的情况，但对NS来说，退火的结果非常好。我不喜欢内置的，因为退火参数需要提前设置，所以我手动退火，根据之前学习的结果改变参数。

HZZ 顺便说一下，或多或少复杂的NS没有退火一般不会真正教什么。

Vizard_ 2018.01.17 15:19 #5835

马克西姆-德米特里耶夫斯基。

是的，但它是如此优越，以至于我不会在这个阶段把它拖进来 :)+ 他写道，每年的收入不可能超过20%......我想你应该总是从这样的陈述开始，然后深入到细节中去 :)

马克西姆，停止吸烟。断章取义，把别人的话归于他人，等等。
+部分评论被删除。同样，不要把响尾蛇 一词的作者身份归于法（Fomenko））。

[删除] 2018.01.17 15:30 #5836

蜥蜴_。

马克西姆卡，停止吸烟。你断章取义，把别人的话归到别人身上，等等。+有些评论已经被删除。
+ 一些评论已被删除。另外，不要把响尾蛇 这个词的作者身份归于法（Fomenko））。

我只是说 :) 你心里想的就是你的舌头。

然后就会有东西出现......工作流程是不人性化的。

我对异响的看法是错误的）。SanSanych曾经写过同样的话......胡说八道或类似的话

Yuriy Asaulenko 2018.01.17 20:40 #5837

(由于无所事事，完全没有任何进一步工作的想法，我决定学习一些新东西，当然是为了自己--也许已经很老了）。从射频开始，通过射频来到Python，因为它与我的SciLab软件双向兼容（如他们所说）。现在我是来审查Python的软件包的。

总共有120,000多个包裹。从他们身上，关于机器学习--大约70个，关于神经网络，包括深度学习--大约70个。可能还有更多--我搜索了一下评分标准，有些包可能出现在其他部分。

这还不算由其他公司直接分发的包裹。也有很多这样的套餐。也有对我们感兴趣的主题--我自己看过，包括国防部、俄罗斯联邦国民议会和ADA。

在其他公司中，有机器学习、树、NS和与ADA有关的东西。

许多软件包都是用C/C++制作的，所以不需要担心性能问题--Python只是一种接口（脚本语言）。事实上，R也是如此。

总而言之，我过得很有趣）。

Dr. Trader 2018.01.17 20:55 #5838

马克西姆-德米特里耶夫斯基。

为什么是Ada而不是GBM？你的答案中有太多模糊的抽象概念。在现实中，随着更多的过度训练，收益不会超过5%。

在评分中，使用 "准确性"--正确答案的百分比--来评价一个模型是非常常见的。在我看来，这是对交易模式最薄弱和最不恰当的评价之一，应该避免。我在这里建议尝试其他一些方法--卡帕、f-score、logloss。

R中的Ada（也许不仅仅是R中）在训练中使用了稍微不同的内置分类模型估计，与 "准确性 "相比，它要好得多。

[删除] 2018.01.17 20:55 #5839

尤里-阿索连科。

(由于无所事事，完全没有任何进一步工作的想法，我决定学习一些新东西，当然是为了自己--也许已经很老了）。从射频开始，通过射频来到Python，因为它与我的SciLab软件双向兼容（如他们所说）。现在我来到了包装审查。

总共有超过12万个包裹。其中约70个关于机器学习，约70个关于神经网络，包括深度学习。可能还有更多--我是按评分标准搜索的，有些包可能出现在其他部分。

这还不算由其他公司直接分发的包裹。也有很多这样的套餐。也有对我们感兴趣的主题--我自己看过，包括国防部、俄罗斯联邦国民议会和ADA。

在其他公司中，有机器学习、树、NS和与ADA有关的东西。

许多软件包都是用C/C++制作的，所以不需要担心性能问题--Python只是一种接口（脚本语言）。事实上，R也是如此。

总而言之，我过得很有趣）。

查看更多这些东西 https://cloud.google.com/datalab/

邪恶的是，AutoML的方向也在那里发展--服务将为某些任务自己挑选一个模型。

Cloud Datalab - Interactive Data Insights Tool | Google Cloud Platform

cloud.google.com

Integrated Cloud Datalab simplifies data processing with Cloud BigQuery, Cloud Machine Learning Engine, Cloud Storage, and Stackdriver Monitoring. Authentication, cloud computation and source control are taken care of out-of-the-box. Multi-Language Support Cloud Datalab currently supports Python, SQL, and JavaScript (for BigQuery...

[删除] 2018.01.17 21:00 #5840

交易员博士。

在分类中，使用 "准确性"--正确答案的百分比--来评估一个模型是非常常见的。在我看来，这是对交易模式最薄弱和最不恰当的评价之一，应该避免。我在这里建议尝试其他一些方法--卡帕、f-score、logloss。

R中的Ada（也许不仅仅是R中）在训练中使用了一个稍微不同的内置分类模型估计，与 "准确性 "相比，它要好得多。

对于一般的交易来说，很难这样评价，因为有交易持续时间和止损水平应该加入其他的东西，而且程序本身也会定期重新训练......所以这是个遗憾 :)

交易中的机器学习：理论、模型、实践和算法交易 - 页 584