交易中的机器学习：理论、模型、实践和算法交易

СанСаныч Фоменко 2017.10.03 11:47 #4951

交易员博士。

森林可以推断吗？是的。
它做得好吗？没有。

什么是好的，什么是坏的？

你有不同模式的比较分析吗？而从一开始：用特定的预测器对特定的目标的适合性，用特定的预测器集对特定的模型的适合性，然后用训练文件以外的文件强制运行进行评估？有理由认为，这些模型没有被过度训练。

有了这一切，就有可能判断对于一组特定的预测器和目标，什么是好的，什么是坏的。同时，应该理解，很可能有一组不同的预测因素和目标，会产生不同的结果。

对于我的特定案例，我做了这样的工作。我已经在这个主题上多次发布了结果。模型的顺序，从低到高依次为：ada、rf、SVM。最差的是NS，但它是一些古老的版本，我没有使用过现代的。这一切都要符合上述条件。

[删除] 2017.10.03 11:52 #4952

交易员博士。

这里有一个有趣的例子，我前段时间在这个主题里发过。
在这种情况下，推断将是在 "已知点云 "之外进行预测。

如果已知的点是很好的聚类，我们可以看到，外推法对大多数模型来说不是问题。
但是，如果已知点的排列比较随机，没有明显的集群，那么预测本身就会变差，推断也就不可靠了。

这都是关于预测因素，如果你在模型中放入垃圾，你真的不能很好地推断。
而且我永远不会用推断法来交易金融数据。

外推法是对未知点的预测，如果这些点在训练样本的最大值和最小值之外，那么RF将总是从训练样本中输出最大值和最小值。

你只是对mb近似法感到困惑吗？

СанСаныч Фоменко 2017.10.03 11:55 #4953

交易员博士。

这里有一个有趣的例子，我前段时间在这个主题里发过。
外推法将是在 "已知点云 "之外进行预测。

如果已知的点有很好的聚类，那么我们可以看到，外推法对大多数模型来说都不是问题。
但是，如果已知点的排列比较随机，没有明显的集群，那么预测本身就会变差，推断也就不可信了。

这都是关于预测因素的，如果你在模型中放入垃圾，你真的不能很好地推断。
而且我永远不会用推断法来交易金融数据。

一般来说，对统计数据的信任问题是哲学问题。

这里是分类。

推断的概念本身是否适用于它？在我看来不是。分类找到模式，然后试图根据这些模式来分配新的数据。

在分析模型中进行推断，这些模型在分析形式上有一定的功能。

和ARIMA？这里面有推断吗？这取决于什么。模型本身需要最后几个小节，通常是一个。但参数选择需要成千上万条。这一千人是推算出来的，而上次计算的那个人不是。

我不认为数学意义上的推断适用于金融市场。

[删除] 2017.10.03 12:02 #4954

桑桑尼茨-弗门科。

一般来说，对统计数据的信任问题是哲学问题。

这里是分类。

推断的概念本身是否适用于它？在我看来不是。分类找到模式，然后试图根据这些模式来分配新的数据。

在分析模型中进行推断，这些模型在分析形式上有一定的功能。

和ARIMA？这里面有推断吗？这取决于什么。模型本身需要最后几个小节，通常是一个。但参数选择需要成千上万条。这一千人是推算出来的，而上次计算的那个人不是。

我不认为数学意义上的推断适用于金融市场。

MO中的外推法是指模型对新数据起作用的能力，它是一种特殊的近似类型。在训练样本上，你的模型是估计的，而在不在训练样本中的新数据上，它是EXTRAPOLISES。

这就是为什么我举了一个线性回归和XGboost的例子，你没有仔细阅读，线性回归可以完美地推断，而任何涉及决策树的东西都不能推断，因为决策树的结构。

СанСаныч Фоменко 2017.10.03 12:43 #4955

线性回归一般都存在，特别是只对模型中具有正态分布残差的静止序列进行推断。它的应用有大量的限制，使这种类型的模型对金融系列毫无用处。

如果一个人进入了模型对他的具体数据的适用性，那么它就是建模，在所有其他情况下，它就是一个数字游戏。

这条线上的大量帖子都是数字游戏，因为没有给出证据来证明这一点。

[删除] 2017.10.03 12:59 #4956

桑桑尼茨-弗门科。

线性回归一般都存在，特别是只对模型中具有正态分布残差的静止序列进行推断。它的应用有大量的限制，使这种类型的模型对金融系列毫无用处。

如果一个人进入了模型对他的具体数据的适用性，那么这就是建模，在所有其他情况下，这是一个数字游戏。

这条线上的大量帖子是一个数字游戏，因为没有给出证据来证明这一点。

问题是如何正确使用脚手架，以避免犯愚蠢的错误，如认为他们可以EXTRAPOLISH。

在森林中以报价的形式输入一个时间序列，模型将只预测所研究的序列在新数据中的最大和最小值，如果它超出了范围

Дмитрий 2017.10.03 13:30 #4957

阿利奥沙。

真是一团糟，先生们...

从KO获得的一点信息。

在金融市场上，外推法/内推法是适用的，也是非常需要的。

如果它是 "适用的、有需求的"，那么为什么这么多年来你没有做一个成功的TS？

P.S. 我听到一只猫在叫......对了，我想阿廖沙又写了些什么！？

[删除] 2017.10.03 13:34 #4958

阿利奥沙。

真是一团糟，先生们...

从KO获得的一点信息。

在MO的背景下，外推法和内插法是一样的!在这两种情况下，你都需要得到一个与训练数据集中的点不一样的值（int,float[]）。关于点在超空间的位置，相对于训练点云，是不可能的，因为它完全取决于特征，特征空间的结构，在一个投影将是一个点 "外面 "的训练云，在另一个 "里面 "是不重要的，它有意义的只有什么不是在训练，点。

总结一下：如果该点不在训练数据集中，其分类或回归的结果将是外推和内插，这取决于学科领域对结果的最终解释，但对MO算法来说，它们是一体的。

林林总总的推断--太好了!在合适的人手中，比NS更好、更快几个数量级。

在金融市场上，外推法/内推法是适用的，也是非常需要的。

给马克西姆一个单独的建议：聪明人比傻瓜更经常犯错，因为他做的测试要多得多，但只有傻瓜才会对自己的观点有感情，他很难割舍。你选择你是谁））））。

好的，给我一个例子，至少有1篇文章的例子，说明脚手架的推断效果如何。我找不到任何东西。

在我看来，这不是很好。

当你有很多不同的特征时，你如何知道这个点是在云的内部和外部，当训练中的目标值范围，当所有的树都建立起来时，目标永远不会离开这个范围，这一点如何重要？

Dr. Trader 2017.10.03 13:39 #4959

马克西姆-德米特里耶夫斯基。

线性回归在推断方面非常出色，而任何决策树都不能推断。

外推法涉及对训练期间已知的预测值之外的新数据进行预测。

这是一张老照片的片断，所有的绿色阴影都是外推法，图片显示森林可以做到这一点，否则就会被染成白色（如一些SVM模型的情况）。

森林、神经网络和线性模型都可以推断。如果你想预测远离已知值的情况，那么所有这些模型都会给出预测结果，它们都有某种算法来处理这种情况。

但是，为什么你认为如果线性模型使用y=ax+b的公式进行推断，它会做得很完美，但如果森林使用最近的已知邻居进行推断，就没有用？这两种算法都有存在的权利。正如SanSanych所说--对于每一组预测因子和目标要研究和比较模型，只有这样你才能说模型是否做了完美的推断。
hubra上的文章所写的内容--也适用于特定的预测器和目标，它不是对所有情况都有效的真理，它是对特定情况的具体研究。

[删除] 2017.10.03 13:45 #4960

交易员博士。

外推法意味着要预测训练期间已知的预测器数值以外的新数据。

这是一张旧照片的一部分，所有绿色阴影的东西都是推断，从照片上看，森林可以做到这一点，否则所有东西都会被染成白色（就像一些SVM模型的情况）。

森林、神经网络和线性模型都可以推断。如果你给了远离已知值的数据进行预测，所有这些模型都会给出一个预测，它们都有一些针对这种情况的算法。

但是，为什么你认为如果一个线性模型使用y=ax+b的公式进行推断，那么它就能完美地完成，而如果森林使用最近的已知邻居进行推断，那么它就不能做任何事情？这两种算法都有存在的权利。正如SanSanych所说--对于每一组预测因素和目标进行研究，并对模型进行比较，只有这样你才能说模型是否做了完美的推断。
hubra上的文章所写的内容--也适用于特定的预测者和目标，这不是一个适用于所有情况的真理，这是一个具体的案例研究。

你只需要做一个树木研究。

交易中的机器学习：理论、模型、实践和算法交易 - 页 496