交易中的机器学习:理论、模型、实践和算法交易 - 页 496

 
交易员博士

森林可以推断吗?是的。
它做得好吗?没有。


什么是好的,什么是坏的?

你有不同模式的比较分析吗?而从一开始:用特定的预测器对特定的目标的适合性,用特定的预测器集对特定的模型的适合性,然后用训练文件以外的文件强制运行进行评估?有理由认为,这些模型没有被过度训练。


有了这一切,就有可能判断对于一组特定 的预测器和目标,什么是好的,什么是坏的。同时,应该理解,很可能有一组不同的预测因素和目标,会产生不同的结果。


对于我的特定案例,我做了这样的工作。我已经在这个主题上多次发布了结果。模型的顺序,从低到高依次为:ada、rf、SVM。最差的是NS,但它是一些古老的版本,我没有使用过现代的。这一切都要符合上述条件。

 
交易员博士

这里有一个有趣的例子,我前段时间在这个主题里发过。
在这种情况下,推断将是在 "已知点云 "之外进行预测。

如果已知的点是很好的聚类,我们可以看到,外推法对大多数模型来说不是问题。
但是,如果已知点的排列比较随机,没有明显的集群,那么预测本身就会变差,推断也就不可靠了。

这都是关于预测因素,如果你在模型中放入垃圾,你真的不能很好地推断。
而且我永远不会用推断法来交易金融数据。


外推法是对未知点的预测,如果这些点在训练样本的最大值和最小值之外,那么RF将总是从训练样本中输出最大值和最小值。

你只是对mb近似法感到困惑吗?

 
交易员博士

这里有一个有趣的例子,我前段时间在这个主题里发过。
外推法将是在 "已知点云 "之外进行预测。

如果已知的点有很好的聚类,那么我们可以看到,外推法对大多数模型来说都不是问题。
但是,如果已知点的排列比较随机,没有明显的集群,那么预测本身就会变差,推断也就不可信了。

这都是关于预测因素的,如果你在模型中放入垃圾,你真的不能很好地推断。
而且我永远不会用推断法来交易金融数据。


一般来说,对统计数据的信任问题是哲学问题。

这里是分类。

推断的概念本身是否适用于它?在我看来不是。分类找到模式,然后试图根据这些模式来分配新的数据。


在分析模型中进行推断,这些模型在分析形式上有一定的功能。


和ARIMA?这里面有推断吗?这取决于什么。模型本身需要最后几个小节,通常是一个。但参数选择需要成千上万条。这一千人是推算出来的,而上次计算的那个人不是。


我不认为数学意义上的推断适用于金融市场。

 
桑桑尼茨-弗门科

一般来说,对统计数据的信任问题是哲学问题。

这里是分类。

推断的概念本身是否适用于它?在我看来不是。分类找到模式,然后试图根据这些模式来分配新的数据。


在分析模型中进行推断,这些模型在分析形式上有一定的功能。


和ARIMA?这里面有推断吗?这取决于什么。模型本身需要最后几个小节,通常是一个。但参数选择需要成千上万条。这一千人是推算出来的,而上次计算的那个人不是。


我不认为数学意义上的推断适用于金融市场。


MO中的外推法是指模型对新数据起作用的能力,它是一种特殊的近似类型。在训练样本上,你的模型是估计的,而在不在训练样本中的新数据上,它是EXTRAPOLISES。

这就是为什么我举了一个线性回归 和XGboost的例子,你没有仔细阅读,线性回归可以完美地推断,而任何涉及决策树的东西都不能推断,因为决策树的结构。

 

线性回归 一般都存在,特别是只对模型中具有正态分布残差的静止序列进行推断。它的应用有大量的限制,使这种类型的模型对金融系列毫无用处。

如果一个人进入了模型对他的具体数据的适用性,那么它就是建模,在所有其他情况下,它就是一个数字游戏

这条线上的大量帖子都是数字游戏,因为没有给出证据来证明这一点。

 
桑桑尼茨-弗门科

线性回归 一般都存在,特别是只对模型中具有正态分布残差的静止序列进行推断。它的应用有大量的限制,使这种类型的模型对金融系列毫无用处。

如果一个人进入了模型对他的具体数据的适用性,那么这就是建模,在所有其他情况下,这是一个数字游戏

这条线上的大量帖子是一个数字游戏,因为没有给出证据来证明这一点。


问题是如何正确使用脚手架,以避免犯愚蠢的错误,如认为他们可以EXTRAPOLISH。

在森林中以报价的形式输入一个时间序列,模型将只预测所研究的序列在新数据中的最大和最小值,如果它超出了范围

 
阿利奥沙

真是一团糟,先生们...

从KO获得的一点信息。


在金融市场上,外推法/内推法是适用的,也是非常需要的。


如果它是 "适用的、有需求的",那么为什么这么多年来你没有做一个成功的TS?

P.S. 我听到一只猫在叫......对了,我想阿廖沙又写了些什么!?

 
阿利奥沙

真是一团糟,先生们...

从KO获得的一点信息。

在MO的背景下,外推法和内插法是一样的!在这两种情况下,你都需要得到一个与训练数据集中的点不一样的值(int,float[])。关于点在超空间的位置,相对于训练点云,是不可能的,因为它完全取决于特征,特征空间的结构,在一个投影将是一个点 "外面 "的训练云,在另一个 "里面 "是不重要的,它有意义的只有什么不是在训练,点。

总结一下:如果该点不在训练数据集中,其分类或回归的结果将是外推和内插,这取决于学科领域对结果的最终解释,但对MO算法来说,它们是一体的。

林林总总的推断--太好了!在合适的人手中,比NS更好、更快几个数量级。

在金融市场上,外推法/内推法是适用的,也是非常需要的。


给马克西姆一个单独的建议:聪明人比傻瓜更经常犯错,因为他做的测试要多得多,但只有傻瓜才会对自己的观点有感情,他很难割舍。 你选择你是谁)))。


好的,给我一个例子,至少有1篇文章的例子,说明脚手架的推断效果如何。我找不到任何东西。

在我看来,这不是很好。

当你有很多不同的特征时,你如何知道这个点是在云的内部和外部,当训练中的目标值范围,当所有的树都建立起来时,目标永远不会离开这个范围,这一点如何重要?


 
马克西姆-德米特里耶夫斯基

线性回归在推断方面非常出色,而任何决策树都不能推断。

外推法涉及对训练期间已知的预测值之外的新数据进行预测。

这是一张老照片的片断,所有的绿色阴影都是外推法,图片显示森林可以做到这一点,否则就会被染成白色(如一些SVM模型的情况)。


森林、神经网络和线性模型都可以推断。如果你想预测远离已知值的情况,那么所有这些模型都会给出预测结果,它们都有某种算法来处理这种情况。

但是,为什么你认为如果线性模型使用y=ax+b的公式进行推断,它会做得很完美,但如果森林使用最近的已知邻居进行推断,就没有用?这两种算法都有存在的权利。正如SanSanych所说--对于每一组预测因子和目标要研究和比较模型,只有这样你才能说模型是否做了完美的推断。
hubra上的文章所写的内容--也适用于特定的预测器和目标,它不是对所有情况都有效的真理,它是对特定情况的具体研究。

 
交易员博士

外推法意味着要预测训练期间已知的预测器数值以外的新数据。

这是一张旧照片的一部分,所有绿色阴影的东西都是推断,从照片上看,森林可以做到这一点,否则所有东西都会被染成白色(就像一些SVM模型的情况)。


森林、神经网络和线性模型都可以推断。如果你给了远离已知值的数据进行预测,所有这些模型都会给出一个预测,它们都有一些针对这种情况的算法。

但是,为什么你认为如果一个线性模型使用y=ax+b的公式进行推断,那么它就能完美地完成,而如果森林使用最近的已知邻居进行推断,那么它就不能做任何事情?这两种算法都有存在的权利。正如SanSanych所说--对于每一组预测因素和目标进行研究,并对模型进行比较,只有这样你才能说模型是否做了完美的推断。
hubra上的文章所写的内容--也适用于特定的预测者和目标,这不是一个适用于所有情况的真理,这是一个具体的案例研究。


你只需要做一个树木研究。