交易中的机器学习:理论、模型、实践和算法交易 - 页 2634

 

再来点准哲理吧。偏差和方差之间的权衡将始终限制模型的复杂性。因此,人们永远无法确定该模型在整个预测因子集上会有良好的效果。因此,出现了确定这一模型的工作子集的任务。如果我理解正确,这正是马克西姆最近写的(关于两个模型)。这很符合 "你不应该试图一直在市场上 "的旧观念。

如果能尝试将所有这些结合到一个模型中,那就更好了。例如,这个想法(Aleksey Vyazmikin有一个稍微类似的想法)--我们把每个预测因子分成若干段,这样就可以把整个预测因子集分解成多维的立方体。然后从所有这些立方体中,我们选择一组合适的立方体。在大维度的情况下,这个问题在组合上是难以解决的,但我们可以通过与随机森林的类比来做到--随机选择低维度的预测器集合。每个预测器的初始分割可以通过将股权(当交易按给定的预测器而不是按时间排序时)划分为单调的大块来完成。

用交叉验证(转发)和其他所有的东西来补充)可能,它甚至不会是很无稽的)好吧,或者有人以前做过这样的事情。

 
有用的文章。
https://habr.com/ru/company/ods/blog/544208/
 
Mikhail Mishanin #:
有用的文章。
https://habr.com/ru/company/ods/blog/544208/
帽子。不同统计测试的大杂烩
 
Maxim Dmitrievsky #:
帽子。不同统计测试的大杂烩

作为一个反思/理解的主题,那就是

相关性!=因果关系

1-4.

无论如何,要做你自己的测试。因此,这篇文章实际上是在做广告)

 
Mikhail Mishanin #:

作为一个反思/理解的主题,那就是

相关性!=因果关系

1-4.

无论如何,要做你自己的测试。因此,这篇文章实际上是在做广告)

谁说这是平等的。就像编造一个错误的声明,然后反驳它
 
我想知道是否有可能在合成数据中寻找模式。让我解释一下--从100-200个观察的小样本中,从它们的分布中抽取大量的合成数据,并在那里已经寻找到一些复杂的序列,等等。
 
mytarmailS #:
我想知道是否有可能在合成数据中寻找模式。让我解释一下--从100-200个观察的小样本中,从它们的分布中抽取大量的合成数据,并在那里已经寻找到一些复杂的序列,等等。
不符合逻辑。
 
Valeriy Yastremskiy #:
从逻辑上讲,不是。
为什么不呢?
 
mytarmailS #:
为什么?

从逻辑上讲:-)

PS/数据太少,它们被阉割为ohlc或完全独立的指标。

PPS/但如果你定期抽取这样的样本,那就是另外一回事了。看/搜索 - 这里有一堆模式,它们有什么共同点。在这里,每个片段的大小可能不大,它们的总数量。因为你通过形成一套的主要模式来表明

 
你说的经常性的此类样本是什么意思?