交易中的机器学习:理论、模型、实践和算法交易 - 页 131

 

jPrediction三元分类器的第10版已经发布

新版本中实现了交叉验证。

由于交叉验证,与第9版相比,OOS上的泛化能力有了明显的提高,特别是在非平稳数据上。同时,根据对样本不同部分的测试结果的概括能力,作为第9版和第10版中模型的特点,几乎没有变化。

由于这些变化没有影响到用户界面,对第9版用户的说明 仍然有效。在说明 中可以找到下载jPrediction的新版本以及其源代码的链接。

 

Awl作家
1)它只是通过绝对值来比较两个时间序列,即需要在纵轴上进行预归一化的移动和缩放,这在很大程度上取决于具体的实施。

2) 例如,这里https://www.mql5.com/ru/code/10755,取2个固定长度的片段进行比较

3)并没有考虑到其中一个可能较长,另一个可能较短的情况。

4),而且计算量可以大大减少,等等。我们可以通过DTW特定的参数来谈论聚类--不仅可以计算两个片段的 "相似度",还可以计算水平尺度的比例。

1) 那么,在用DTW算法对两个系列进行相似性比较之前,当然只能用通常的方式进行归一化......那些取代绝对价格值的范围,例如从0到1,你说的移位和比例 的正常化是什么意思 请解释一下。

2)谢谢你的链接,说起来我真的很震惊,我和作者的想法完全一样,我做了完全一样的研究,我经历了完全一样的进化路径,从普通的相关到DTW,这让我起鸡皮疙瘩......我们在做同样的事情,思考同样的事情,只是在不同的时间、不同的地点,叮叮当当......。

3)是的,没有考虑到,虽然考虑是正确的,但我猜想为什么作者没有实施它,事实是,如果你开始深入思考的类型:"但如何实现它",然后出来了很多的问题,没有答案......

因为它不仅仅是用DTW在固定长度的 片段上搜索相似性,就像我在聚类中做的那样,或者本文作者的算法,它要复杂得多......

以下是出现的几个问题

1.如果我们不仅要在历史上走一遍,寻找相似性,还要动态地扩大/缩小当前图案和我们要比较的历史图案,那么如何比较当前价格图案与历史图案的相似性?

2.如何在扣减功率不足的情况下挣扎 个人对于DTW来说,即使在固定长度的两段上,我也没有足够的功率,而在变体(1.)的情况下,负荷增加了数千倍而不夸张....。

4)如何?

 
mytarmailS:

1.你可以把系列的值带到[0;1]的范围内,但最好是通过从每个元素中减去平均值(MA),然后用每个元素除以标准差来消除常数成分。浏览器这种寄生虫,破坏了一些文字。

3-4.如果你研究一下算法的本质,即矩阵是如何填写的,很多东西就会变得清晰。我们比较两个长度相同的片段,它们有固定的开始和结束。我们可以固定开头,使结尾浮动,并在算法中引入从0.5到2的比例因子限制--你将得到有约束的DTW。结果将不是一个而是两个数字,这将为我们提供一个额外的预测器。如何减少计算量--找到 "奇异点"(极值),把它们拉到一起,从而抛出一大部分矩阵区域,更多细节 见链接。另见维基百科动态时间扭曲,参考文献部分。

 
阿列克谢-伯纳科夫

先生们,我的一个新任务。

这里有一个.R格式的数据集:https://drive.google.com/open?id=0B_Au3ANgcG7CcjZVRU9fbUZyUkE

这组数据中大约有40,000行,101列。最右边一栏是目标变量。左手边是100个输入。

我建议你尝试建立一个回归模型,根据剩下的100列,在前20000个观测值的基础上预测第101列的值。

在剩下的20,000多个观测值上,构建的模型应该显示出 至少0.5的R^2

然后我揭示了数据的生成方式,并给出了我的解决方案。

线索是时间序列数据。输入是100个样本,提前预测1个。它不是价格或报价或其衍生品。

阿列克谢

谁试过?我和我的同事想训练一个卷积NS。有一些绘图正在进行中。我们希望。

这是一种非常规的应用方法。另一方面,我们只需提出一个一维的 "图片 "作为输入,我们就可以把相邻的 "像素 "和它们的各种相互作用拼接在一起。

 
阿列克谢-伯纳科夫

谁试过了? 我和我的同事想训练一个卷积 NS。有一些绘图正在进行中。我们希望如此。

这是一种非常规的应用方法。另一方面,我们只需提出一个一维的 "图片 "作为输入,我们就可以把相邻的 "像素 "和它们的各种相互作用拼接在一起。

那么让同事们试试吧,还是很弱?
 
阿列克谢-伯纳科夫

我和我的同事想训练一个卷积NS。有一些制图正在进行。我们希望如此。

有趣的是,等待印象...
 
mytarmailS:


1.如果我们不仅要在历史中穿行,寻找相似之处,而且还要动态地扩大/缩小当前的模式和我们要比较的历史模式,那么我们怎么能比较当前价格模式与历史模式的相似性?


这有什么必要呢?如果一个模式在历史上有一个类比,那么它在持续时间上应该是一样的。至少我在做模式搜索时,在寻找相称的部分。
 
尤里-塔舍基
为什么有这样的需求?如果一个模式在历史上有一个类比,那么它在持续时间上也应该对应。至少我在做图案搜索时是在寻找比例部分。

1)至少因为市场上没有任何图案是完全相同的。

2)而且因为DTW提供了这么好的机会

3)而且因为我们都知道按尺寸搜索相同图案的结果,包括你...还是你会给我带来惊喜?:)

 
活动
所以让你的同事们试一试,或者说是弱者?
你的观点是什么,乘客?你不想尝试,也不想用你的方式。我正在做自己的任务,我很感兴趣。
 
mytarmailS:
有趣的是,期待着印象......
你还会说什么?你在等待结果吗?
原因: