交易中的机器学习:理论、模型、实践和算法交易 - 页 193

 

我一直在玩卷积神经元,现在已经有一段时间了。到目前为止还没有成功,但至少我已经知道了如何用它来准备和预测。这里有一个简单的代码,有注释,还有一个测试的表格。

有两个卷积层和一个普通隐藏层。训练有素的模型最终在输出端总是产生 "1"(购买)。这个想法是要有几十个,而不是2个卷积层,然后几周的时间来训练,而且根本不能保证成功。但这值得一试。

我重新修补了 forex_mxnet.txt,那里有一个错误,对于一个softmax函数,最后一层的输出数量应该等于类的数量。在这种情况下,带回归的选项是完全不可能的。

附加的文件:
eurusd_h1.zip  30 kb
forex_mxnet.txt  20 kb
 
Dr.Trader:

1)我不清楚你说的 "聚类 "是什么意思。通常情况下,你不会对一个特定的预测器进行聚类,而是采取一打预测器,并在空间中找到这些点聚类的区域。例如,在下图中,有两个预测因子,聚类为2个群组,将只得到蓝色和红色的群组。

2)也许你说的是模式?绿色模式--价格先跌后涨。黄色:价格从底部上升。红色:向上->向下。你做对了吗?


最初我们不知道哪些预测因子是好的,哪些是坏的,如果我们把它们一下子聚成一个模型(随机+rsi+masd.......)=聚类1,2,3,4,5.....那么我们也会考虑到不必要的预测因素,我们甚至不知道它们是不必要的......。

我们需要对每个预测器进行分组

K1=(随机)=群组1,2,3,4,5....

K2 = (rci) = 集群1,2,3,4,5....

K3=(质量)=群组1,2,3,4,5....

然后我们通过模型组合之间的簇数来寻找组合。

К1

K1和K2

K2和K3

K1和K3

K1和K2和K3

2) 正确,在这种情况下,集群和模式是同一回事。

 
mytarmailS:

集群和模式是不同的。一个向量上的群组是区间,即所有允许的指标值的列表被分为几个区间。但在这种情况下,你图片中的间隔2和间隔3是一样的。

但是,如果你的第二和第三群组必然是不同的东西,那么它们就不再是群组,而是模式。

 
Dr.Trader:

集群和模式是不同的。一个向量上的群组是区间,即所有允许的指标值的列表被分为几个区间。但在这种情况下,你图片中的间隔2和间隔3是一样的。

但是,如果你的第二和第三群组必然是不同的东西,它们就不再是群组,而是模式。

如果我们不是对最后一个指标值进行聚类,而是对滑动窗口中的10个最后值进行聚类,我们就会得到一个具有一定数量的聚类,该聚类同时考虑了指标的数字和几何 特征(坡度等)。

它是一个集群还是一个模式呢?

我是否回答了你的问题,还是我没有理解这个问题?:)

 
mytarmailS:

我是否回答了你的问题,还是我误解了问题?:)

那是的,相当的聚类,那么就可以了。
 

这里我看一下所有可用模型的委员会在验证上的表现与天真近似的表现:只买,只卖,随机方向。

白氏在这个样本上稍稍拉开了差距。

前面还有一个延迟的样本来验证稀疏的委员会。有可能卖出的情况会更好。但重要的是模型委员会的行为方式...

与我给出的方案相关联。

 
阿列克谢-伯纳科夫

白氏在这个样本上略微领先。

如果在该时间段内价格图在上升,那么据统计,有时直接开出买入交易,持有它,然后关闭它,会更有利可图。不是说这是 "有利可图",但与开卖单并持有一段时间相比,损失会小一些。这就是为什么只买不卖在随机交易周围是如此美丽的对称性。领先的不是车型本身,只是成功伴随着它的价格。
 
Dr.Trader:
如果价格图在该时间段内上升,从统计学上看,有时直接开出买入交易,持有,然后平仓会更有利可图。并不是说这是 "有利可图",只是与你也随机开出卖出交易并持有一段时间相比,损失会小一些。这就是为什么只买不卖在随机交易周围是如此美丽的对称性。拉开差距的不是车型本身,只是成功伴随的价格。
这就是我所说的。只卖出和只买入以及随机交易都是在没有模式的情况下进行的...但趋势是向上的,而且买盘对其他的随机性更好。

而训练有素的模型的交易是绿色的...在这个样本中,他们处于领先地位。之所以选择这个特定的目标,是因为在这个样本中,模型平均是向正方向发展的,而这个样本既没有参与训练也没有参与模式选择。然后会有委员会进行调整和验证。而且我在整个研究中只使用最后一个延迟样本一次。

PS )包括所有的传播。因此,随机性的分布低于零。
 

总的来说,它看起来不错,我想知道最后会发生什么。

关于委员会--我已经贴出了一些例子,但也有使用回归与四舍五入进行分类的模型,那里就不是那么明确了。我试着用两种不同的方式来组合投票。

1)把所有的东西都归类为班级,并选取得到最多票的班级。
即有三个模型对4条的预测
c(0.1, 0.5, 0.4, 0.4) c(0.6, 0.5, 0.7, 0.1) c(0.1, 0.2, 0.5, 0.7) 我将进一步把它四舍五入到班上
c(0, 1, 0, 0) c(1,1,1,0) c(0,0,1,1) ,最后的预测向量将是c(0, 1, 1, 0),按票数计算。

2)另一个选择是马上找到平均结果,然后再四舍五入到班级中去
结果将是c((0.1+0.6+0.1)/3, (0.5+0.5+0.2)/3, (0.4+0.7+0.5)/3, (0.4+0.1+0.7)/3)
或(0.2666667, 0.4000000, 0.53333, 0.4000000),或
c(0, 0, 1, 0)

你可以看到,结果是不同的,这取决于哪一步四舍五入。我不知道哪种方法更标准,但我认为第二种方法对新数据更有效。
 
Alexey Burnakov:

这里我看一下所有可用模型的委员会在验证上的表现与天真近似的表现:只买,只卖,随机方向。

白氏在这个样本上稍稍拉开了差距。

前面还有一个延迟的样本来验证稀疏的委员会。有可能卖出的情况会更好。但重要的是模型委员会的行为方式...

与我给出的方案相关联。

最主要的是,我的基本Sequent Demark的 TP有一些有趣的功能,其中之一。买入信号更多,模型火车在上面更好;卖出信号更少,模型火车在上面更差。我认为这显示了全球趋势的下降,当情况会向相反方向变化时,就会有买入的前提条件,我指的当然是英镑,而在犹太人身上也可以看到这样的情况:....