交易中的机器学习:理论、模型、实践和算法交易 - 页 570

 
马克西姆-德米特里耶夫斯基
  • 随机森林:吉尼重要性或平均杂质减少量(MDI)[2]
  • 随机森林:互换重要性或平均准确度下降(MDA[2]
  • 随机森林:Boruta[3]。

https://medium.com/@ceshine/feature-importance-measures-for-treemodels-part-i-47f187c1a2c3

你应该尝试将至少一种方法添加到algib森林中,然后所有的事情都可以在MT5中自动完成,而不需要R,例如,数据检索


caret中最牛的预测器选择:gafs--预测器的遗传选择;rfe--反向预测器选择(最快);safs--预测器选择的模拟鲁棒性(退火)--效率最高。


如果我们谈论机器学习,我们应该注意--它是一个外壳,包括整个周期:数据挖掘、建模、估算。



PS。

你所坚持的是 "这里是如何完成......"。

 
桑桑尼茨-弗门科



不,我指的正是射频中的选择方法,而不是其他方式。还是为了射频?我知道吉尼是最受欢迎的。

是的,使用R MDI

 

关于预测因子的选择...
最初添加到模型中的--星期。我观察了最佳变体的交易--结果发现,在40天(8周)里,它学会了在周四买入,在10天(2周)的测试中,它几乎每个周四都在买入,而且是赢家。而在其他日子里,她要么不做交易,要么只做个别的交易。
结论:我必须去掉工作日才能使我的交易达到平衡。我现在正在测试不使用它,我们将看看会发生什么。
但我纯粹是被常识所淘汰,自动化认为这个预测因素非常重要。

因此,依靠自动化是有点牵强的...虽然有可能星期几是你唯一能看到并理解的手动操作,但更精细的东西可能就不被注意了

 
elibrarius

关于预测器的选择...
最初添加到模型中的--星期。我看了一下最佳变体的交易,结果发现我已经学习了40天(8周)在周四买入,在10天(2周)的测试中,我几乎每个周四都在买入,我赢了。而在其他日子里,她要么不做交易,要么只做个别的交易。
结论:我必须去掉工作日才能使我的交易达到平衡。我现在正在测试不使用它,我们将看看会发生什么。
但这种消除纯粹是基于常识,自动化已经认为这个预测因素非常重要。

因此,依靠自动化是有点风险的...


我只是好奇地想了解它是如何工作的,所以我根本不需要做任何事情 :) 如果一个变量不重要,只要删除它,以避免产生不必要的维度。

重要性不在于模型是否能在前行中发挥作用,而在于此刻的特征对目标的描述有多好

另一方面,对于NS或Deep NS来说,特征选择根本不是很重要,它只是给出较少的权重,额外的特征几乎没有影响。额外的调整当然是好的,但这是统计学的数据撒旦主义,不适合盘口,会给质量增加5-7%,这不算什么。

在外汇中选择预测因子本身几乎是浪费时间,其重要性在不同的集子上会有所不同。IMHA

 
马克西姆-德米特里耶夫斯基

另一方面,对于NS或深NS来说,性状选择根本就不是很重要,它只是抛出较小的权重,额外的性状几乎没有影响。额外的调整当然是好的,但这是统计学的数据撒旦主义,不适合用于盘口。

在我的例子中,星期四变成了非常好的买点(在50天的时间间隔内),显然NS给这周的这一天 分配了最高的权重。这很有效,但我认为在周四的每个酒吧买东西是个错误。毕竟,事情可以改变,我们需要寻找更深层次的模式。

也许一年的学习时间...但它将需要6或7倍的时间。那么也许一周中的某一天的重要性会下降。

 
elibrarius

在我的例子中,星期四变成了一个非常好的购物日(在50天的时间间隔内),显然NS给了这个星期的日子 最高的权重。NS赚了,但我认为周四在每个酒吧买入是一个错误。毕竟,事情可以改变,我们需要寻找更深层次的模式。


它可以改变,是的:)你要么需要更大的样本,要么重新培训和评估自己......我做的是第二种。可以说是最后一次运行 :)

 

我们还应该研究缺口的频率,我记得日元图表就像一把斧头被用来砍掉报价的上升。那么如何交易。这些大于1000点的振幅应该被结构化(通过缺口的波动水平),并且应该计算其重复的概率。概率很高--专家顾问在这个图表上睡觉。或者你可以抓住缺口概率的增加,并知道它将向哪个方向发展,使用挂单来尝试驾驭它。研究缺口之前发生的事情也很重要--因为它显然是人为的,所以他们在缺口之前欺骗那里,以便将订单集中到与即将出现的缺口方向相反的方向。已添加。


我也同意关于这套房子的说法。但每个时间段的套路是不同的。对于分钟来说是一天,对于一小时来说是一个月等等。或者,你指的是报价行为的盈利模式,这种情况更经常发生?那么是的--一套将由这个 "模式 "的创建时间来衡量。

而那些报价历史值或你的预测器(据我所知,它们是图表上重复的报价行为模式),更接近当前日期,应该有更大的权重,也就是说,1年的历史只对搜索这些预测器感兴趣--预测器阵列的重复 "利润 "报价行为模式,并根据它们在报价历史上的检测频率给它们一个权重。第二个权重应该根据图表中与最新事件的接近程度来提高预测器的地位。

这就像门捷列夫醒来,从睡梦中说出一切。我自己也不太了解))))。好运,我们正在等待结果。

年利率100%,交易稳定。不需要其他东西。不要做得太过分。


预测者

11.1.5. ЛИНЕЙНЫЙ ПРЕДИКТОР И ФУНКЦИЯ СВЯЗИ
  • lib.alnam.ru
линейный предиктор изменяется на единиц. (Это может быть как реалистичной интерпретацией, так и нереалистичной. В примере с объемом древесины, если радиус ствола дерева увеличивается, то, вероятно, возрастает и его высота.) Ожидаемое значение У связано с линейным предиктором посредством функции связи . В некоторых случаях известны естественные...
 
geratdc:

100%的年薪是不够的,需要一个月的时间 :)

 
elibrarius

关于预测因子的选择...
最初添加到模型中的是--星期 几。我观察了最佳变体的交易--结果发现,在40天(8周)里,它学会了在周四买入,在10天(2周)的测试中,它几乎每个周四都在买入,而且是赢家。而在其他日子里,她要么不做交易,要么只做个别的交易。
结论:我必须去掉工作日才能使我的交易达到平衡。我现在正在测试不使用它,我们将看看会发生什么。
但这种消除纯粹是基于常识,自动化已经认为这个预测因素非常重要。

因此,依靠自动化是有点牵强的......虽然有可能星期几是你唯一能看到并理解的手动操作,但更精细的东西可能就不被注意了

但是没有...去掉星期几后,一切都保持不变。有5条日线作为背景,也许它是从那里来的......我必须尝试不使用它们。
 
elibrarius:
不...删去星期几后,还是一样。有5个日线作为背景,也许这就是它的来历......我必须尝试不使用它们。

这意味着它的作用很小......没有 我怎么能理解?) 只有当你依次洗刷每个预测器的值,并重新训练,观察总误差的变化时,才会发现

只不过,随机洗牌的数据突然变成了非常重要的数据,这可能是一个惊喜 :)+ 如果有大量的功能,则需要很长的时间。因此,在没有功能的情况下,这是一个系统性的任务。