交易中的机器学习:理论、模型、实践和算法交易 - 页 1917

 
mytarmailS:

是的,它应该和其他人一样)想法是修改特征,训练模型,看看新数据会发生什么。


我们如何与普通模型一起工作? 我们只是给X1,X2,X3,....x20,这就结束了。


我在最后一个脚本中所做的是,- 0.82

我把所有31个指标作为预测因素。

然后我把他们的预测作为二阶预测,然后我从预测中提取预测,如此反复11次,直到误差下降,我得到0.82,而不是0.7。


我不知道我在哪里出了错((

这个想法是完全正确的,允许生成基本的预测器,但有两个微妙之处。

1.结果的可重复性--将需要进行某种额外的转换--处理后我们得到什么--一个新的表格?

2.有必要检查采样期的规律性--正确的分类会在不同的地点,而且在我所知的任何训练模型中都没有实现,这是非常糟糕的。

由于我的大部分预测因子在本质上是分类的,我想尝试通过&&预连接统计意义上的预测因子的范围来生成预测因子。

关于这个错误,它是落在一个以前未知的样本上,还是落在一个测试样本上?也许脚本在生成新规则时考虑到了测试样本上的读数?

已经有一段时间了,底线是什么--这个方法是否有效?

 
mytarmailS:

决定看看典型的 数据会是什么样子,用于训练NS的3D))

数据是31个指标,目标是一个 "之 "字形。

我用三种算法将维度降低到三个维度--PCA、T-SNE、UMAP(后两种被认为是最先进的 算法)。


它到底是什么 -https://en.wikipedia.org/wiki/Dimensionality_reduction

how it can help -https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%BE%D0%BA%D0%BB%D1%8F%D1%82%D0%B8%D0%B5_%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%80%D0%BD%D0%BE%D1%81%D1%82%D0%B8


因此,数据31指标的目标人字形,首先我们有PCA

你能不能把脚本贴出来,以便像我这样的傻瓜也能在他们的样本上看到这么好的图片?

 
mytarmailS:

我有个想法,就是建立一个讨论目标函数的主题,甚至不是讨论,而是建立一个不同类型的目标函数的数据库,并对其进行统计,什么有效,什么根本无效。

你认为有人需要它吗?

这个想法很好,但除了想法之外,在MQL中打开代码也很有用--结果就是一个库。

如果连密码都没有,那么至少也是一种复制的文字算法。


1.使用日内数据预测最高日价格(回归)。

通过前几天的内部数据或白天的数据--如果是后者,那么到一天结束时,误差会简单地减少。

如果在某个时间点上,样本会比较小。


2.在哪个级别的故障会出现过度波动(回归+分类)。

我甚至不知道什么是超级波动性,但我认为这只是关于趋势与否?

如果有很多层次,就会有很多类,这意味着比二元分类的误差要高得多。

唯一的办法是为每个级别使用不同的模型...


2.利用日内数据 预测每日反转的时间(分类)。

它与最高价的预测基本相同--同样的问题。


3.如果第一支蜡烛是黑色的,第三支会是白色的吗?(分类)

这应该非常简单--我们可以试试。


4.标出支撑 和阻力水平,并预测将发生扑灭/突破的水平(分类)。

与第二句中的问题相同。


5.预测指标在任何确定的时间点的最佳时期(回归)。

这很有意思,当然,把使用指标的目的转到了里面。

 
阿列克谢-维亚兹米 金。

已经过去很长时间了,结果如何--这个方法到底行不行?

是的,我自己也不明白,我想是这样的,试着去弄一些类似的东西。


有标志x1、x2、x3和目标 "Y"。

对属性进行预测

"Y_x1[i+1]" ~ x1+x2+x3

"U_x2[i+1]" ~ x1+x2+x3

"U_x3[i+1]" ~ x1+x2+x3

并添加到模型中

x1,x2,x3"U_x1" + " U_x2"+"U_x2" 和目标 "U"

现在有6个标志。


Aleksey Vyazmikin:

你能不能把脚本贴出来,以便像我这样的傻瓜能在他们的样品上看到这么好的图片?

我已经把它擦掉了,想象一下很有趣,放纵一下......但我不知道你是否完全需要它......如果你需要它,我可以再写一遍,对吗?


Aleksey Vyazmikin:

这个想法很好,但除了想法之外,在MQL中打开代码也很有用--结果就是一个库。

如果连密码都没有,那么至少也是一种复制的文字算法。

如果我想说明有数百万种预测方法,我对一种方法感到厌烦--要么是二进制(向上/向下),要么是增量,仅此而已!这就是我的预测。他们都不工作,但他们都厌恶它!)

 
mytarmailS:

我自己也不明白,我想是的,试着在你那里烤出类似的东西。


有标志x1、x2、x3和目标 "Y"。

预测征兆

"Y_x1[i+1]" ~ x1+x2+x3

"U_x2[i+1]" ~ x1+x2+x3

"Y_x3[i+1]" ~ x1+x2+x3

并添加到模型中

x1,x2,x3"U_x1" + " U_x2"+"U_x2" 和目标 "U"

现在有六个标志。

是的,我将尝试我的方法,但看起来还是会做得很慢--很多组合。

其中有多少是在R上完成的,有多少采样?

mytarmailS:

我已经把它擦掉了,可视化很有趣,只是为了好玩......但我不知道我是否完全需要它......如果你真的需要它,我可以再写一遍,对吗?

这将是很有趣的事情--只要多写些什么,如何把库的内容写出来,就可以了。在剧本中还有更多评论。可定制的分隔符和选择有目标的列,也可排除列:)

顺便说一下,你可以在循环中对不同的列组进行下拉,看看这些视觉模型将如何变化,然后就可以实现图片的保存了。

mytarmailS:

是的,我写了所有这些选项,只是为了表明有数以百万计的方法来预测,然后都坚持一个或二进制(向上/向下)或增量,就是这样!!我厌倦了它......这两种方法都不奏效,但大家都开始厌恶它们了 )

数以百万计的人...

试试我的方法--1或-1--相反的矢量ZZ通道唐山已经越过了矢量变化点。在矢量变化时进入,在相反的通道上拖网,0--不进入市场--持平。如果有40%的分类准确率为1和-1,就会有利润。

从简单的说,我想实现一个原始的目标,以1k3的风险点或任何给定的风险点来标记正确的进入--不同风险的合奏可能会在总体上给出好的结果,但这是理论上的。

因此,当然,人们必须考虑到不同的目标。

 
Aleksey Vyazmikin:

是的,我将尝试我的方法,但看起来还是会做得很慢--很多组合。

这其中有多少是在R中完成的,有多少采样?

用矢量化的方式非常快,但当我写了一个检查器,让它按一栏计数时,它就慢了,但还是很容易接受。

阿列克谢-维亚兹米 金。

这将是很有趣的事情--请写下什么和如何使用图书馆,就可以了。在剧本中还有更多评论。可定制的分隔符和选择有目标的列,也可排除列:)

好的,给我发一个带有你的属性和目标的文件,以你将扔进P文件的格式,我将试着使它开箱工作。

不是一个大文件,请用1000行来表示

请记住这只是一个玩具,只是为了可视化,如果你想检查模型/标志,最好是愚蠢地看到测试上的错误,那就更好了)
 
mytarmailS:

有了矢量化,它的速度非常快,但当我写了一个检查器,让它一次算一个小节时,它的速度就慢了,但还是很好接受。

嗯,有意思--如果你认为你可以,就把脚本扔掉,它可能真的很有用。现在我正在制作一个非常大的新预测器库,需要以某种方式寻找它们之间的联系--协同作用,也许其中的大部分将不得不被扔掉......

mytarmailS:

好的,把带有你的特征和目标的文件发给我,以你将扔进P文件的格式,我将尝试使它开箱工作。

只要不是大文件就好,1000行就够了。

问题是,格式可以改变 - 所以不要吝惜评论 :)

一个更常用的变体,附加。

附加的文件:
 
mytarmailS:

时间还是忽略它?

忽略,以及最后一列的财务结果。时间是在预测器中。

 
Aleksey Vyazmikin:

忽略,以及最后一列的财务结果。时间是在预测器中。

是的是的,我已经看过了)

 

至于目标,我认为在没有办法改变输入数据的情况下应该改变,正如我在视频中所说。当数据被收集后,没有办法改变它。否则,如果你有各种输入变量,你应该采取默认目标,挖掘输入数据。

不要忘了,如果目标故意包含错误,而你得到了更好的训练结果,那么模型也会根据目标做出错误。IMHO