交易中的机器学习:理论、模型、实践和算法交易 - 页 1917 1...191019111912191319141915191619171918191919201921192219231924...3399 新评论 Aleksey Vyazmikin 2020.07.26 13:08 #19161 mytarmailS: 是的,它应该和其他人一样)想法是修改特征,训练模型,看看新数据会发生什么。我们如何与普通模型一起工作? 我们只是给X1,X2,X3,....x20,这就结束了。我在最后一个脚本中所做的是,- 0.82我把所有31个指标作为预测因素。然后我把他们的预测作为二阶预测,然后我从预测中提取预测,如此反复11次,直到误差下降,我得到0.82,而不是0.7。我不知道我在哪里出了错(( 这个想法是完全正确的,允许生成基本的预测器,但有两个微妙之处。 1.结果的可重复性--将需要进行某种额外的转换--处理后我们得到什么--一个新的表格? 2.有必要检查采样期的规律性--正确的分类会在不同的地点,而且在我所知的任何训练模型中都没有实现,这是非常糟糕的。 由于我的大部分预测因子在本质上是分类的,我想尝试通过&&预连接统计意义上的预测因子的范围来生成预测因子。 关于这个错误,它是落在一个以前未知的样本上,还是落在一个测试样本上?也许脚本在生成新规则时考虑到了测试样本上的读数? 已经有一段时间了,底线是什么--这个方法是否有效? Aleksey Vyazmikin 2020.07.26 13:13 #19162 mytarmailS: 决定看看典型的 数据会是什么样子,用于训练NS的3D))数据是31个指标,目标是一个 "之 "字形。我用三种算法将维度降低到三个维度--PCA、T-SNE、UMAP(后两种被认为是最先进的 算法)。它到底是什么 -https://en.wikipedia.org/wiki/Dimensionality_reductionhow it can help -https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%BE%D0%BA%D0%BB%D1%8F%D1%82%D0%B8%D0%B5_%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%80%D0%BD%D0%BE%D1%81%D1%82%D0%B8因此,数据31指标的目标人字形,首先我们有PCA 你能不能把脚本贴出来,以便像我这样的傻瓜也能在他们的样本上看到这么好的图片? Aleksey Vyazmikin 2020.07.26 13:28 #19163 mytarmailS: 我有个想法,就是建立一个讨论目标函数的主题,甚至不是讨论,而是建立一个不同类型的目标函数的数据库,并对其进行统计,什么有效,什么根本无效。你认为有人需要它吗? 这个想法很好,但除了想法之外,在MQL中打开代码也很有用--结果就是一个库。 如果连密码都没有,那么至少也是一种复制的文字算法。 1.使用日内数据预测最高日价格(回归)。 通过前几天的内部数据或白天的数据--如果是后者,那么到一天结束时,误差会简单地减少。 如果在某个时间点上,样本会比较小。 2.在哪个级别的故障会出现过度波动(回归+分类)。 我甚至不知道什么是超级波动性,但我认为这只是关于趋势与否? 如果有很多层次,就会有很多类,这意味着比二元分类的误差要高得多。 唯一的办法是为每个级别使用不同的模型... 2.利用日内数据 预测每日反转的时间(分类)。 它与最高价的预测基本相同--同样的问题。 3.如果第一支蜡烛是黑色的,第三支会是白色的吗?(分类) 这应该非常简单--我们可以试试。 4.标出支撑 和阻力水平,并预测将发生扑灭/突破的水平(分类)。 与第二句中的问题相同。 5.预测指标在任何确定的时间点的最佳时期(回归)。 这很有意思,当然,把使用指标的目的转到了里面。 mytarmailS 2020.07.26 13:57 #19164 阿列克谢-维亚兹米 金。 已经过去很长时间了,结果如何--这个方法到底行不行? 是的,我自己也不明白,我想是这样的,试着去弄一些类似的东西。 有标志x1、x2、x3和目标 "Y"。 对属性进行预测 "Y_x1[i+1]" ~ x1+x2+x3 "U_x2[i+1]" ~ x1+x2+x3 "U_x3[i+1]" ~ x1+x2+x3 并添加到模型中 x1,x2,x3"U_x1" + " U_x2"+"U_x2" 和目标 "U" 现在有6个标志。 Aleksey Vyazmikin: 你能不能把脚本贴出来,以便像我这样的傻瓜能在他们的样品上看到这么好的图片? 我已经把它擦掉了,想象一下很有趣,放纵一下......但我不知道你是否完全需要它......如果你需要它,我可以再写一遍,对吗? Aleksey Vyazmikin: 这个想法很好,但除了想法之外,在MQL中打开代码也很有用--结果就是一个库。如果连密码都没有,那么至少也是一种复制的文字算法。 如果我想说明有数百万种预测方法,我对一种方法感到厌烦--要么是二进制(向上/向下),要么是增量,仅此而已!这就是我的预测。他们都不工作,但他们都厌恶它!) Aleksey Vyazmikin 2020.07.26 15:45 #19165 mytarmailS: 我自己也不明白,我想是的,试着在你那里烤出类似的东西。有标志x1、x2、x3和目标 "Y"。预测征兆"Y_x1[i+1]" ~ x1+x2+x3"U_x2[i+1]" ~ x1+x2+x3"Y_x3[i+1]" ~ x1+x2+x3并添加到模型中x1,x2,x3"U_x1" + " U_x2"+"U_x2" 和目标 "U"现在有六个标志。 是的,我将尝试我的方法,但看起来还是会做得很慢--很多组合。 其中有多少是在R上完成的,有多少采样? mytarmailS: 我已经把它擦掉了,可视化很有趣,只是为了好玩......但我不知道我是否完全需要它......如果你真的需要它,我可以再写一遍,对吗? 这将是很有趣的事情--只要多写些什么,如何把库的内容写出来,就可以了。在剧本中还有更多评论。可定制的分隔符和选择有目标的列,也可排除列:) 顺便说一下,你可以在循环中对不同的列组进行下拉,看看这些视觉模型将如何变化,然后就可以实现图片的保存了。 mytarmailS: 是的,我写了所有这些选项,只是为了表明有数以百万计的方法来预测,然后都坚持一个或二进制(向上/向下)或增量,就是这样!!我厌倦了它......这两种方法都不奏效,但大家都开始厌恶它们了 ) 数以百万计的人... 试试我的方法--1或-1--相反的矢量ZZ通道唐山已经越过了矢量变化点。在矢量变化时进入,在相反的通道上拖网,0--不进入市场--持平。如果有40%的分类准确率为1和-1,就会有利润。 从简单的说,我想实现一个原始的目标,以1k3的风险点或任何给定的风险点来标记正确的进入--不同风险的合奏可能会在总体上给出好的结果,但这是理论上的。 因此,当然,人们必须考虑到不同的目标。 mytarmailS 2020.07.26 16:01 #19166 Aleksey Vyazmikin: 是的,我将尝试我的方法,但看起来还是会做得很慢--很多组合。这其中有多少是在R中完成的,有多少采样?用矢量化的方式非常快,但当我写了一个检查器,让它按一栏计数时,它就慢了,但还是很容易接受。阿列克谢-维亚兹米 金。 这将是很有趣的事情--请写下什么和如何使用图书馆,就可以了。在剧本中还有更多评论。可定制的分隔符和选择有目标的列,也可排除列:)好的,给我发一个带有你的属性和目标的文件,以你将扔进P文件的格式,我将试着使它开箱工作。不是一个大文件,请用1000行来表示 请记住这只是一个玩具,只是为了可视化,如果你想检查模型/标志,最好是愚蠢地看到测试上的错误,那就更好了) Aleksey Vyazmikin 2020.07.26 16:13 #19167 mytarmailS: 有了矢量化,它的速度非常快,但当我写了一个检查器,让它一次算一个小节时,它的速度就慢了,但还是很好接受。 嗯,有意思--如果你认为你可以,就把脚本扔掉,它可能真的很有用。现在我正在制作一个非常大的新预测器库,需要以某种方式寻找它们之间的联系--协同作用,也许其中的大部分将不得不被扔掉...... mytarmailS: 好的,把带有你的特征和目标的文件发给我,以你将扔进P文件的格式,我将尝试使它开箱工作。只要不是大文件就好,1000行就够了。 问题是,格式可以改变 - 所以不要吝惜评论 :) 一个更常用的变体,附加。 附加的文件: Test_Pred_2019.zip 94 kb Aleksey Vyazmikin 2020.07.26 16:28 #19168 mytarmailS: 时间还是忽略它? 忽略,以及最后一列的财务结果。时间是在预测器中。 mytarmailS 2020.07.26 16:29 #19169 Aleksey Vyazmikin: 忽略,以及最后一列的财务结果。时间是在预测器中。 是的是的,我已经看过了) Mihail Marchukajtes 2020.07.26 16:34 #19170 至于目标,我认为在没有办法改变输入数据的情况下应该改变,正如我在视频中所说。当数据被收集后,没有办法改变它。否则,如果你有各种输入变量,你应该采取默认目标,挖掘输入数据。 不要忘了,如果目标故意包含错误,而你得到了更好的训练结果,那么模型也会根据目标做出错误。IMHO 1...191019111912191319141915191619171918191919201921192219231924...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
是的,它应该和其他人一样)想法是修改特征,训练模型,看看新数据会发生什么。
我们如何与普通模型一起工作? 我们只是给X1,X2,X3,....x20,这就结束了。
我在最后一个脚本中所做的是,- 0.82
我把所有31个指标作为预测因素。
然后我把他们的预测作为二阶预测,然后我从预测中提取预测,如此反复11次,直到误差下降,我得到0.82,而不是0.7。
我不知道我在哪里出了错((
这个想法是完全正确的,允许生成基本的预测器,但有两个微妙之处。
1.结果的可重复性--将需要进行某种额外的转换--处理后我们得到什么--一个新的表格?
2.有必要检查采样期的规律性--正确的分类会在不同的地点,而且在我所知的任何训练模型中都没有实现,这是非常糟糕的。
由于我的大部分预测因子在本质上是分类的,我想尝试通过&&预连接统计意义上的预测因子的范围来生成预测因子。
关于这个错误,它是落在一个以前未知的样本上,还是落在一个测试样本上?也许脚本在生成新规则时考虑到了测试样本上的读数?
已经有一段时间了,底线是什么--这个方法是否有效?
决定看看典型的 数据会是什么样子,用于训练NS的3D))
数据是31个指标,目标是一个 "之 "字形。
我用三种算法将维度降低到三个维度--PCA、T-SNE、UMAP(后两种被认为是最先进的 算法)。
它到底是什么 -https://en.wikipedia.org/wiki/Dimensionality_reduction
how it can help -https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%BE%D0%BA%D0%BB%D1%8F%D1%82%D0%B8%D0%B5_%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%80%D0%BD%D0%BE%D1%81%D1%82%D0%B8
因此,数据31指标的目标人字形,首先我们有PCA
你能不能把脚本贴出来,以便像我这样的傻瓜也能在他们的样本上看到这么好的图片?
我有个想法,就是建立一个讨论目标函数的主题,甚至不是讨论,而是建立一个不同类型的目标函数的数据库,并对其进行统计,什么有效,什么根本无效。
你认为有人需要它吗?
这个想法很好,但除了想法之外,在MQL中打开代码也很有用--结果就是一个库。
如果连密码都没有,那么至少也是一种复制的文字算法。
1.使用日内数据预测最高日价格(回归)。
通过前几天的内部数据或白天的数据--如果是后者,那么到一天结束时,误差会简单地减少。
如果在某个时间点上,样本会比较小。
2.在哪个级别的故障会出现过度波动(回归+分类)。
我甚至不知道什么是超级波动性,但我认为这只是关于趋势与否?
如果有很多层次,就会有很多类,这意味着比二元分类的误差要高得多。
唯一的办法是为每个级别使用不同的模型...
2.利用日内数据 预测每日反转的时间(分类)。
它与最高价的预测基本相同--同样的问题。
3.如果第一支蜡烛是黑色的,第三支会是白色的吗?(分类)
这应该非常简单--我们可以试试。
4.标出支撑 和阻力水平,并预测将发生扑灭/突破的水平(分类)。
与第二句中的问题相同。
5.预测指标在任何确定的时间点的最佳时期(回归)。
这很有意思,当然,把使用指标的目的转到了里面。
已经过去很长时间了,结果如何--这个方法到底行不行?
是的,我自己也不明白,我想是这样的,试着去弄一些类似的东西。
有标志x1、x2、x3和目标 "Y"。
对属性进行预测
"Y_x1[i+1]" ~ x1+x2+x3
"U_x2[i+1]" ~ x1+x2+x3
"U_x3[i+1]" ~ x1+x2+x3
并添加到模型中
x1,x2,x3"U_x1" + " U_x2"+"U_x2" 和目标 "U"
现在有6个标志。
你能不能把脚本贴出来,以便像我这样的傻瓜能在他们的样品上看到这么好的图片?
我已经把它擦掉了,想象一下很有趣,放纵一下......但我不知道你是否完全需要它......如果你需要它,我可以再写一遍,对吗?
这个想法很好,但除了想法之外,在MQL中打开代码也很有用--结果就是一个库。
如果连密码都没有,那么至少也是一种复制的文字算法。
如果我想说明有数百万种预测方法,我对一种方法感到厌烦--要么是二进制(向上/向下),要么是增量,仅此而已!这就是我的预测。他们都不工作,但他们都厌恶它!)
我自己也不明白,我想是的,试着在你那里烤出类似的东西。
有标志x1、x2、x3和目标 "Y"。
预测征兆
"Y_x1[i+1]" ~ x1+x2+x3
"U_x2[i+1]" ~ x1+x2+x3
"Y_x3[i+1]" ~ x1+x2+x3
并添加到模型中
x1,x2,x3"U_x1" + " U_x2"+"U_x2" 和目标 "U"
现在有六个标志。
是的,我将尝试我的方法,但看起来还是会做得很慢--很多组合。
其中有多少是在R上完成的,有多少采样?
我已经把它擦掉了,可视化很有趣,只是为了好玩......但我不知道我是否完全需要它......如果你真的需要它,我可以再写一遍,对吗?
这将是很有趣的事情--只要多写些什么,如何把库的内容写出来,就可以了。在剧本中还有更多评论。可定制的分隔符和选择有目标的列,也可排除列:)
顺便说一下,你可以在循环中对不同的列组进行下拉,看看这些视觉模型将如何变化,然后就可以实现图片的保存了。
是的,我写了所有这些选项,只是为了表明有数以百万计的方法来预测,然后都坚持一个或二进制(向上/向下)或增量,就是这样!!我厌倦了它......这两种方法都不奏效,但大家都开始厌恶它们了 )
数以百万计的人...
试试我的方法--1或-1--相反的矢量ZZ通道唐山已经越过了矢量变化点。在矢量变化时进入,在相反的通道上拖网,0--不进入市场--持平。如果有40%的分类准确率为1和-1,就会有利润。
从简单的说,我想实现一个原始的目标,以1k3的风险点或任何给定的风险点来标记正确的进入--不同风险的合奏可能会在总体上给出好的结果,但这是理论上的。
因此,当然,人们必须考虑到不同的目标。
是的,我将尝试我的方法,但看起来还是会做得很慢--很多组合。
这其中有多少是在R中完成的,有多少采样?
用矢量化的方式非常快,但当我写了一个检查器,让它按一栏计数时,它就慢了,但还是很容易接受。
这将是很有趣的事情--请写下什么和如何使用图书馆,就可以了。在剧本中还有更多评论。可定制的分隔符和选择有目标的列,也可排除列:)
好的,给我发一个带有你的属性和目标的文件,以你将扔进P文件的格式,我将试着使它开箱工作。
不是一个大文件,请用1000行来表示
请记住这只是一个玩具,只是为了可视化,如果你想检查模型/标志,最好是愚蠢地看到测试上的错误,那就更好了)有了矢量化,它的速度非常快,但当我写了一个检查器,让它一次算一个小节时,它的速度就慢了,但还是很好接受。
嗯,有意思--如果你认为你可以,就把脚本扔掉,它可能真的很有用。现在我正在制作一个非常大的新预测器库,需要以某种方式寻找它们之间的联系--协同作用,也许其中的大部分将不得不被扔掉......
好的,把带有你的特征和目标的文件发给我,以你将扔进P文件的格式,我将尝试使它开箱工作。
只要不是大文件就好,1000行就够了。
问题是,格式可以改变 - 所以不要吝惜评论 :)
一个更常用的变体,附加。
时间还是忽略它?
忽略,以及最后一列的财务结果。时间是在预测器中。
忽略,以及最后一列的财务结果。时间是在预测器中。
是的是的,我已经看过了)
至于目标,我认为在没有办法改变输入数据的情况下应该改变,正如我在视频中所说。当数据被收集后,没有办法改变它。否则,如果你有各种输入变量,你应该采取默认目标,挖掘输入数据。
不要忘了,如果目标故意包含错误,而你得到了更好的训练结果,那么模型也会根据目标做出错误。IMHO