交易中的机器学习:理论、模型、实践和算法交易 - 页 1537

 
马克西姆-德米特里耶夫斯基

争论?

需要哪些参数--参数6是默认的,它来自于设置

这很奇怪,因为树的深度更多地取决于预测因子之间的完整链接,这就是为什么我很惊讶,从这两个独立的链接,总复杂度在200左右,你得到一个好的模型,从图上看。

 
阿列克谢-维亚兹米 金。

需要哪些参数--参数6是默认的,它来自于设置

这很奇怪,因为树的深度更多地取决于预测因子之间的完整链接,所以从图上看,这两个总复杂度约为200的独立链接竟然能做出一个好的模型。

这就是为什么我说数据已经出来了。森林对它们进行了重新训练(也许可以通过对特征的分类,得到修复森林的这个特征)。 现在把6--重新训练的小路进行得很好,acurasi低于0.9。

6美元对我来说太多,2-4美元是正常的。

与森林的类比是直截了当的,树木的深度是没有限制的
 
马克西姆-德米特里耶夫斯基

这就是为什么我说,数据被拿出来了。森林对它们进行了重新训练(也许可以通过对特征进行分类,解决森林的这一特点)。现在把6--重新训练的小路走得可观,acurasi在0.9以下。

6个为我的太多,2-4个正常去了

与森林的类比是直截了当的,那里的树木深度不受限制。

我不明白,你之前说你有增量形式的预测因子,那么你想怎么把它们变成分类的预测因子?

很多东西并没有从本质上改变树的表现形式--我剖析过树,有很多单独的树叶只是本质上结合成一个长长的叶子,而这些叶子中有很大一部分是重复的,或者有无意义的中间值/链接,可以修剪掉。一般来说,我在我的样本上看到,树的深度会影响到树的数量,你可以在4个分叉的树上得到同样的结果。

 
阿列克谢-维亚兹米 金。

我不明白,你刚才说你有增量形式的预测因子,那么你想怎么把它们变成分类预测因子?

很多东西并没有从本质上改变树的表现形式--我剖析过树,有很多单独的树叶只是本质上结合成一个长长的叶子,而这些叶子中有很大一部分是重复的,或者有无意义的中间值/链接,可以修剪掉。一般来说,我在我的样本上看到,树的深度会影响到树的数量,你可以在4个分叉的树上得到同样的结果。

首先分成类别,例如20个范围-类别。然后是vanchot编码(通过虚拟属性)或其他什么,目前还没有决定。最后,每个特征将是二进制或类似的东西。

森林的不同值越多,过度训练就越多。随着训练样本的增加,过度训练的情况也会增加。对于catbust来说,它并没有。因此,对于森林来说,尽量通过分类来减少连续特征的选择数量。我不知道这是否会有帮助,我们会看到。

我不知道这是否能救你,让我们看看。

 
马克西姆-德米特里耶夫斯基

首先把它分成几类,比如说20个等级。然后是vanchot编码(通过虚拟属性)或其他东西,我还没有决定。 最后每个特征将是二进制或类似的东西。

我不知道,这更多的是为了加快数据处理的速度,不要把这样的预测器碎片化,不要在一个叶子链中相互比较,我还没有看到任何值得的效果,很遗憾。而其逻辑是,这不是可比较的价值,是凡客诚品组合成的一组,以便均衡随机选择。

马克西姆-德米特里夫斯基
,一个森林的不同值越多,过度训练就越多。随着训练样本的增加,过度训练也会增加。而猫扑则没有。

样本对那里的培训的依赖性也不明确--我做了半年或更早的类似研究。更有可能的是对数据的依赖性,这应该是可比较的。

 
马克西姆-德米特里耶夫斯基

关于如何描述国防部模式的一个简单而有趣的方法

https://www.quanttrader.com/index.php/a-simple-algorithm-to-detect-complex-chart-patterns/KahlerPhilipp2019

巨型直观,有更准确的方法来描述一个模式

 
mytarmailS:

巨型直观,有一些方法可以更准确地描述这个模式

像什么?

 
Alexander_K:
我加入了那些受苦的人的恳求中。我低头问道,希望能与圣杯有联系。
Alexander_K:

我愿意为圣杯支付一个合理的金额,在真实上确认(测试报告我不感兴趣),至少3个月的工作。

我认为,圣杯的真正价值=交易者目前的权益之和。也就是说,账户上有1000美元的资产,所以TS的价值是相同的。如果我对圣杯的使用是基于神经网络技术和/或物理和数学模型,真实的统计数据和出售意愿,请不要犹豫,与我联系,我们将讨论。

真正在市场上赚钱的人不会以数百万美元的价格出售他们的技术,也许是数亿美元......。也就是说,如果有人给他们一个软件 "黑匣子",做出好的预测或现成的信号,他们每月需要10-30美元的数据,执行质量甚至比数据还贵,这就像把一个在沙箱里的孩子和一个挖金矿的公司相比,孩子想用瓢挖金子,但他做不到...也许是不同的镘刀? 问问幼儿园里的其他孩子,谁有这样的铲子?最有可能的是有人会有一个。 孩子们往往是梦想家:)

 
阿列克谢-维亚兹米 金。

我不知道,这更多的是为了加快数据处理速度,不拆分这样的预测器,不在同一叶链中相互比较,我没有看到任何有价值的效果,很遗憾。而逻辑是,这些不是可比较的价值,它们是vanchot编码的组合,以平衡随机选择。

样本对那里的学习的依赖性也是不明确的--我做过半年或更早的类似研究。更有可能的是对数据的依赖性,这应该是可比较的。

那篇英文文章就是关于这一点的,是的,当有很多变量时,不要把一个变量的值相互比较,这只会导致过度训练。

也许不是长度的问题,是其他的问题,我告诉你我看到的情况。我增加了取样--它在特雷恩上变得更漂亮,在测试上更糟糕。虽然概括性应该随着盘子大小的增加而上升,但在森林中却反其道而行之。

 
马克西姆-德米特里耶夫斯基

如?

dtw,频谱分析...一堆...

我设法创建了一个算法,知道如何看到相同的模式,无论其大小,所以该算法看一个图表,看到一分钟和一周 的图表上的模式,只看一个图表,它可能会做出真正的预测,但我仍然有很多工作。

原因: