交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2019.09.21 16:02 #15361

马克西姆-德米特里耶夫斯基。

争论？

需要哪些参数--参数6是默认的，它来自于设置表。

这很奇怪，因为树的深度更多地取决于预测因子之间的完整链接，这就是为什么我很惊讶，从这两个独立的链接，总复杂度在200左右，你得到一个好的模型，从图上看。

[删除] 2019.09.21 16:18 #15362

阿列克谢-维亚兹米 金。

需要哪些参数--参数6是默认的，它来自于设置表。

这很奇怪，因为树的深度更多地取决于预测因子之间的完整链接，所以从图上看，这两个总复杂度约为200的独立链接竟然能做出一个好的模型。

这就是为什么我说数据已经出来了。森林对它们进行了重新训练（也许可以通过对特征的分类，得到修复森林的这个特征）。现在把6--重新训练的小路进行得很好，acurasi低于0.9。

6美元对我来说太多，2-4美元是正常的。

与森林的类比是直截了当的，树木的深度是没有限制的

Aleksey Vyazmikin 2019.09.21 16:33 #15363

马克西姆-德米特里耶夫斯基。

这就是为什么我说，数据被拿出来了。森林对它们进行了重新训练（也许可以通过对特征进行分类，解决森林的这一特点）。现在把6--重新训练的小路走得可观，acurasi在0.9以下。

6个为我的太多，2-4个正常去了

与森林的类比是直截了当的，那里的树木深度不受限制。

我不明白，你之前说你有增量形式的预测因子，那么你想怎么把它们变成分类的预测因子？

很多东西并没有从本质上改变树的表现形式--我剖析过树，有很多单独的树叶只是本质上结合成一个长长的叶子，而这些叶子中有很大一部分是重复的，或者有无意义的中间值/链接，可以修剪掉。一般来说，我在我的样本上看到，树的深度会影响到树的数量，你可以在4个分叉的树上得到同样的结果。

[删除] 2019.09.21 16:36 #15364

阿列克谢-维亚兹米 金。

我不明白，你刚才说你有增量形式的预测因子，那么你想怎么把它们变成分类预测因子？

很多东西并没有从本质上改变树的表现形式--我剖析过树，有很多单独的树叶只是本质上结合成一个长长的叶子，而这些叶子中有很大一部分是重复的，或者有无意义的中间值/链接，可以修剪掉。一般来说，我在我的样本上看到，树的深度会影响到树的数量，你可以在4个分叉的树上得到同样的结果。

首先分成类别，例如20个范围-类别。然后是vanchot编码（通过虚拟属性）或其他什么，目前还没有决定。最后，每个特征将是二进制或类似的东西。

森林的不同值越多，过度训练就越多。随着训练样本的增加，过度训练的情况也会增加。对于catbust来说，它并没有。因此，对于森林来说，尽量通过分类来减少连续特征的选择数量。我不知道这是否会有帮助，我们会看到。

我不知道这是否能救你，让我们看看。

Aleksey Vyazmikin 2019.09.21 16:46 #15365

马克西姆-德米特里耶夫斯基。

首先把它分成几类，比如说20个等级。然后是vanchot编码（通过虚拟属性）或其他东西，我还没有决定。最后每个特征将是二进制或类似的东西。

我不知道，这更多的是为了加快数据处理的速度，不要把这样的预测器碎片化，不要在一个叶子链中相互比较，我还没有看到任何值得的效果，很遗憾。而其逻辑是，这不是可比较的价值，是凡客诚品组合成的一组，以便均衡随机选择。

马克西姆-德米特里夫斯基：
，一个森林的不同值越多，过度训练就越多。随着训练样本的增加，过度训练也会增加。而猫扑则没有。

样本对那里的培训的依赖性也不明确--我做了半年或更早的类似研究。更有可能的是对数据的依赖性，这应该是可比较的。

mytarmailS 2019.09.21 16:49 #15366

马克西姆-德米特里耶夫斯基。

关于如何描述国防部模式的一个简单而有趣的方法

https://www.quanttrader.com/index.php/a-simple-algorithm-to-detect-complex-chart-patterns/KahlerPhilipp2019

巨型直观，有更准确的方法来描述一个模式

[删除] 2019.09.21 16:50 #15367

mytarmailS:

巨型直观，有一些方法可以更准确地描述这个模式

像什么？

Грааль 2019.09.21 16:50 #15368

Alexander_K:

我加入了那些受苦的人的恳求中。我低头问道，希望能与圣杯有联系。

Alexander_K:

我愿意为圣杯支付一个合理的金额，在真实上确认（测试报告我不感兴趣），至少3个月的工作。

我认为，圣杯的真正价值=交易者目前的权益之和。也就是说，账户上有1000美元的资产，所以TS的价值是相同的。如果我对圣杯的使用是基于神经网络技术和/或物理和数学模型，真实的统计数据和出售意愿，请不要犹豫，与我联系，我们将讨论。

真正在市场上赚钱的人不会以数百万美元的价格出售他们的技术，也许是数亿美元......。也就是说，如果有人给他们一个软件 "黑匣子"，做出好的预测或现成的信号，他们每月需要10-30美元的数据，执行质量甚至比数据还贵，这就像把一个在沙箱里的孩子和一个挖金矿的公司相比，孩子想用瓢挖金子，但他做不到...也许是不同的镘刀？问问幼儿园里的其他孩子，谁有这样的铲子？最有可能的是有人会有一个。孩子们往往是梦想家：)

[删除] 2019.09.21 16:53 #15369

阿列克谢-维亚兹米 金。

我不知道，这更多的是为了加快数据处理速度，不拆分这样的预测器，不在同一叶链中相互比较，我没有看到任何有价值的效果，很遗憾。而逻辑是，这些不是可比较的价值，它们是vanchot编码的组合，以平衡随机选择。

样本对那里的学习的依赖性也是不明确的--我做过半年或更早的类似研究。更有可能的是对数据的依赖性，这应该是可比较的。

那篇英文文章就是关于这一点的，是的，当有很多变量时，不要把一个变量的值相互比较，这只会导致过度训练。

也许不是长度的问题，是其他的问题，我告诉你我看到的情况。我增加了取样--它在特雷恩上变得更漂亮，在测试上更糟糕。虽然概括性应该随着盘子大小的增加而上升，但在森林中却反其道而行之。

mytarmailS 2019.09.21 18:18 #15370

马克西姆-德米特里耶夫斯基。

如？

dtw，频谱分析...一堆...

我设法创建了一个算法，知道如何看到相同的模式，无论其大小，所以该算法看一个图表，看到一分钟和一周的图表上的模式，只看一个图表，它可能会做出真正的预测，但我仍然有很多工作。

交易中的机器学习：理论、模型、实践和算法交易 - 页 1537