交易中的机器学习：理论、模型、实践和算法交易 - 页 1531

[删除] 2019.09.16 20:54 #15301

Aleksey Vyazmikin 2019.09.16 22:39 #15302

[删除] 2019.09.16 22:56 #15303

Aleksey Vyazmikin 2019.09.17 08:40 #15304

[删除] 2019.09.17 09:22 #15305

Aleksey Vyazmikin 2019.09.17 09:40 #15306

[删除] 2019.09.17 09:52 #15307

Aleksey Nikolayev 2019.09.17 10:03 #15308

Aleksey Vyazmikin 2019.09.17 10:04 #15309

[删除] 2019.09.17 10:15 #15310
我的意思是完全是新的数据，是不同的历史片段。在火车上应该是这样的，但考试却让人困惑。也许测试者在什么地方偷看了。
我在我的森林上得到0.6-0.7的误差，数据大致相同，在trayne上也是如此，而且测试结果不一定好，几乎总是比trayne差。提升中的误差是差不多的，但测试是非常好的，它不会发生。你做得怎么样，你在叶子上有什么进展吗？
好吧，那我就不知道了--没有取样就很难知道什么是错的。
我的结果并没有让我非常高兴。我已经收集了相当数量的树叶，但随之而来的问题是如何最好地使它们相互配合。 问题是，它们经常相互重叠20%-50%或更多，因此，事实证明，给出相同的信号，这并不是很好。我们的想法是将它们分组，并为每组做一个激活的阈值--所以我思考了最好的方法。
到目前为止，我正在进行相互过滤的实验--我在R中对树的叶子进行了训练，但到目前为止，只对买入进行了训练。
第一张没有树的截图，第二张有树的截图。时间是今年的3月至9月。
当然，平衡曲线不是很有吸引力，但它是一种趋势策略，其本质是在平淡期不要损失超过你的收入，而市场（思）全年都是平淡的，很少有强势的波动。我可以看到，增加一棵树已经改善了相对指标，我以后也会为销售做同样的事情，如果结果是积极的，它将成为模型的一部分。
直到最后都没有解决选择叶子的问题，即使选择在5年中每一年都显示出良好效果的叶子，也可以预期20%-40%停止工作，更可悲的是无法理解是否关闭它们--特别是按季度做了测试，结果发现过去季度不赚钱的叶子与随后季度的损失（很多）相重叠。
选叶的方法本身似乎很有希望，但过程非常缓慢。
是的，问题是每个叶子信号分配1手，分别是，如果很多叶子激活，那么需要更多的手 - 有71手，但非常少，如果你把钱一直保持在71手，那么总数将得到每年25% - 交易所的GO是大的，它是斯。
关于去除无利可图的--这是一把双刃剑--一方面可以增加过滤器的数量，这将减少亏损交易的数量，但同时也会减少有利可图的交易数量，正如我上面写的，许多叶子在一年中变得有利可图，所以这是一个时间问题，一个市场条件问题。这种方法的问题是，它是非常劳动密集型的，没有可能及时添加新的预测因子，而我有这种想法，并且经常出现这种想法--我现在实际上是在用今年2月的样本工作。
改善指标的另一个方法，是在获利方面下功夫--目前平仓主要是通过止损和一个条件--在极少数情况下完成。
尽管有种种弊端，但该系统近一年来没有亏损，这可能表明方向正确。
可以在第一个模型的基础上，在相同的特征上训练第二个模型。但是，它只是纠正权益类条目，也就是说，它将禁止/允许交易。至少不会有不必要的交易。
或者类似于系统列表组合的滑动重新计算的东西。
我不太明白你建议如何改变目标--现在我已经有3个目标--买入/卖出/不交易。而且，我选择要买/卖的床单，然后给每个这样的床单寻找一个 "不交易 "的过滤器，多达3件（对有些人来说是足够的，对有些人来说是不够的 - 进行测试）。在这些对的结果之后--激活叶+过滤叶，我根据最终的信号建立了一棵树，它考虑到了所有叶子的反应和它们的相互排斥，即我得到了额外的过滤器。
这里有一棵树
我想尝试在CB上建立模型，而不是在树上，也许那里对所有使用的叶子的概括性会更好，虽然准确性增加了1%，这并不多，但结果是积极的。
那么，你应该从理论开始。例如，为销售和购买分别选择模型有什么意义？
一切不用于购买的东西都用于出售，反之亦然。这就是为什么我们需要一个普通的二进制分类器。此外，如果我们这样做，为什么我们需要一个单独的 "不交易 "类，因为你可以简单地通过一个更高的阈值过滤条目。不交易 "类可以被模型赋予过多的权重，由于这个原因，模型误差会减少，预测（概括）能力，一般来说，会下降。
第二个模型的意义在于，第1个模型会有第1类和第2类的错误--假阳性和假阴性。我们有兴趣清除它们。为了做到这一点，你把相同的特征输入到第二个模型的输入和第一个模型的输出，其中0 - 交易是盈利的，1 - 交易是亏损的。训练第二个分类器，只在它显示为0时进行交易，即过滤第一个模型的信号。亏损交易几乎会在托盘上消失，你必须在测试上进行测试--这就是一个。
你不仅可以在托盘上训练第二个模型，还可以捕捉OOS，然后它将在新数据上纠正交易--这就是两个。然后是测试。你可以将样本分割成犯规，以棋盘式的顺序，通过某些块状物来教授这些模型。例如，5次犯规。第一个模型是在1,3,4次犯规的情况下一次性训练的。2,5上的第二个矫正模型。这将进一步提高概括性。