交易中的机器学习：理论、模型、实践和算法交易

Replikant_mih 2022.03.30 12:00 #26051

Maxim Dmitrievsky#:

有一个这样的问题。

使用了两个模型。一个预测买或卖，另一个预测交易或不交易。

首先，第一个模型被训练出来，然后我们看看它在哪里预测得不好，把这些例子标记为 "不要交易"，其他好的例子标记为 "交易"，然后我们训练第二个模型。

第一个模型不仅在训练区进行测试，也在附加区进行测试，第二个模型在两个区域都进行了训练。

我们重复几次，在同一个数据集上重新训练两个模型。结果在样品上逐渐改善。但并不总是在对照样本上。

与此同时，我们还保留了一份所有通行证的不良交易累积日志，所有 "不交易 "的 "不良 "交易都被收集在其中，用于训练第二个模型，并根据一定的原则进行过滤，如所有通行证的不良交易副本越多，将其标记为 "不交易 "的机会就越大。

例如，对于每个日期的所有迭代训练，都会积累一些不良交易的数量，如果这个数量超过了一个阈值（平均值，平均数），这些交易就会被标记为 "不交易"。其余的交易被跳过，否则，如果有大量的训练迭代，就有可能排除所有的交易。

系数允许你调整输出端的交易数量，它越低，越多的交易被过滤掉。

...在这一点上，我已经厌倦了写...

如何改进这样的模型组合，使其在新的独立地块上改善其结果？
是否有任何哲学思想来解释为什么这可能有效？除了在每一圈的重新训练中，模型自然会相互改进（误差下降），但如何摆脱拟合？

有趣的概念!

1.如何摆脱装修。我对迭代的理解不多。为什么你不能只训练一次过滤（第二个）模型，然后评估它是否改善/不改善第一个模型的性能。你可以直接过滤信号1到2，或将输出2送入输入1。

2. 如何改进。
2.1.你可以尝试把交易后的标记做成一个集群标记。当然，不良信号堆积如山。还有那些好的。我们对集群进行标记。我们可以通过交易方式（根据条目/候选人的筹码）进行培训，目标定位--发现自己处于好的或坏的集群中。或者你可以按聚类训练（按聚类训练的筹码，一个训练样本对象--聚类），目标--要么相同（好的或坏的聚类中的下一个蜡烛），要么下一个聚类--好的或坏的（嗯，本质上可能是一样的）。
2.2.这些模型的特征描述可能应该不同，否则我认为第二个模型的边际效用会很低。

3.概念背后的哲学。谁需要它，模型的效率，利润是标尺。实验是主宰，而不是哲学）。

[删除] 2022.03.30 12:13 #26052

Replikant_mih#:

有趣的概念!

1.如何摆脱配件的束缚。我对迭代的理解不多。为什么你不能只训练一次过滤（第二个）模型，然后评估它是否改善/不改善第一个模型的性能。你可以直接过滤信号1到2，或者将输出2送入输入1。

2. 如何改进。
2.1.你可以尝试把交易后的标记做成一个集群标记。当然，不良信号堆积如山。还有那些好的。我们对集群进行标记。我们可能会以交易的方式进行训练（根据条目/技巧的筹码），针对--发现自己处于好的或坏的群组中。或者你可以按集群进行训练（按集群进行筹码训练，一个训练样本对象--集群），目标--要么相同（好的或坏的集群中的下一个蜡烛），要么下一个集群--好的或坏的（嗯，本质上可能是一样的）。
2.2.这些模型的特征描述可能应该不同，否则我认为第二个模型的边际效用会很低。

3.概念背后的哲学。谁需要它，模型的效率，利润是标尺。实验的规则，而不是哲学）。

我们想提高第一个模型（也包括第二个模型）的可推广性。如果我们简单地用第二个模型过滤掉她的信号，第一个模型的分类误差就不会在其内部减少。因此，我们在数据集上运行两个训练有素的模型，并从第一个模型的训练中删除坏的例子，这样误差就会变小。而第二条的错误也下降了。就这样，我们重复了好几遍。它应该每次都会变得更好。但我希望它每次都能在测试样本上变得更好，但有很大的差异。

所以我想我还应该在那里添加什么，可能一些反思也是不错的 :)

Aleksei Kuznetsov 2022.03.30 12:57 #26053

Maxim Dmitrievsky#:

我们想提高第一个模型（也包括第二个模型）的普遍性。如果我们简单地用第二个模型过滤掉它的信号，第一个模型的分类误差就不会在内部减少。因此，我们在数据集上运行两个训练有素的模型，并从第一个模型的训练中删除坏的例子，这样误差就会变小。而第二条的错误也下降了。就这样，我们重复了好几遍。它应该每次都会变得更好。但我希望它每次都能在测试样本上变得更好，但有很大的差异。

我在想我还应该在那里添加什么，也许只是一些想法可能也会起作用 :)

你确定你需要2个模型，而且它们会改善反馈的结果吗？
你可以不通过0.5，而是通过0.3和0.7，甚至0.1和0.9来确定第一个模型的边界--因此，低概率的交易将被淘汰，它们的数量将减少，模型将只有1。

Доктор 2022.03.30 13:09 #26054

Aleksey Nikolayev#:

不要误会我的意思...因此，我更愿意把它建立在可验证的断言上。

不要误会我的意思。我只是指出了你的逻辑结构的不准确性："市场上没有长放算法，否则迟早会成为市场上唯一剩下的算法"。我向你展示了他们到底存在于哪个利基市场。为什么他们孤立地存在于那里，而不是占领整个市场。并举了一个可核实的例子。

Об авторе | QuantAlgos

www.quantalgos.ru

Приветствую вас в моем блоге. Меня зовут Виталий, занимаюсь написанием биржевых роботов c 2008 года. В 2009 и 2010 гг. участвовал в конкурсе ЛЧИ (лучший частный инвестор) под ником robot_uralpro, проводимом биржей РТС (сейчас Московская биржа). Использовались HFT роботы, написанные на C#. Результаты были следующие: В настоящее время продолжаю...

[删除] 2022.03.30 13:19 #26055

elibrarius#:
你确定你需要2个模型，并且它们会改善OOS的结果吗？
你可以不通过0.5，而是通过0.3和0.7，甚至0.1和0.9来确定第一个模型的边界--这样一来，低概率的交易就会被淘汰，它们的数量就会减少，模型就只有1。

2有更多的灵活性，这些概率是...只是交易的数量减少了，稳定性却没有。

Aleksei Kuznetsov 2022.03.30 13:27 #26056

Maxim Dmitrievsky#:

有了2个更大的灵活性，这些概率是...只是交易的数量减少了，稳定性却没有。

你也没有2的稳定性......

Aleksey Nikolayev 2022.03.30 13:29 #26057

博士#:

不要误会我的意思。我只是指出了你的逻辑结构的不准确性："市场上没有长放算法，否则迟早会成为市场上唯一剩下的算法"。我向你展示了他们到底存在于哪个利基市场。为什么它们孤立地存在于那里，却没有占领整个市场。并举了一个可核实的例子。

验证某一声明的实际存在并不意味着验证其内容。

即使我们假设（尽管这可能而且经常有问题）有人年复一年地稳定赚钱，但根本不清楚如何证明这是由同一算法完成的，甚至不知道是什么样子。除了 "相信你的话 "和 "我就是这么告诉你的"，我希望看到更多实质性的选择。

Renat Akhtyamov 2022.03.30 13:30 #26058

Maxim Dmitrievsky #:

有了2个更大的灵活性，这些概率是...只是交易的数量减少了，稳定性却没有。

有3个就更好了。

;)

[删除] 2022.03.30 13:37 #26059

elibrarius #:
你也没有2的稳定性......

许多选择，很难比较

Aleksei Kuznetsov 2022.03.30 14:06 #26060

Maxim Dmitrievsky #:

许多选择，很难比较

你已经有一个2个模型的工作捆绑的例子了。与第1个模型的变体（通过0.1-0.9或0.2-0.8的分界线）很容易使它们，并比较它们对OOS的稳定性。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2606