交易中的机器学习:理论、模型、实践和算法交易 - 页 2606

 
Maxim Dmitrievsky#:

有一个这样的问题。

使用了两个模型。一个预测买或卖,另一个预测交易或不交易。

首先,第一个模型被训练出来,然后我们看看它在哪里预测得不好,把这些例子标记为 "不要交易",其他好的例子标记为 "交易",然后我们训练第二个模型。

第一个模型不仅在训练区进行测试,也在附加区进行测试,第二个模型在两个区域都进行了训练。

我们重复几次,在同一个数据集上重新训练两个模型。结果在样品上逐渐改善。但并不总是在对照样本上。

与此同时,我们还保留了一份所有通行证的不良交易累积日志,所有 "不交易 "的 "不良 "交易都被收集在其中,用于训练第二个模型,并根据一定的原则进行过滤,如所有通行证的不良交易副本越多,将其标记为 "不交易 "的机会就越大。

例如,对于每个日期的所有迭代训练,都会积累一些不良交易的数量,如果这个数量超过了一个阈值(平均值,平均数),这些交易就会被标记为 "不交易"。其余的交易被跳过,否则,如果有大量的训练迭代,就有可能排除所有的交易。

系数允许你调整输出端的交易数量,它越低,越多的交易被过滤掉。

...在这一点上,我已经厌倦了写...

如何改进这样的模型组合,使其在新的独立地块上改善其结果?
是否有任何哲学思想来解释为什么这可能有效?除了在每一圈的重新训练中,模型自然会相互改进(误差下降),但如何摆脱拟合?

有趣的概念!

1.如何摆脱装修。我对迭代的理解不多。为什么你不能只训练一次过滤(第二个)模型,然后评估它是否改善/不改善第一个模型的性能。你可以直接过滤信号1到2,或将输出2送入输入1。

2. 如何改进。
2.1.你可以尝试把交易后的标记做成一个集群标记。当然,不良信号堆积如山。还有那些好的。我们对集群进行标记。我们可以通过交易方式(根据条目/候选人的筹码)进行培训,目标定位--发现自己处于好的或坏的集群中。或者你可以按聚类训练(按聚类训练的筹码,一个训练样本对象--聚类),目标--要么相同(好的或坏的聚类中的下一个蜡烛),要么下一个聚类--好的或坏的(嗯,本质上可能是一样的)。
2.2.这些模型的特征描述可能应该不同,否则我认为第二个模型的边际效用会很低。


3.概念背后的哲学。谁需要它,模型的效率,利润是标尺。实验是主宰,而不是哲学)。

 
Replikant_mih#:

有趣的概念!

1.如何摆脱配件的束缚。我对迭代的理解不多。为什么你不能只训练一次过滤(第二个)模型,然后评估它是否改善/不改善第一个模型的性能。你可以直接过滤信号1到2,或者将输出2送入输入1。

2. 如何改进。
2.1.你可以尝试把交易后的标记做成一个集群标记。当然,不良信号堆积如山。还有那些好的。我们对集群进行标记。我们可能会以交易的方式进行训练(根据条目/技巧的筹码),针对--发现自己处于好的或坏的群组中。或者你可以按集群进行训练(按集群进行筹码训练,一个训练样本对象--集群),目标--要么相同(好的或坏的集群中的下一个蜡烛),要么下一个集群--好的或坏的(嗯,本质上可能是一样的)。
2.2.这些模型的特征描述可能应该不同,否则我认为第二个模型的边际效用会很低。


3.概念背后的哲学。谁需要它,模型的效率,利润是标尺。实验的规则,而不是哲学)。

我们想提高第一个模型(也包括第二个模型)的可推广性。如果我们简单地用第二个模型过滤掉她的信号,第一个模型的分类误差就不会在其内部减少。因此,我们在数据集上运行两个训练有素的模型,并从第一个模型的训练中删除坏的例子,这样误差就会变小。而第二条的错误也下降了。就这样,我们重复了好几遍。它应该每次都会变得更好。但我希望它每次都能在测试样本上变得更好,但有很大的差异。

所以我想我还应该在那里添加什么,可能一些反思也是不错的 :)

 
Maxim Dmitrievsky#:

我们想提高第一个模型(也包括第二个模型)的普遍性。如果我们简单地用第二个模型过滤掉它的信号,第一个模型的分类误差就不会在内部减少。因此,我们在数据集上运行两个训练有素的模型,并从第一个模型的训练中删除坏的例子,这样误差就会变小。而第二条的错误也下降了。就这样,我们重复了好几遍。它应该每次都会变得更好。但我希望它每次都能在测试样本上变得更好,但有很大的差异。

我在想我还应该在那里添加什么,也许只是一些想法可能也会起作用 :)

你确定你需要2个模型,而且它们会改善反馈的结果吗?
你可以不通过0.5,而是通过0.3和0.7,甚至0.1和0.9来确定第一个模型的边界--因此,低概率的交易将被淘汰,它们的数量将减少,模型将只有1。
 
Aleksey Nikolayev#:

不要误会我的意思...因此,我更愿意把它建立在可验证的断言 上。

不要误会我的意思。我只是指出了你的逻辑结构的不准确性:"市场上没有长放算法,否则迟早会成为市场上唯一剩下的算法"。我向你展示了他们到底存在于哪个利基市场。为什么他们孤立地存在于那里,而不是占领整个市场。并举了一个可核实的 例子。

Об авторе | QuantAlgos
  • www.quantalgos.ru
Приветствую вас в моем блоге. Меня зовут Виталий, занимаюсь написанием биржевых роботов c 2008 года. В 2009 и 2010 гг. участвовал в конкурсе ЛЧИ (лучший частный инвестор) под ником robot_uralpro, проводимом биржей РТС  (сейчас Московская биржа). Использовались HFT роботы, написанные на C#.  Результаты были следующие: В настоящее время продолжаю...
 
elibrarius#:
你确定你需要2个模型,并且它们会改善OOS的结果吗?
你可以不通过0.5,而是通过0.3和0.7,甚至0.1和0.9来确定第一个模型的边界--这样一来,低概率的交易就会被淘汰,它们的数量就会减少,模型就只有1。

2有更多的灵活性,这些概率是...只是交易的数量减少了,稳定性却没有。

 
Maxim Dmitrievsky#:

有了2个更大的灵活性,这些概率是...只是交易的数量减少了,稳定性却没有。

你也没有2的稳定性......
 
博士#:

不要误会我的意思。我只是指出了你的逻辑结构的不准确性:"市场上没有长放算法,否则迟早会成为市场上唯一剩下的算法"。我向你展示了他们到底存在于哪个利基市场。为什么它们孤立地存在于那里,却没有占领整个市场。并举了一个可核实的 例子。

验证某一声明的实际存在并不意味着验证其内容。

即使我们假设(尽管这可能而且经常有问题)有人年复一年地稳定赚钱,但根本不清楚如何证明这是由同一算法完成的,甚至不知道是什么样子。除了 "相信你的话 "和 " 就是这么告诉你的",我希望看到更多实质性的选择。

 
Maxim Dmitrievsky #:

有了2个更大的灵活性,这些概率是...只是交易的数量减少了,稳定性却没有。

有3个就更好了。

;)

 
elibrarius #:
你也没有2的稳定性......

许多选择,很难比较

 
Maxim Dmitrievsky #:

许多选择,很难比较

你已经有一个2个模型的工作捆绑的例子了。与第1个模型的变体(通过0.1-0.9或0.2-0.8的分界线)很容易使它们,并比较它们对OOS的稳定性。
原因: