交易中的机器学习:理论、模型、实践和算法交易 - 页 3011

 
Maxim Dmitrievsky #:
小说也是如此。他们想出很多东西,却没有时间写下来:)然后,由阿列克谢-尼古拉耶夫担任的编辑委员会就会把所有东西都删掉。

好的编辑是好的。

最重要的是,他不应该禁止出版已经成功的作品,但他不知道如何出版。

 
mytarmailS #:

首先,你必须意识到模型内部充满了垃圾...

如果把一个训练有素的木质模型分解成内部规则和这些规则的统计数据,就会发现:

就像


并分析 错误 规则误差与样本中出现频率的关系


得出


那么我们对这个区域感兴趣


在这一区域,规则非常有效,但却非常罕见,以至于我们有理由怀疑对其进行统计的真实性,因为 10-30 次观测并不是统计。

终于,我说了多年的话开始深入人心了!:)

 
Forester #:

有没有人试过在训练中增加运动量?效果一样吗?或者你是否让他们给你带来了进步?

我注意到图表下的成交量等模型会通过指标运行。

我没有深入研究过这个方向--只是观察。

 
СанСаныч Фоменко #:

你完全误解了我的意思:根本就没有 "希望 "这回事,要么有对某一特征适合性的数字评估,要么就没有。对未来特征的适宜性有一个数字评估。

有趣的是,关于未来,你会透露其中的秘密吗?

 
mytarmailS #:

火车 5 公里

validid 60k


模型训练 - 1-3 秒

规则提取 - 5-10 秒

检查每条规则(20-30k 条规则)的有效性 60k 1-2 分钟


当然,这都是近似值,取决于属性和数据的数量

这是什么样的模型?

规则估计算法是在单核上运行的吗?

 
Aleksey Vyazmikin #:

是什么型号?

规则估计算法是在单核上运行的吗?

在一个核心上

一个

 
Aleksey Vyazmikin #:

终于发生了,我说了多年的话开始深入人心!:)

我觉得没人还能明白你在说什么)。

他说得简单明了,就像奥卡姆剃刀。

 
Forester #:

该测试使用的是 CME 欧元兑美元的真实交易量:100 条的累计交易量、三角、背离和收敛。
在不改变任何模型设置的情况下,删除了 405 列 CME 数据(价格三角和之字形仍然保留),总共删除了 115 列,结果略有改善。也就是说,原来有时在分割时会选择成交量,但在 OOS 时却变成了噪音。

为了便于比较,我将有成交量的图表放在上面,没有成交量的图表放在下面。

我希望有 CME 的图卷会带来额外的信息/规律,从而提高学习效率。但正如你所看到的,尽管图表非常相似,但无体积的模型更好一些。
这是我第二次使用 CME(3 年前尝试过),但同样没有成功。


还有人试过在训练中加入交易量吗?结果一样吗?还是你让他们给了改进?

我又做了 3 次没有体积的测试,并与有体积的测试进行了比较。已经更改了模型的超参数。
共进行了 4 次测试:3 次没有体积的 OOS 更好,1 次更差。也就是说,有时体积会增加一点。总的来说,一切都处于误差水平。与增加体积相比,使用超参数可以取得更大的效果。它们既没有明显改善,也没有明显恶化。

我对体积的期望更高。

 
Aleksey Vyazmikin #:

我想知道,具体到未来,你能告诉我其中的秘密吗?

我写过几次

 
mytarmailS #:

森林

你的取样比例是多少?

在我看来,如果每个人都使用一半的预测因子,那么福雷斯特的作用就非常小了。