交易中的机器学习:理论、模型、实践和算法交易 - 页 3024

 
Maxim Dmitrievsky #:

我建议用 python 制作这顶帽子,用 kolab 制作一棵可选择树叶的树,您可以将数据集放入其中

如果您有任何更好/更坏的建议,或只选取最好的数据或通过某些过滤的规则,请提出建议。

我想通过两种方法对一个数据集进行比较。这样我们就会明白什么是好的了:)

有趣的想法!

首先,我们需要了解哪种树的实现方式可以轻松提取树叶的规则,以便进一步处理。

然后是构建树的方式--贪婪还是遗传。我检查了所有种群的树叶(如果我没弄错的话:)

当然,您也可以使用森林树来代替基因树,但这样您就需要更多的树来搜索树叶,而且您需要根据树叶中的例子占整个样本的百分比来剪枝。森林树可能比基因树更快,而且它们的设置显然会更少。

生成新叶子的过程应该一直进行,直到达到所需的(指定的)选定叶子数量。

在这种情况下,在构建森林树之前,有必要确保生成两种类型的随机子样本--第一种是从指定大小的连续均匀区间中选取 N 部分作为训练样本的百分比,第二种是完全随机获得的子样本。

用于构建预测树的随机预测因子集。

关于所有数据的预处理--需要多加考虑。

评估树叶的标准--也可以稍后添加,但要点是指标有一个设定的阈值。我不知道你用的是什么指标,也不记得我用的是什么--我需要解析代码。您可以使用平衡、期望矩阵和恢复因子。

估算应在整个训练样本的每个区间进行,区间数已设定。如果在任何一次间隔中都没有达到所需的标准,那么该叶就会被归档或丢弃。我保留了一个树叶数据库,删除了重复的树叶,以免再次检查。

选择树叶后,应该按照相似性对它们进行分组,也许等级相关性可以正确地做到这一点。然后在组内分配权重,并决定各组的投票规则。不过,也许这已经很多了,至少值得学习一下如何选择树叶,以便对新数据有效。


我不太确定你想在哪个样本上做实验--是我给出的样本还是随机创建的样本?

无论如何,要比较各种方法,样本应该是相同的,而且时间间隔要大,这样即使不考虑周期性,也能考虑到大 TF 上不同市场阶段的趋势。

我想说的是,我使用的方法非常慢。也许最好在 MQL5 中进行叶片评估 - 这样可以分散核心的负载。

 
Aleksey Vyazmikin #:

有趣的想法

我先在一棵树上画一个简单的示例,然后立即进行测试,再根据需要进行扩展

在任何数据集上,您都可以通过谷歌光盘下载并测试,无需安装任何东西。

我希望它能快速工作 )
 
Maxim Dmitrievsky #:

我先在一棵树上画一个简单的示例,以便一次性测试,然后再根据需要进行扩展

在任何数据集上,通过谷歌光盘,您都可以下载它并在那里进行测试,而无需安装任何东西。

我希望它能快速工作 )

很好--最重要的是开始!:)

 
Maxim Dmitrievsky #:

这已经不好玩了。

这和 "有趣 "有什么关系?

到底有没有样本外?

 
СанСаныч Фоменко #:

这和 "有趣 "有什么关系?

到底有没有样本外?

如果我发现

 
Maxim Dmitrievsky #:

如果我发现

没有 "如果"。这是一个判断标准。任何没有样本外估计值的估计都是没有意义的。

 
Maxim Dmitrievsky #:

如果我发现

绘制十期 OOS 前向和后向图。

 
СанСаныч Фоменко #:

这与 "如果 "无关。这是一个判断标准。没有样本外评估的任何评估都是没有意义的。

好了,笑够了吧
 
Valeriy Yastremskiy #:

绘制一张 10 个周期的 OOS 前向和后向图。

即 100 年
 
Maxim Dmitrievsky #:
笑够了吧

你是在跟埃及人说话,还是在跟我说话?

我注意到,我对你在这个话题上的表现非常满意。