文章 "强化学习中的随机决策森林"

MetaQuotes 2018.07.12 07:31

使用 bagging 的随机森林(Random Forest, RF) 是最强大的机器学习方法之一，它略微弱于梯度 boosting，这篇文章尝试开发了一个自我学习的交易系统，它会根据与市场的交互经验来做出决策。

之后，所有训练过的决策树被组合到一起，使用所有用本的平均误差来做简单投票。Bootstrap聚合的使用减少了均方误差，降低了训练分类器的方差。误差在不同的样本间不会相差太大。这样，根据作者的意见，模型将会较少有过度拟合的问题。bagging 方法的效果依赖于基本算法 (决策树) 是在随机变化的样本中训练的，它们的结果可能相差很大，而误差会在投票中大幅抵消。

可以说随机森林是 bagging 的一个特例，在其中决策树是用作基本单元的。同时，与传统的决策树构建方法不同，没有使用修剪（pruning），这种方法是为了整合大量数据样本的时候能够尽可能的快。每个数是使用特定方法创建的，用于构建树节点的特性 (属性) 不是从全部的特性中选择的，而是从它们的随机子集中选择的。当构建回归模型时，特性的数量是 n/3，如果是分类，它就是 √n. 所有这些都是经验的建议，被称为去相关：不同的特征集落入不同的树，并且树被训练在不同的样本上。

图 1. 随机森林运行框架

作者：Maxim Dmitrievsky

新评论