下载MetaTrader 5

文章 "机器学习模型的变量评估和选择"

要添加评论,请登录注册
您想成为知名的开发者吗?在自由职业服务中执行交易者订单!
MetaQuotes Software Corp.
版主
181075
MetaQuotes Software Corp. 2016.02.23 12:36 

新文章 机器学习模型的变量评估和选择已发布:

本文重点介绍机器学习模型中输入变量(预测因子)的选择,预处理以及评估的相关细节。多种规范化的方法以及它们的特点都将在此被讨论。在处理过程中 将极大影响模型训练最终结果的环节也将在此探讨。我们将仔细看看,并评估新的及鲜为人知的用于确定输入数据信息量和可视化的方法。

我们将使用“RandomUniformForests”包,计算并分析变量不同值和各种组合的重要概念,预测因子和目标的对应关系,预测因子之间的相互作用,以及将所有重要的方面都考虑在内后预测因子集的最优选取。

我们将使用“RoughSets”包,换一个角度和基于其他概念来探讨预测因子的选择问题。我们将揭示不仅是预测因子集可以被优化,用于训练的样本集也可以被优化。

所有的计算和实验将用R语言来实现,准确的说是用 — Revolution R Open 3.2.1

OOB error

图 2. 训练误差取决于树的数量

作者:Vladimir Perervenko

Zhi Long Yang
656
Zhi Long Yang 2017.01.03 04:52  
非常感谢文章作者。我刚刚开始就遇到一个问题。我安装的是RStudio,不是作者建议的Revolution R Open 3.2.1。“RandomUniformForests”包和“RoughSets”包已经加载,但是nearZeroVar()函数和findLinearCombos() 函数无法正常调用,这些函数是Revolution R Open特有的么?
Microsoft R Open: The Enhanced R Distribution · MRAN
  • Microsoft Corporation
  • mran.revolutionanalytics.com
Microsoft R Open, formerly known as Revolution R Open (RRO), is the enhanced distribution of R from Microsoft Corporation. It is a complete open source platform for statistical analysis and data science. The current version, Microsoft R Open 3.3.2, is based on (and 100% compatible with) R-3.3.2, the most widely used statistics software in the...
要添加评论,请登录注册