文章 "用随机森林预测趋势" - 页 3

 
目前是否有利可图?
 
fozi:
目前是否有利可图?

文章中的例子是示范性的,极其多余。

如果我们特别谈论随机森林和一般机器学习模型 的应用(神经网络属于这一类算法),它们在交易中的应用非常广泛。

PS.论坛上有很多 NS 的支持者。因此,这些并不是最有效的交易算法。随机森林的效率要高得多。

 
faa1947:

文章中的例子是示范性质的,极其冗余。

如果我们特别谈及随机森林和一般机器学习模型的应用(神经网络属于这一类算法),它们在交易中得到了广泛应用。

PS.论坛上有很多 NS 的支持者。因此,这些并不是最有效的交易算法。随机森林更为有效。

你去哪儿了?

很久没有你的消息了?

 
Vinin:

你去哪儿了?

很久没有你的消息了?

不,我在这里,只是没有参加,后来我有点图形狂躁症。我写了一篇文章,并以书的形式总结了我的一些工作成果,我已经很久没有写东西了。
 

您有更深入的资料链接吗?

 
Smart14:

您有更详细的资料链接吗?

这方面的文献很多,大部分是英文文献。

我写了一本书《预测趋势》,书中对分类问题的讨论比文章详细得多。书中包含技术文档的直译(约占 30%)、在外汇市场上使用分类模型的例子(约占 20%)以及建立分类模型的思想解释。文章还介绍了基于分类模型建立智能交易系统的步骤顺序。

更多详情请见附件。

PS.书中列出了有关该主题的大量文献。

附加的文件:
PredictTrend.zip  858 kb
 

Vlad19492014.11.23 15:

亲爱的弗拉德

在一个条件下,所有关于机器学习算法效率的论点都是有意义的:模型没有经过重新训练。在我的实践中,很难得到一个未经训练的模型。特别是在本文中,这是一个过度训练的模型。

模型的过度训练是由于一组错误的预测因子造成的,整条狗都被埋没在其中。因此,所有的努力都应针对预测因子的选择,然后再针对模型。

在我看来,我已经找到了预测因子适合特定目标变量的正式迹象。如果您对此感兴趣,我很乐意与您私下讨论。

 
faa1947:

Vlad19492014.11.23 15:

亲爱的弗拉德

在一个条件下,所有关于机器学习算法效率的论点都是有意义的:模型没有经过重新训练。在我的实践中,很难得到一个未经训练的模型。特别是在本文中,这是一个过度训练的模型。

模型的过度训练是由于一组错误的预测因子造成的,整条狗都被埋没在其中。因此,所有的努力都应针对预测因子的选择,然后再针对模型。

在我看来,我已经找到了预测因子适合特定目标变量的正式迹象。如果您对此感兴趣,我很乐意与您私下讨论。

我当然感兴趣。

我当然感兴趣。写

 

vlad19492014.11.23 15

http://a ppliedpredictivemodeling.com/blog/2014/11/11/some-thoughts-on-do-we-need-hundreds-of-classifiers-to-solve-real-world-classification-problems

我在自己的博客上发布了这个带注释的链接。没有人对此感兴趣。以下 是文章本身

 
faa1947:

模型的过度训练会因为错误的预测因子集而发生,整条狗都被埋没在这些预测因子中。因此,所有的努力都应针对预测因子的选择,然后再针对模型。

模型和预测因子的选择是相互关联的。首先,我们应该选择一个模型,然后根据这个模型选择预测因子,用同一个模型筛选那些在预测中 "用处 "最小的预测因子。尽管很多文章和教科书都不这么教:首先,我们使用某种方法计算这些预测因子与目标序列(输出)之间的关系来选择预测因子。最常见的筛选方法是预测因子与输出之间的相关系数和互信息。然后选择一个模型,通常与如何选择预测因子无关。如果你仔细想想(计量经济学 教科书不会告诉你这些,你必须自己思考),通过与输出的相关系数来选择预测因子的方法实质上是选择那些在线性回归模型(LRC)中误差最小的预测因子。根据预测因子与输出结果的互信息来选择预测因子的方法,实质上是选择那些在基于纳达拉亚-沃森回归模型中误差最小的预测因子(名称很难懂,叫 GRNN)。

Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
  • 2012.06.21
  • MetaQuotes Software Corp.
  • www.mql5.com
Центральной проблемой прикладной статистики является проблема принятия статистических гипотез. Долгое время считалось, что эта задача не может быть решена. Ситуация изменилась с появлением метода собственных координат. Это очень красивый и мощный инструмент структурного исследования сигнала, позволяющий увидеть больше, чем доступно методами современной прикладной статистики. В статье рассмотрены вопросы практического использования данного метода и приведены программы на языке MQL5. Рассмотрена задача идентификации функций на примере распределения, полученного Хилхорстом и Шером.