文章 "直推和主动机器学习中的梯度提升"

 

新文章 直推和主动机器学习中的梯度提升已发布:

在本文中,我们将探讨利用真实数据的主动机器学习方法,并讨论它们的优缺点。也许你会发现这些方法很有用,并将它们包含在你的机器学习模型库中。直推是由支持向量机(SVM)的共同发明者弗拉基米尔·瓦普尼克(Vladimir Vapnik)提出的。

让我们直接进入主动学习,用我们的数据测试它的有效性。

Python语言中有几个用于主动学习的库,其中最流行的是:

  • modAL 是一个非常简单易学的包,它是流行的机器学习库 sciket learn 的一种包装(它们完全兼容)。该软件包提供了最流行的主动学习方法。
  • Libact使用多臂老虎机(multi-armed bandit)策略来动态选择最佳查询。 
  • Alipy 是一种来自包提供商的实验室,包含了大量的查询策略。

我选择了 modAL 库,因为它更直观,更适合于了解主动学习理念。它在设计模型和使用标准块或创建自己的模型时提供了更大的自由度。

让我们使用以下方案来考虑上述过程,不需要进一步解释:

参见文档

作者:Maxim Dmitrievsky

 

当然,人工标注和合理假设的存在并不是人工智能(Norm, of course the presence of manual labels and reasonable assumptions is not AI),但确实减少了用于训练的数据和维度的面积,使它们至少可以被接受。)

 
Valeriy Yastremskiy:

当然,手写标签和合理的假设并不是人工智能,但确实减少了数据区域和训练维度,至少可以让人接受)。

只需手动选择特征(片段)。我在考虑如何摆脱最后的人工操作。

有一些选择,但我还没有拿到手
 
Maxim Dmitrievsky:

从手册中只能选择功能(特性)。我在想如何摆脱最后一本手册。

有一些选项,但我还没有拿到手。

自动检测目标))))

 
Valeriy Yastremskiy:

自动瞄准))))

这已经到位

 
感谢您的精彩文章。
 
Por:
感谢您的精彩文章。

不客气。

 

我什么都不明白:)

自动标记的班级有多少?

如果超过两个,那么理应对每个班级进行财务评估--是亏损还是盈利,然后合并成两个班级进行最终培训。

 
Aleksey Vyazmikin:

什么都不懂)

自动标记的班级有多少?

如果超过两个,那么理应对每个班级进行财务评估--是亏损还是盈利,然后合并成两个班级进行最终培训。

怎样才能消除误解?照常开两个班

主动学习的应用方案问题是开放的。这个问题太大,而且在某种程度上是哲学和实验性的,不可能在一篇文章中全部完成
 

祝贺您在很久之后写出了如此精彩的文章!!!.....!


如何训练和测试其他货币对?


编码部分很复杂,我无法为测试目的进行任何编辑或任何形式的改进。)


能否请您帮助解决截图中的错误?

谢谢
附加的文件:
USDCAD_pair.png  46 kb
 
FxTrader562:

祝贺你在很久之后写出了这么好的文章!!!"!


如何训练和测试其他货币对?


编码部分很复杂,我无法为测试目的进行任何编辑或任何形式的改进。)


您能帮助解决截图中的错误吗?

谢谢

您不能在 MetaEditor5 中编译 py 文件,为此您需要安装 PyCharm 程序并运行该脚本。