文章 "直推和主动机器学习中的梯度提升"

 

新文章 直推和主动机器学习中的梯度提升已发布:

在本文中,我们将探讨利用真实数据的主动机器学习方法,并讨论它们的优缺点。也许你会发现这些方法很有用,并将它们包含在你的机器学习模型库中。直推是由支持向量机(SVM)的共同发明者弗拉基米尔·瓦普尼克(Vladimir Vapnik)提出的。

让我们直接进入主动学习,用我们的数据测试它的有效性。

Python语言中有几个用于主动学习的库,其中最流行的是:

  • modAL 是一个非常简单易学的包,它是流行的机器学习库 sciket learn 的一种包装(它们完全兼容)。该软件包提供了最流行的主动学习方法。
  • Libact使用多臂老虎机(multi-armed bandit)策略来动态选择最佳查询。 
  • Alipy 是一种来自包提供商的实验室,包含了大量的查询策略。

我选择了 modAL 库,因为它更直观,更适合于了解主动学习理念。它在设计模型和使用标准块或创建自己的模型时提供了更大的自由度。

让我们使用以下方案来考虑上述过程,不需要进一步解释:

参见文档

作者:Maxim Dmitrievsky