文章 "机器学习中的量化（第1部分）：使用 CatBoost 的理论、示例代码和实现分析"

MetaQuotes 2024.05.20 09:17

新文章机器学习中的量化（第1部分）：使用 CatBoost 的理论、示例代码和实现分析已发布：

本文探讨了量化在树模型构建中的理论应用，并展示了使用 CatBoost 实现的量化方法。不使用复杂的数学方程。

那么什么是量化，为什么要使用量化呢？让我们来弄清楚！

首先，让我们谈谈数据。因此，为了创建模型（进行训练），我们需要在表中仔细收集数据。此类数据的来源可以是能够解释目标数据的任何信息（由模型确定，例如交易信号）。数据源被称为不同的预测因素、特征、属性或因素。数据线的出现频率由现象的可比过程观察的发生来确定，关于哪些信息正在被收集，哪些信息将使用机器学习进行研究。所获得的全部数据称为样本。

样本可以是有代表性的——这是指其中记录的观察结果描述了所研究现象的整个过程，也可以是不具有代表性的，因为有尽可能多的数据可以收集，这只允许对所研究现象过程进行部分描述。通常，当我们处理金融市场时，我们处理的是非代表性样本，因为可能发生的一切还没有发生。因此，我们不知道金融工具在发生新事件（以前从未发生过）时会如何表现。然而，每个人都知道“历史会重演”的格言。算法交易员在研究中依赖的正是这一观察结果，希望在新的事件中会有与以前类似的事件，并且它们的结果将与确定的概率相似。

作者：Aleksey Vyazmikin

新评论