文章 "机器学习中的量化(第1部分):使用 CatBoost 的理论、示例代码和实现分析"

 

新文章 机器学习中的量化(第1部分):使用 CatBoost 的理论、示例代码和实现分析已发布:

本文探讨了量化在树模型构建中的理论应用,并展示了使用 CatBoost 实现的量化方法。不使用复杂的数学方程。

那么什么是量化,为什么要使用量化呢?让我们来弄清楚!

首先,让我们谈谈数据。因此,为了创建模型(进行训练),我们需要在表中仔细收集数据。此类数据的来源可以是能够解释目标数据的任何信息(由模型确定,例如交易信号)。数据源被称为不同的预测因素、特征、属性或因素。数据线的出现频率由现象的可比过程观察的发生来确定,关于哪些信息正在被收集,哪些信息将使用机器学习进行研究。所获得的全部数据称为样本。

样本可以是有代表性的——这是指其中记录的观察结果描述了所研究现象的整个过程,也可以是不具有代表性的,因为有尽可能多的数据可以收集,这只允许对所研究现象过程进行部分描述。通常,当我们处理金融市场时,我们处理的是非代表性样本,因为可能发生的一切还没有发生。因此,我们不知道金融工具在发生新事件(以前从未发生过)时会如何表现。然而,每个人都知道“历史会重演”的格言。算法交易员在研究中依赖的正是这一观察结果,希望在新的事件中会有与以前类似的事件,并且它们的结果将与确定的概率相似。


作者:Aleksey Vyazmikin

 

错别字:

3. Сохранение таблиц квантования в указанный файл – ключ "--input-borders-file"

4.从指定文件加载量化表 - 关键字"--输出边界文件"

反转

 
机器学习中的量化不是量子神经网络(量子神经网络训练 也不是)。
 
Stanislav Korotky #:

错别字:

对面。

谢谢!

 
Sergey Pavlov 神经网络学习 也不是)。

这是在哪里断言的?量化 "一词是否误导和扭曲了人们的期望?

 
谢谢你的文章,很有意思!
 
Andrey Dik #:
感谢您的文章,非常有趣!

非常激动!

 
非常有趣的文章!我能加为好友吗?我是 ML 的新手。我试着编写模型代码并将其保存在 ONNX 中,但得到的结果都是一派胡言,或者只是对历史数据的基本记忆(......)。
 
Yevgeniy Koshtenko #:
非常有趣的文章!

谢谢!

Yevgeniy Koshtenko#:
我可以加你为好友吗?我是 ML 的新手。我试着编写模型代码并将其保存在 ONNX 中,但得到的结果都是一派胡言,或者只是对历史数据的基本记忆(......)。

已加您为好友,不过任何人都可以给我写信--没有程序限制。