文章 "梯度提升(CatBoost)在交易系统开发中的应用. 初级的方法" - 页 7

 
这是完全错误的方法。你不能基于相同的训练和测试数据集生成一个模型,然后说它有效,这是毫无用处和毫无根据的。这就是所谓的曲线拟合模型。这样的模型在纸面上看起来很好,但在现实世界中永远行不通。请使用正确的机器学习方法,有多种方法可以做到这一点,但你的方法是完全错误的。
 
Jacob James:
这是完全错误的方法。你不能基于相同的训练和测试数据集生成一个模型,然后说它有效,这是毫无用处和毫无根据的。这就是所谓的曲线拟合模型。这样的模型在纸面上看起来很好,但在现实世界中永远行不通。请使用正确的机器学习方法,有几种方法可以做到这一点,但你的方法是完全错误的。

我认为你们俩都完全错了,伙计们。标记为 "幼稚方法 "的文章是 CatBoost 模型的介绍。没有人禁止你们用新数据来测试模型。在文章的最后,你还可以看到 "新数据测试+学习期"。

请仔细阅读文章,因为下一部分就在路上。
 
Maxim Dmitrievsky:

虽然一切都简单到了不可能的地步,但还是很难理解别人的想法....。

我能说什么呢?

1)标志肯定不是最好的,范围很大。

2)在训练分类器之前没有必要混合数据(我检查过)。

3)真正有价值的是目标,正是它拉动了整篇文章(我将它与 ZZ 进行了比较,ZZ 简直是垃圾)。


总的来说,方法如下--最大限度地 "只为在验证中获得好结果而行动"

我们选择最佳模型 ))))

我就是这样 "移动 "的。

但事实上,这与我优化神经元权重时所说的方法是一样的,只是我立即 "移动 "了最大利润。

好吧,我不知道还能写些什么...

 
mytarmailS:

虽然一切都简单到了不可能的地步,但我还是很难理解别人的想法....。

我能说什么呢?

1) 标识不是最好的,有很大的空间。

2)在训练分类器之前没有必要洗数据(我检查过)。

3)真正有价值的是目标,它能拉动整篇文章(与 ZZ 相比,ZZ 简直是垃圾)


总的来说,方法如下--我们 "尽可能地移动所有数据,只为在验证时得到一个好结果"。

并选择最佳模型 ))))

我就是这样 "移动 "的。

但事实上,这与我优化 neuronkey 权重时所说的方法是一样的,只不过我是将它移动到最大利润处。

好吧,我不知道还能写些什么...

如果没有 GMM,就不能这样做。另外,你没有意识到训练的时间间隔有多短,以及模型在新数据上的寿命有多长。这并不是极限,我们有办法延长模型的寿命。整个方法是一个有机的整体,你不能把各个部分割裂开来。

是的,你可以尝试更有意义的方法。使用它,改进它

 
Maxim Dmitrievsky:

没有 GMM 就无法做到这一点。另外,你没有查看训练的时间间隔有多短,以及模型在新数据上的寿命有多长。这并不是极限,还有办法延长寿命。整个方法是有机的一体,你不能把各个部分分开。

是的,你可以尝试更有意义的方法。使用它,改进它

我明天用 gmm 试试。

 
mytarmailS:

我明天用 gmm 试试。

哦,那是你写的文章。那么是的。这是一篇介绍性的文章,以免读者完全摸不着头脑。
 
Maxim Dmitrievsky:
哦,这就是你写的那篇文章。是啊这是一篇介绍性的文章 防止读者完全走入歧途

是的,我想我应该按顺序来写

 
一般来说,如果不使用 Shuffle,系统会立即开始预期的耗电。
 
Александр:
一般来说,如果不使用 Shuffle,系统会立即开始出现预期的耗电。

现在您可以跳到下一篇文章

 
我用了,要么是我自己做的,要么是我用了你提供的。 以下错误。