文章 "基于暴力算法的 CatBoost 模型高级重采样与选择" - 页 9

 
总的来说,情况正在好转。但在生产过程中,每一个 "嘀 " 都有 50 个型号,未免有些矫枉过正。
 

这里有一个很好的改进方案


 

这是重新采样后的数据集。


 

各地培训 5 个月,验证 2 年,考试 5 年

所有图表 5 年

 

再来一次

是啊,有时是有道理的

再押一点是啊,这是有道理的堆叠。至于多少还是个未知数

 
Maxim Dmitrievsky:

再来一次

嗯,是的,有时是有道理的。

多放点赌注是的,叠加是有道理的。至于多少还是个未知数

开始吧)

这就是为什么布雷曼做的是随机森林,而不是更好的。

 
elibrarius:

我们开始吧。)

这就是为什么布莱曼制作了一个随机森林,而不是一个更好的森林。

奇怪的是,在训练中使用 "准确度 "时,效果会出现

而使用其他指标时,效果就不那么明显了。

顺便说一句,catbusta 中有很多指标,我不知道选择哪一个比较好
 
Maxim Dmitrievsky:

奇怪的是,当在训练中使用 "准确度 "时,效果却出现了

而使用其他指标时,效果就不那么明显了。

顺便说一句,catbusta 中有很多指标,我不知道选择哪个最好。

如果 "准确度 "对平衡性的改善最好,显然它就是最好的。

 
elibrarius:

如果精确度对平衡性的改善最好,显然它就是最好的。

不,还有一些做得更好。

但这并没有什么意义。

 
Maxim Dmitrievsky:

不,有一些效果更好

哪些更好?