混乱中有规律可循吗?让我们试着找出它!以特定样本为例进行机器学习。 - 页 16

 
Maxim Dmitrievsky #:

在正常情况下,种子几乎没有影响,重要的是算法。如果必须使用种子,数据就已经是垃圾了

如果只有 10 个标志而不是 1000 个,那么在一定程度上就可以确定是新数据解决了问题。

我认为默认深度为 6,除了临界值外,也不会有太大影响。

学习深度的影响不同,取决于历史变化。

是的,也许对 4 种子预测因子影响不大。垃圾是一种误解。从根本上说,是种子决定了模型中将使用多少个预测因子。

所有参数都会受到影响。我只想说,你的组合可能比例子多出一个数量级。如果有 4 个预测因子,我认为可以使用 1-3 个 CB 树模型,学习率为 0.3-0.5,否则就已经很合适了。

 
Aleksey Vyazmikin #:

您可以尝试输入不同的样本,继续学习新数据。即使是CatBoost 似乎也能做到这一点。它还知道如何合并模型,但我还没研究过。

它是梯度...

这意味着它可以从上一个模型的错误中学习

我们只需要对一个模型进行多次训练。

模型之间的唯一区别是样本在时间上发生了偏移。

 
Renat Akhtyamov #:

它是渐变原声.....

即吸取前人的教训

我们只需在一个模型上进行多次训练。

模型之间的唯一区别是样本在时间上的移动。

我的大脑无法处理你写的东西。

 
Aleksey Vyazmikin #:

是的,也许对 4 个预测因子来说,种子的影响并不大。这是个误解。事实上,种子决定了模型中会使用多少个预测因子。

所有参数都会受到影响。我只是想说,你的组合可能比例子多出一个数量级。如果有 4 个预测因子,我认为可以使用 1-3 个 CB 树模型,学习率为 0.3-0.5,否则就已经很合适了。

种子不会影响任何地方的正常最佳值

+- 短路,无所谓。

你可以稍作调整,但这已不再重要

 
Maxim Dmitrievsky #:

种子对任何有正常最佳值的地方都没有影响

+- 短路,不起作用

你可以稍作调整,但这并不重要。

它在哪里?

 
Aleksey Vyazmikin #:

它在哪里?

我想,种子主题的变化对结果影响不大 )

 
Maxim Dmitrievsky #:

显然,种子主题的变化对结果影响不大 )

我们的情况显然不是这样

 
Aleksey Vyazmikin #:

我们的情况显然不是这样。

嗯,这倒是值得期待。
 
Maxim Dmitrievsky #:
好吧,有件事值得期待。

确实如此。但这说的是理想世界,有时还是适应现有世界比较好。

 
Maxim Dmitrievsky #:
是随意打听好,还是坚持使用先验的可靠 信息好?

除了开始和结束时间(会话、日历),我什么也想不起来。什么意思?