Maxim Dmitrievsky #:
我希望至少有人能用谷歌搜索一下这个提示。 。

即使你在训练中掌握了概率曲线，你还能谈什么新数据。而布斯廷和福雷斯特在这方面罪孽深重。布斯特是过于自信，福雷斯特是信心不足。当然，前提是您打算使用阈值。

我自己也观察到，当你提高临界值时，交易的质量甚至不会提高。那么模型返回的概率是多少呢？什么都没有）

在 Sanych 的图片中，您可以从边缘列的离群值中看到自信的波动。波谷应该更加平滑。这是一个过度训练模型。

它显示了模型在 0.05 步的 "概率 "范围内的结果。CatBoost 非常准确地将类别分离为 0.5（magnetta 为 1，aqua 为 0）。

您可以看到，从 0.35 开始，鳍的结果是正的--绿色曲线高于红色曲线。

这就是您想要校准的结果吗？

Aleksey Vyazmikin #:

这是否正是你想要校准的--将阶级分化点转移到创收点？

不是。
 
拉。你可以问 30 次，但不能用谷歌搜索。
 
Maxim Dmitrievsky #:
没有

那目的是什么？

 

我想每个人都听说过校准，但它没有实际用处，正是因为样本不具有代表性。

在我看来，对单个叶片进行概率估算，比对模型的叶片总和进行再加权得出的结果更合理。

Aleksey Vyazmikin #:

我想每个人都听说过校准，但它并没有实际用途，只是因为样本不具代表性。

在我看来，对单个叶片进行概率估算，比对模型的叶片总和进行再加权得出的结果更合理。

大家什么都听到了，却没有人回应什么。更不用说其他没有透露的细微差别了，只能猜测原来如此。

如果你有一个弱（期望值低）但稳定的 OOS 模型，那么校准也没有意义吗？仔细想想
 
Maxim Dmitrievsky #:
每个人都听到了一切，但没有人回答任何问题。更不用说其他没有透露的细微差别，只能猜测原来是这样。 。

如果你有一个较弱（期望值较低）但稳定的 OOS 模型，那么校准它也没有意义吗？仔细想想

现在，我想到了恒定校准的想法，但要有一定的权重--比如每个区间的 EMA。这样至少可以适应市场波动和模型过时的情况。

我认为在一些单独数据上进行静态校准没有任何意义。在我的预测器上，我调查了统计指标的稳定性问题，这样的指标很少，而模型中充满了这种不稳定的预测器。这就是为什么我在寻找稳定性，而这种稳定性可以应用于.....。

在上面的截图中，我展示了模型的部分内容--你可以看到边缘的召回率通常很低，这已经说明了相同权重的统计指标并不平等，即使在理论上，它们通常也不足以在这个 "概率 "范围内谈论稳定性。因此，从这个角度来看，校准总数也是一个可疑的想法。

不过，我对叶片中重新加权值的想法更感兴趣，我早些时候写过相关文章，但在这里没有得到任何反馈--所以只能靠我自己了....。

又是一些新定义。
最后一次：分类器被校准是因为它输出了不正确的概率。它们的原始形式毫无意义。别再想了。
 
Catbusta 的代码是公开的，您可以查看代码，了解赠送的具体内容。
