交易中的机器学习:理论、模型、实践和算法交易 - 页 3354

 
Aleksey Vyazmikin #:

模型概率由训练样本的统计数据给出。

因此,如果没有具有代表性的样本,模型就不准确。)

要么搞清楚模型由哪些部分组成,然后根据您设计的算法对叶子重新加权....。

模型的概率是由 sigmoid 给出的,而不是这个。为了简单起见,不管外面是什么,你都要考虑轨道和轴。即使是这样,也会出现卡顿。
 
Maxim Dmitrievsky #:
模型的概率是由西格玛函数给出的,而不是这个。

好吧,你在函数中输入的数字是多少,从何而来?

 
Aleksey Vyazmikin #:

好吧,你在函数中输入的数字是多少,它从何而来?

你要用问题来回答问题吗?我知道肯定的答案,如果有的话。
 
在模型输出中得到的并不是类别概率。类比回归,它给出的是一个单一的值。分类器的工作原理与此相同,它给出的是通过西格码传递的原始值,而不是概率。

如何获得概率?
 
Maxim Dmitrievsky #:
你是如何意识到分类器给出的概率是正确的?而不仅仅是一个范围内的值。

如果阈值设为 0.8,80% 的交易会盈利吗?如果是 0.51 呢?

几乎可以肯定不会。看看吧

我查过很多次了。这是 TC 的基础。

同样,如果没有,就得重新训练。

 
Maxim Dmitrievsky #:
在模型输出中得到的并不是类别概率。类比回归,它给出的是一个单一的值。分类器的工作原理与此相同,它给出的是一个通过 sigmoid 得到的原始值,而不是概率。

如何获得概率?

通过西格码,我们得到的是类,而不是类的概率。

 
СанСаныч Фоменко #:

通过 sigmoid 得到的是类,而不是类的概率。

我们得到的某个值被称为概率,但事实上它不是。
 
СанСаныч Фоменко #:

检查了很多次。这就是 TC 的基础。

同样,如果没有,就要重新训练。

我不相信你的话,有相关的测试。
 
Maxim Dmitrievsky #:
你要用问题来回答问题吗?如果有的话,我知道明确的答案。
马克西姆-德米特里耶夫斯基#:
模型的输出结果并不是类别的概率。类比回归,它给出的是一个值。分类器的工作原理与此相同,它给出的是一个通过sigmoid的原始值,而不是概率。

如何获得概率?

你知道 CB 模型叶中的值是如何得到的吗?

问题的关键在于,概率是通过历史估计出来的,但只有具有代表性样本的理论才能保证概率继续如此。我们没有这样的样本。因此,在这个方向上的任何调整都不会给新数据带来准确性。修正的原因可能与树叶中有杂物有关,而这正是需要通过高估或低估 sigmoid 分类点来修正的。

还是那句话,不清楚是什么原因。

如果您发现了巧妙之处,请与我们分享:)

 
Aleksey Vyazmikin #:

你知道 CB 模型叶片中的数值是如何得出的吗?

问题的关键在于,历史概率是估计出来的,但只有具有代表性样本的理论才能保证历史概率一直如此。我们没有这样的样本。因此,在这个方向上的任何调整都不会给新数据带来准确性。校正可能与碎屑进入叶片的原因有关,而应该校正的正是这一点,要么依赖于要么低估了 sigmoid 分类点。

还是那句话,不清楚我们在说什么。

如果您发现了什么巧妙的方法,请与我们分享:)

我希望至少有人能谷歌一下这个提示。

即使你的训练中有概率曲线,我们又能谈论什么新数据呢。在这方面,Bousting 和 Forrest 罪孽深重。Bousting是过于自信,Forrest是信心不足。当然,前提是你打算使用阈值。

我自己也观察到,当你提高门槛值时,即使是在 traine 上,交易的质量也不会提高。那么模型返回的概率是多少呢?什么都没有)

在 Sanych 的图片中,您可以从边缘列的离群值看到自信的波动。波谷应该更加平滑。这是一个过度拟合模型。