混乱中有规律可循吗?让我们试着找出它!以特定样本为例进行机器学习。 - 页 8

 
Aleksey Vyazmikin #:

是的,有很多数据,而且我计划增加更多数据--因此需要制定一种在混淆之前进行筛选的方法。

现在我正在进行训练,我想说的是,这在很大程度上取决于设置,尤其是量子表中的分割数。

我刚刚开始了一项实验,在显卡默认设置下进行训练--在不考虑模型评估和考试样本测试的情况下,一次训练需要 2-3 分钟--这取决于模型中树的数量。在我相当过时的 FX-8350 处理器上,速度要慢 60%。

我认为这个速度是可以接受的,我通常会用固定的种子训练 100 个模型,以平均这种方法的效率。

如果训练到 "结束",程序会估算出最多 2 个小时的时间。

在树深 6 和 1000 棵树的情况下,需要 2-3 分钟?
 
spiderman8811 #:
不是水平,而是范围,再加上波浪形态和蜡烛图。这些都不在书上。这应该行得通。
我还对更多细节感兴趣)))),但不清楚是什么范围和什么模式)。
 
elibrarius #:
2-3 分钟,树深度为 6,树数量为 1000 棵?

建立 250-400 棵树,因为在测试样本上有停止训练的控制,即如果最后 100 棵树没有改进,训练就会停止,模型会切到最后一棵有改进的树。

 
Aleksey Vyazmikin #:

这是另一种变体--我更喜欢它,因为它在所有样本上都能得到稳定的结果。



0.042 是最好的结果。比所有柱子都好,平衡曲线也更漂亮。但不如你在 Catbusta 上做得那么好。


 
Aleksey Vyazmikin #:

第一列是零还是 "1"?:)

是零。

0,02400


 
Aleksey Vyazmikin #:

意思可能与 1041-1489 接近。

448 条时,最好的 0.03000


 
elibrarius #:

0.042 是最好的结果。比所有柱子都好,平衡曲线也更漂亮。但不如你在 Catbusta 上做得那么好。


elibrarius#:

在 448 条时,最佳值为 0.03000。


这个结果已经明显更好了,而且似乎是因为选择了学习增强预测因子。至于还有多少其他有用的预测因子,以及如何将它们提取出来,这才是我们关心的问题。

试着改变目标,只有在盈利超过 50 点时才将目标设为 "1"(也许更少更好)--这在我的实验中改善了学习效果,尽管正目标的数量变得更少了...

 
Aleksey Vyazmikin #:

结果已经明显好转,这似乎是由于选择了有利于学习的预测因子。至于还有多少预测因子是有用的,以及如何将它们提取出来,这才是我们关心的问题。

试着改变目标,只有当利润超过 50 点时才设为 "1"(也许更少更好)--这在我的实验中改善了学习效果,尽管正目标的数量变得更少了......

第 2 列是类阈值(但不在教师的标记中,而是在预测中)。
60 pt porgoa 的图表是最好的。
 
elibrarius #:
第 2 列是班级临界值(但不在教师标注中,而是在预测中)。第 3 列是利润。 60 分的图表是最好的。

在预测时,您是如何知道利润的,或者您有回归模型吗?

在教学时尝试移位:)

 
Aleksey Vyazmikin #:

在预测中,你是如何知道利润的,还是有一个回归模型?

在训练时尝试移位:)

我在训练后计算利润和计划。