混乱中有规律可循吗？让我们试着找出它！以特定样本为例进行机器学习。

Aleksei Kuznetsov 2022.11.03 13:57 #71

Aleksey Vyazmikin #:

是的，有很多数据，而且我计划增加更多数据--因此需要制定一种在混淆之前进行筛选的方法。

现在我正在进行训练，我想说的是，这在很大程度上取决于设置，尤其是量子表中的分割数。

我刚刚开始了一项实验，在显卡默认设置下进行训练--在不考虑模型评估和考试样本测试的情况下，一次训练需要 2-3 分钟--这取决于模型中树的数量。在我相当过时的 FX-8350 处理器上，速度要慢 60%。

我认为这个速度是可以接受的，我通常会用固定的种子训练 100 个模型，以平均这种方法的效率。

如果训练到 "结束"，程序会估算出最多 2 个小时的时间。

在树深 6 和 1000 棵树的情况下，需要 2-3 分钟？

Valeriy Yastremskiy 2022.11.03 13:57 #72

spiderman8811 #:
不是水平，而是范围，再加上波浪形态和蜡烛图。这些都不在书上。这应该行得通。

我还对更多细节感兴趣))))，但不清楚是什么范围和什么模式）。

Aleksey Vyazmikin 2022.11.03 14:05 #73

elibrarius #:
2-3 分钟，树深度为 6，树数量为 1000 棵？

建立 250-400 棵树，因为在测试样本上有停止训练的控制，即如果最后 100 棵树没有改进，训练就会停止，模型会切到最后一棵有改进的树。

Aleksei Kuznetsov 2022.11.03 18:33 #74

Aleksey Vyazmikin #:

这是另一种变体--我更喜欢它，因为它在所有样本上都能得到稳定的结果。

0.042 是最好的结果。比所有柱子都好，平衡曲线也更漂亮。但不如你在 Catbusta 上做得那么好。

Aleksei Kuznetsov 2022.11.03 18:38 #75

Aleksey Vyazmikin #:

第一列是零还是 "1"？:)

是零。

0,02400

Aleksei Kuznetsov 2022.11.03 18:51 #76

Aleksey Vyazmikin #:

意思可能与 1041-1489 接近。

448 条时，最好的 0.03000

Aleksey Vyazmikin 2022.11.03 19:48 #77

elibrarius #:

0.042 是最好的结果。比所有柱子都好，平衡曲线也更漂亮。但不如你在 Catbusta 上做得那么好。

elibrarius#:

在 448 条时，最佳值为 0.03000。

这个结果已经明显更好了，而且似乎是因为选择了学习增强预测因子。至于还有多少其他有用的预测因子，以及如何将它们提取出来，这才是我们关心的问题。

试着改变目标，只有在盈利超过 50 点时才将目标设为 "1"（也许更少更好）--这在我的实验中改善了学习效果，尽管正目标的数量变得更少了...

Aleksei Kuznetsov 2022.11.03 19:54 #78

Aleksey Vyazmikin #:

结果已经明显好转，这似乎是由于选择了有利于学习的预测因子。至于还有多少预测因子是有用的，以及如何将它们提取出来，这才是我们关心的问题。

试着改变目标，只有当利润超过 50 点时才设为 "1"（也许更少更好）--这在我的实验中改善了学习效果，尽管正目标的数量变得更少了......

第 2 列是类阈值（但不在教师的标记中，而是在预测中）。
60 pt porgoa 的图表是最好的。

Aleksey Vyazmikin 2022.11.03 19:59 #79

elibrarius #:
第 2 列是班级临界值（但不在教师标注中，而是在预测中）。第 3 列是利润。 60 分的图表是最好的。

在预测时，您是如何知道利润的，或者您有回归模型吗？

在教学时尝试移位:)

Aleksei Kuznetsov 2022.11.03 20:18 #80

Aleksey Vyazmikin #:

在预测中，你是如何知道利润的，还是有一个回归模型？

在训练时尝试移位:)

我在训练后计算利润和计划。

混乱中有规律可循吗？让我们试着找出它！以特定样本为例进行机器学习。 - 页 8