交易中的机器学习:理论、模型、实践和算法交易 - 页 2107

 
elibrarius:
这就是它应该有的样子。按NS级进行平衡是必要的。树木可以管理,因为它是。

嗯,他们并不总是这样--我以前写过。

 

看来我在文章中烧毁了一个有利可图的专家顾问(培训方法)。

图中显示了每个月末模型的财务结果,如果你对第一个模型进行12个月的训练,然后把每个新月份的历史加入到模型中--粘上USDRUB_TOM的期货Si 合约。

 
Aleksey Vyazmikin:

嗯,他们并不总是能应付 - 我以前写过。

我认为增加树木的深度会和平衡一样有帮助。
 
Aleksey Vyazmikin:

是的,本质上是给预测指数添加噪音。这可能会影响量化边界,因为增加了对有1的区域的选择,但根据想法,同样的效果应该是增加重复的区域,只是我假设重复的区域在训练开始前就被CatBoost算法切断了(需要验证),那么是的,这是一个选项。

更有可能的是,量化会否定这种噪音。如果一列有10000个不同的值,量化为255个量子将得到40个不同值的平均数,变成一个量子。或者另一个例子--如果原来有1000个例子,加入噪音,得到10000个例子,然后量化为255个不同的量子/值--在我看来,这种加入噪音的工作是不必要的。


最近看了一下代码 - 我没有看到任何重复的删除。相反,从40个不同的样本中删除重复的样本,并将其合并为1个量子。

 
elibrarius:
我认为增加树木的深度会和平衡一样有帮助。

你也可以尝试增加深度。你还应该降低并行的学习率--它也能改善不平衡样本的结果。

elibrarius:

相反,量化会否定这种噪音。如果一列包含10000个不同的值,量化为255个量子将在一次量化中产生40个不同的平均值。或者另一个例子--如果原来有1000个例子,加入噪音,得到10000个例子,然后量化为255个不同的量子/值--在我看来,这种加入噪音的工作是不必要的。

那里有不同的量化方法,包括考虑到范围内物体的拥挤情况。

elibrarius

最近在看代码 - 我没有看到任何重复的删除。恰恰相反,从40个不同的例子中,通过合并成一个量子来进行重复。

如果你在代码中找到了量化的过程(边界设置),你能把这个代码贴出来吗?那里一定有功能?

 

深度增强与此有什么关系?

你有一个大的点云,一个类的点云和另一个类的几个样本,并排在一起(甚至可能在里面),永远不会执行。

第二类需要膨胀到一个合理的大小,或者使用一个类的分类算法

 
Maxim Dmitrievsky:

深度增强与此有什么关系?

你有一个大的点云,一个类的点云和另一个类的几个样本,侧向(甚至可能是内向)的点云从未执行。

第二类需要膨胀到一个合理的规模

增加深度将有助于突出叶子中样本数量少的区域,另一点是有零的叶子的百分比可能会保持不变,然后后续的树又会掩盖这些单位。在训练这样的样本时,你可以看到在训练中间,召回率是如何归零的,然后又回到小百分比。

如果我给一个样本,你能充气吗?如果该方法可行,我将考虑如何在MT5中实现它。

 
Aleksey Vyazmikin:

增加深度将有助于突出叶子中样本数量少的区域,另一点是有零的叶子的百分比可能会保持不变,然后后续的树又会掩盖这些单位。在训练这样的样本时,你可以看到在训练中间,召回率是如何归零的,然后又回到小百分比。

如果我给一个样本,你能充气吗?如果该方法可行,那么我将考虑如何在MT5中实现它。

是的,我可以,都是关于树叶之类的废话。班级必须是平衡的
 
马克西姆-德米特里夫斯基
,我可以。都是关于树叶之类的废话。班级必须是平衡的。

这里有 一个样本--分成3个部分,我理解只有train.csv需要修改?

目标列 "Target_100"--最后4列不参与训练(你可以关注那里的日期列)--你需要它来建立平衡。

Файл из Облака Mail.ru
Файл из Облака Mail.ru
  • cloud.mail.ru
Облако Mail.ru - это ваше персональное надежное хранилище в интернете.
 
Aleksey Vyazmikin:

看来我在文章中烧毁了一个有利可图的专家顾问(培训方法)。

图中显示了每个月末模型的财务结果,如果你对第一个模型进行12个月的训练,然后把每个新月份的历史加入到模型中--粘上USDRUB_TOM的期货Si 合约。

盈利的余额以相同的角度上升

如果再投资,则按几何级数 计算