文章 "梯度提升(CatBoost)在交易系统开发中的应用. 初级的方法" - 页 7 12345678910 新评论 Jacob James 2020.12.01 14:22 #61 这是完全错误的方法。你不能基于相同的训练和测试数据集生成一个模型,然后说它有效,这是毫无用处和毫无根据的。这就是所谓的曲线拟合模型。这样的模型在纸面上看起来很好,但在现实世界中永远行不通。请使用正确的机器学习方法,有多种方法可以做到这一点,但你的方法是完全错误的。 Maxim Dmitrievsky 2020.12.01 14:33 #62 Jacob James: 这是完全错误的方法。你不能基于相同的训练和测试数据集生成一个模型,然后说它有效,这是毫无用处和毫无根据的。这就是所谓的曲线拟合模型。这样的模型在纸面上看起来很好,但在现实世界中永远行不通。请使用正确的机器学习方法,有几种方法可以做到这一点,但你的方法是完全错误的。 我认为你们俩都完全错了,伙计们。标记为 "幼稚方法 "的文章是 CatBoost 模型的介绍。没有人禁止你们用新数据来测试模型。在文章的最后,你还可以看到 "新数据测试+学习期"。 请仔细阅读文章,因为下一部分就在路上。 mytarmailS 2020.12.04 19:27 #63 Maxim Dmitrievsky: 虽然一切都简单到了不可能的地步,但还是很难理解别人的想法....。 我能说什么呢? 1)标志肯定不是最好的,范围很大。 2)在训练分类器之前没有必要混合数据(我检查过)。 3)真正有价值的是目标,正是它拉动了整篇文章(我将它与 ZZ 进行了比较,ZZ 简直是垃圾)。 总的来说,方法如下--最大限度地 "只为在验证中获得好结果而行动" 我们选择最佳模型 )))) 我就是这样 "移动 "的。 但事实上,这与我优化神经元权重时所说的方法是一样的,只是我立即 "移动 "了最大利润。 好吧,我不知道还能写些什么... Maxim Dmitrievsky 2020.12.04 19:32 #64 mytarmailS:虽然一切都简单到了不可能的地步,但我还是很难理解别人的想法....。我能说什么呢?1) 标识不是最好的,有很大的空间。2)在训练分类器之前没有必要洗数据(我检查过)。3)真正有价值的是目标,它能拉动整篇文章(与 ZZ 相比,ZZ 简直是垃圾)总的来说,方法如下--我们 "尽可能地移动所有数据,只为在验证时得到一个好结果"。并选择最佳模型 ))))我就是这样 "移动 "的。但事实上,这与我优化 neuronkey 权重时所说的方法是一样的,只不过我是将它移动到最大利润处。好吧,我不知道还能写些什么... 如果没有 GMM,就不能这样做。另外,你没有意识到训练的时间间隔有多短,以及模型在新数据上的寿命有多长。这并不是极限,我们有办法延长模型的寿命。整个方法是一个有机的整体,你不能把各个部分割裂开来。 是的,你可以尝试更有意义的方法。使用它,改进它 mytarmailS 2020.12.04 20:57 #65 Maxim Dmitrievsky:没有 GMM 就无法做到这一点。另外,你没有查看训练的时间间隔有多短,以及模型在新数据上的寿命有多长。这并不是极限,还有办法延长寿命。整个方法是有机的一体,你不能把各个部分分开。是的,你可以尝试更有意义的方法。使用它,改进它 我明天用 gmm 试试。 Maxim Dmitrievsky 2020.12.04 21:23 #66 mytarmailS:我明天用 gmm 试试。 哦,那是你写的文章。那么是的。这是一篇介绍性的文章,以免读者完全摸不着头脑。 mytarmailS 2020.12.04 21:40 #67 Maxim Dmitrievsky: 哦,这就是你写的那篇文章。是啊这是一篇介绍性的文章 防止读者完全走入歧途 是的,我想我应该按顺序来写 Alexander 2020.12.24 10:49 #68 一般来说,如果不使用 Shuffle,系统会立即开始预期的耗电。 Maxim Dmitrievsky 2020.12.24 17:31 #69 Александр: 一般来说,如果不使用 Shuffle,系统会立即开始出现预期的耗电。 现在您可以跳到下一篇文章 Yu Zhang 2021.07.16 09:04 #70 我用了,要么是我自己做的,要么是我用了你提供的。 有 以下错误。 12345678910 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
这是完全错误的方法。你不能基于相同的训练和测试数据集生成一个模型,然后说它有效,这是毫无用处和毫无根据的。这就是所谓的曲线拟合模型。这样的模型在纸面上看起来很好,但在现实世界中永远行不通。请使用正确的机器学习方法,有几种方法可以做到这一点,但你的方法是完全错误的。
我认为你们俩都完全错了,伙计们。标记为 "幼稚方法 "的文章是 CatBoost 模型的介绍。没有人禁止你们用新数据来测试模型。在文章的最后,你还可以看到 "新数据测试+学习期"。
请仔细阅读文章,因为下一部分就在路上。虽然一切都简单到了不可能的地步,但还是很难理解别人的想法....。
我能说什么呢?
1)标志肯定不是最好的,范围很大。
2)在训练分类器之前没有必要混合数据(我检查过)。
3)真正有价值的是目标,正是它拉动了整篇文章(我将它与 ZZ 进行了比较,ZZ 简直是垃圾)。
总的来说,方法如下--最大限度地 "只为在验证中获得好结果而行动"
我们选择最佳模型 ))))
我就是这样 "移动 "的。
但事实上,这与我优化神经元权重时所说的方法是一样的,只是我立即 "移动 "了最大利润。
好吧,我不知道还能写些什么...
虽然一切都简单到了不可能的地步,但我还是很难理解别人的想法....。
我能说什么呢?
1) 标识不是最好的,有很大的空间。
2)在训练分类器之前没有必要洗数据(我检查过)。
3)真正有价值的是目标,它能拉动整篇文章(与 ZZ 相比,ZZ 简直是垃圾)
总的来说,方法如下--我们 "尽可能地移动所有数据,只为在验证时得到一个好结果"。
并选择最佳模型 ))))
我就是这样 "移动 "的。
但事实上,这与我优化 neuronkey 权重时所说的方法是一样的,只不过我是将它移动到最大利润处。
好吧,我不知道还能写些什么...
如果没有 GMM,就不能这样做。另外,你没有意识到训练的时间间隔有多短,以及模型在新数据上的寿命有多长。这并不是极限,我们有办法延长模型的寿命。整个方法是一个有机的整体,你不能把各个部分割裂开来。
是的,你可以尝试更有意义的方法。使用它,改进它
没有 GMM 就无法做到这一点。另外,你没有查看训练的时间间隔有多短,以及模型在新数据上的寿命有多长。这并不是极限,还有办法延长寿命。整个方法是有机的一体,你不能把各个部分分开。
是的,你可以尝试更有意义的方法。使用它,改进它
我明天用 gmm 试试。
我明天用 gmm 试试。
哦,这就是你写的那篇文章。是啊这是一篇介绍性的文章 防止读者完全走入歧途
是的,我想我应该按顺序来写
一般来说,如果不使用 Shuffle,系统会立即开始出现预期的耗电。
现在您可以跳到下一篇文章