交易中的机器学习:理论、模型、实践和算法交易 - 页 584

 
马克西姆-德米特里耶夫斯基

你甚至不知道如何确定RF中预测因子的重要性,只给出了一些关于退火 之类的废话,却没有任何解释(这有什么关系?)

谁说过哪里有专门用于外汇应用的工作台? 为什么是Ada而不是GBM?你的答案太过模糊抽象。实际上,随着更多的过度训练,收益不会超过5%。

在进行讨论的层面上

让我澄清一下ALGLIB的水平--集体农场的水平,诺夫哥罗德附近的一个村庄。你曾多次写道,这个水平适合你。这很可能是,对于你的任务来说,这已经足够了,但为什么要得罪呢?


你不太擅长推崇一些关于退火 和贿赂的胡言乱语。

你不应该如此...

我几乎试过所有 R,这种退火方式是最有效的。


为什么是Ada而不是GBM?你的答案是太多模糊的抽象概念。实际上,在更多的过度训练中,收益不会超过5%。

因为我已经试过了,而不仅仅是他们。我仍然有这些协议。

是的,最好的是阿达?是的,相对于森林来说,减少5%,最多7%。而且我也不知道有什么比这更好的。

那么什么是 "大量的过度训练 "呢?你在说什么呢?至于过度训练,我想不起来你有哪一篇帖子表明你的模型没有过度训练!你是怎么做到的?

我只能重申,过度训练根本不取决于模型,它取决于。

  • 一组预测因子
  • 粗化模型的能力

[删除]  
桑桑尼茨-弗门科

在进行讨论的层面上

我澄清了ALGLIB的水平--集体农场的水平,诺夫哥罗德附近的村庄。你曾多次写道,这个水平适合你。这很可能是,这对你的任务来说已经足够了,但为什么要得罪呢?


你不太擅长推崇一些关于退火 和贿赂的胡言乱语。

你不应该如此...

我几乎试过所有的R,这种退火方式是最有效的。


为什么是Ada而不是GBM?你的答案是太多模糊的抽象概念。实际上,在更多的过度训练中,收益不会超过5%。

因为我已经试过了,而不仅仅是他们。我仍然有这些协议。

是的,最好的是阿达?是的,相对于森林来说,减少5%,最多7%。而且我也不知道有什么比这更好的。

那么什么是 "大量的过度训练 "呢?你在说什么呢?至于过度训练,我想不起来你有哪一篇帖子表明你的模型没有过度训练!你是怎么做到的?

我只能重申,过度训练根本不取决于模型,它取决于。

  • 一组预测因子
  • 粗化模型的能力。


分级和提升的区别是什么? 在分级中,最初的拟合较少,更多的是机会因素,而在提升中,一个人被拟合在第二个人的遗体上,然后是第三个人,如此类推。而你最终的结果是完全超标。也就是说,射频从一开始就已经可以做得很 "粗 "了,但我要仔细检查一下,我还没有时间。

我所有的模型都是重新训练的:)因为我还没有为它们找到任何永久的模式。

Alglib几乎拥有一切--卷积、PCA、聚类、神经网络集合、FOREST......所以,根据经典,一切都在那里,你还需要什么--我不明白:)更现代的东西,当然不是

而作者写道,他并没有非常崇敬地对待神经网络等,而是认为它们是通常的分类/回归的工具,并没有把它们从其他方法中挑出来。我喜欢这种现实的做法。

关于退火等等,我也不明白--是否有一个通用的方法来评估每个模型?

 
马克西姆-德米特里耶夫斯基

敲打和吹嘘的区别是什么? 在敲打中,最初的调整较少,更多的是机会因素,但在吹嘘中,一个人是在第二个人的剩余物上进行调整,然后在第三个人的剩余物上进行调整,以此类推。而你最终的结果是完全超标。也就是说,射频从一开始就已经可以做得很 "粗 "了,但我要仔细检查一下,我还没有时间。

我所有的模型都是重新训练的:)因为我还没有为它们找到任何永久的模式。

Alglib几乎拥有一切--卷积、PCA、聚类、神经网络集合、FOREST......所以,根据经典,一切都在那里,你还需要什么--我不明白:)更现代的东西,当然不是

而作者写道,他并没有非常崇敬地对待神经网络等,而是认为它们是通常的分类/回归的工具,并没有把它们从其他方法中挑出来。我喜欢这种现实的做法。

关于退火等等,我也不明白--它是所有模型的通用方法吗? 每个模型都应该有自己的评估方法,通过它可以以最好的方式训练这个特定的东西。

我曾多次试图从我的角度向你解释一些基本的东西。我失败了。


我只能建议:花几个月时间在caret上,你会有不同的思维方式,有质的变化。

 
马克西姆-德米特里耶夫斯基

至于退火等等,也不清楚--是对所有模型的一些通用方法还是什么? 每个模型都应该有自己的评估方式,通过这个特定的东西可以以最佳方式进行训练

退火是非洲的退火,目标/目的大致相同。允许模型找到的不是局部的最小值,而是全局的最小值。

我不知道ADA的情况,但对NS来说,退火的结果非常好。我不喜欢内置的,因为退火参数需要提前设置,所以我手动退火,根据之前学习的结果改变参数。

HZZ 顺便说一下,或多或少复杂的NS没有退火一般不会真正教什么。

 
马克西姆-德米特里耶夫斯基

是的,但它是如此优越,以至于我不会在这个阶段把它拖进来 :)+ 他写道,每年的收入不可能超过20%......我想你应该总是从这样的陈述开始,然后深入到细节中去 :)

马克西姆,停止吸烟。断章取义,把别人的话归于他人,等等。
+部分评论被删除。同样,不要把响尾蛇 一词的作者身份归于法(Fomenko))。

[删除]  
蜴_

马克西姆卡,停止吸烟。你断章取义,把别人的话归到别人身上,等等。+有些评论已经被删除。
+ 一些评论已被删除。另外,不要把响尾蛇 这个词的作者身份归于法(Fomenko))。


我只是说 :) 你心里想的就是你的舌头。

然后就会有东西出现......工作流程是不人性化的。

我对异响的看法是错误的)。SanSanych曾经写过同样的话......胡说八道或类似的话

 

(由于无所事事,完全没有任何进一步工作的想法,我决定学习一些新东西,当然是为了自己--也许已经很老了)。从射频开始,通过射频来到Python,因为它与我的SciLab软件双向兼容(如他们所说)。现在我是来审查Python的软件包的。

总共有120,000多个包裹。从他们身上,关于机器学习--大约70个,关于神经网络,包括深度学习--大约70个。可能还有更多--我搜索了一下评分标准,有些包可能出现在其他部分。

这还不算由其他公司直接分发的包裹。也有很多这样的套餐。 也有对我们感兴趣的主题--我自己看过,包括国防部、俄罗斯联邦国民议会和ADA。

在其他公司中,有机器学习、树、NS和与ADA有关的东西。

许多软件包都是用C/C++制作的,所以不需要担心性能问题--Python只是一种接口(脚本语言)。事实上,R也是如此。

总而言之,我过得很有趣)。

 
马克西姆-德米特里耶夫斯基

为什么是Ada而不是GBM?你的答案中有太多模糊的抽象概念。在现实中,随着更多的过度训练,收益不会超过5%。

在评分中,使用 "准确性"--正确答案的百分比--来评价一个模型是非常常见的。在我看来,这是对交易模式最薄弱和最不恰当的评价之一,应该避免。我在这里建议尝试其他一些方法--卡帕、f-score、logloss。

R中的Ada(也许不仅仅是R中)在训练中使用了稍微不同的内置分类模型估计,与 "准确性 "相比,它要好得多。

[删除]  
尤里-阿索连科

(由于无所事事,完全没有任何进一步工作的想法,我决定学习一些新东西,当然是为了自己--也许已经很老了)。从射频开始,通过射频来到Python,因为它与我的SciLab软件双向兼容(如他们所说)。现在我来到了包装审查。

总共有超过12万个包裹。其中约70个关于机器学习,约70个关于神经网络,包括深度学习。可能还有更多--我是按评分标准搜索的,有些包可能出现在其他部分。

这还不算由其他公司直接分发的包裹。也有很多这样的套餐。 也有对我们感兴趣的主题--我自己看过,包括国防部、俄罗斯联邦国民议会和ADA。

在其他公司中,有机器学习、树、NS和与ADA有关的东西。

许多软件包都是用C/C++制作的,所以不需要担心性能问题--Python只是一种接口(脚本语言)。事实上,R也是如此。

总而言之,我过得很有趣)。

查看更多这些东西 https://cloud.google.com/datalab/

邪恶的是,AutoML的方向也在那里发展--服务将为某些任务自己挑选一个模型。

Cloud Datalab - Interactive Data Insights Tool  |  Google Cloud Platform
Cloud Datalab - Interactive Data Insights Tool  |  Google Cloud Platform
  • cloud.google.com
Integrated Cloud Datalab simplifies data processing with Cloud BigQuery, Cloud Machine Learning Engine, Cloud Storage, and Stackdriver Monitoring. Authentication, cloud computation and source control are taken care of out-of-the-box. Multi-Language Support Cloud Datalab currently supports Python, SQL, and JavaScript (for BigQuery...
[删除]  
交易员博士

在分类中,使用 "准确性"--正确答案的百分比--来评估一个模型是非常常见的。在我看来,这是对交易模式最薄弱和最不恰当的评价之一,应该避免。我在这里建议尝试其他一些方法--卡帕、f-score、logloss。

R中的Ada(也许不仅仅是R中)在训练中使用了一个稍微不同的内置分类模型估计,与 "准确性 "相比,它要好得多。


对于一般的交易来说,很难这样评价,因为有交易持续时间和止损水平应该加入其他的东西,而且程序本身也会定期重新训练......所以这是个遗憾 :)