交易中的机器学习:理论、模型、实践和算法交易 - 页 2493

 
eccocom#:
阅读TensorFlow文档,所有东西都是以构造函数的形式出现的。实际是。真的是黑盒子。如果你有兴趣,我可以给你手写的感知器的代码,顺便说一下,这都是矩阵计算,这就是它的基础。

我刚刚回来,看到 Evgeny Dyuka 和他的ServerNN(阅读代码)关于TensorFlow的 帖子

因为我在爱好上看到了一种对Python库的批评。

在sklearn堆栈中,xgboost、lightGBM包有内置的方法来估计 "木头模型 "的特征重要性。

1.Gain
这个指标显示了每个特征对模型的相对贡献。为了计算这个指标,我们去看每个树节点,看哪个特征导致了节点分裂,根据这个指标(Gini杂质,信息增益),模型的不确定性降低了多少。
对于每个特征,其贡献在所有的树上相加。

2.封面
显示每个特征的观察值的数量。比方说,你有4个特征,3棵树。假设节点中的fich 1在树1、2和3中分别包含10、5和2个观测值。 那么,给定fich的重要性将是17(10+5+2)。

3.频率
显示一个给定的特征在树节点中出现的频率,即它统计每棵树中每个特征的树分的总数。

所有这些方法的主要问题是,不清楚一个给定的特征到底是如何影响模型预测的。例如,我们已经了解到,收入水平在评估银行客户的贷款支付能力方面很重要。但究竟如何?更高的收入对模型预测的影响有多大?

我想在这里避免 "木制模型",因为它们会占用大量的内存(而我是一个速度和紧凑的粉丝)...

- 总之,你的问题的答案是 "方便","感兴趣"。是的,我就是这么想的,神经网络都是矩阵计算(这就是为什么我在问它和它的图书馆)。

p.s.

我只是不明白,如果引文中的那些库不能预测多项式系数(回答:预测多少),那么它们怎么能描述一个动态模型?(不是线性,不是回归[这是同样的事情])......这就是为什么到目前为止我还在想做一个模型(试图记住分化......有困难)。

Машинное обучение в трейдинге: теория, практика, торговля и не только
Машинное обучение в трейдинге: теория, практика, торговля и не только
  • 2021.10.23
  • www.mql5.com
Добрый день всем, Знаю, что есть на форуме энтузиасты machine learning и статистики...
 
JeeyCi#:

我刚刚回来,看到叶夫根尼-迪尤卡的一篇文章

因为我在爱好上看到了对Python库的某种批评。

在sklearn堆栈中,xgboost、lightGBM包有内置的方法来估计 "木头模型 "的特征重要性。

  1. 增益
    这个指标显示了每个特征对模型的相对贡献。为了计算这个指标,我们去看每个树节点,看哪个特征导致了节点分裂,根据指标(基尼杂质,信息增益),模型的不确定性降低了多少。
    对于每个特征,其贡献在所有的树上相加。
  2. 封面
    显示每个特征的观测数量。比方说,你有4个特征,3棵树。假设节点中的fich 1在树1、2和3中分别包含10、5和2个观测值。 那么这个fich的重要性是17(10+5+2)。
  3. 频率
    显示一个给定的特征在树节点中出现的频率,即它计算每棵树中每个特征的树节点分区的总数。


所有这些方法的主要问题是,不清楚一个给定的特征到底是如何影响模型预测的。例如,我们已经了解到,收入水平在评估银行客户的贷款偿还能力方面很重要。但究竟如何?更高的收入对模型预测的影响有多大?

对于我的口味来说,蟒蛇被那些不知道如何烹饪的人批评。所有其他的事情都不需要用现成的解决方案,而是使用库来编写,顺便说一下,使用numpy,你可能会得到比C++更快的速度,因为它是用Fortran编写的。现在Python很容易与MT5集成,因此可以说是直来直去,它允许使用AI而不需要任何带套接字的服务器。

 
JeeyCi#:

我刚刚回来,看到叶夫根尼-迪尤卡的一篇文章

因为我在爱好上看到了对Python库的某种批评。

在sklearn堆栈中,xgboost、lightGBM包有内置的方法来估计 "木头模型 "的特征重要性。

  1. 增益
    这个指标显示了每个特征对模型的相对贡献。为了计算这个指标,我们去看每个树节点,看哪个特征导致了节点分裂,根据指标(基尼杂质,信息增益),模型的不确定性降低了多少。
    对于每个特征,其贡献在所有的树上相加。
  2. 封面
    显示每个特征的观测数量。例如,你有4个特征,3棵树。假设节点中的fich 1在树1、2和3中分别包含10、5和2个观测值。 那么这个fich的重要性是17(10+5+2)。
  3. 频率
    显示一个给定的特征在树节点中出现的频率,即它计算每棵树中每个特征的树节点分区的总数。


所有这些方法的主要问题是,不清楚一个给定的特征到底是如何影响模型预测的。例如,我们已经了解到,收入水平在评估银行客户的贷款偿还能力方面很重要。但究竟如何?更高的收入对模型预测的影响有多大?

所有这些方法都是不合适的。这里是他们的验证https://www.mql5.com/ru/blogs/post/737458
树木和森林的数量很快--你也可以只是一个一个地添加/删除功能。并找到那些能改善的和那些能恶化的结果。

Сравнение разных методов оценки важности предикторов.
Сравнение разных методов оценки важности предикторов.
  • www.mql5.com
Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За
 
至于模型,这与它们无关,而是人工智能本质上是一个近似器,这是它在所有其他情况下的优势,除了市场,因为在平稳的海面下有太多的鱼和鹅卵石引起价格波动。虽然一切都建立在价格上的假设是真的,但这种情况太多了。一个神经网只能是某个系统的一小部分,谁要是不同意这一点,就是在搞自我欺骗。
 
eccocom#:
至于模型,这与它们无关,而是人工智能本质上是一个近似器,这是它在所有其他情况下的优势,除了市场,因为在平稳的海面下有太多的鱼和鹅卵石引起价格波动。虽然一切都建立在价格上的假设是真的,但这种情况太多了。神经网只能是某个系统的一小部分,谁要是不同意这一点,就是在搞自我欺骗。
还有,谁把更新者称为AI,他们是做什么的?)
 
mytarmailS#:
而不管是谁叫来的人工智能近似值,他们是做什么的?)
好吧,我把它称为人工智能可能是错误的,因为我的意思只是一个神经网络,但它是人工智能的一个特殊案例。我和其他人一样,在寻找圣杯,做的是面子工程,没有狂热)。我来到这里是为了寻找模型的想法(在神经网络的意义上),有一些东西可以分享给自己。20年的经验肯定是没有的,但对于一百个变种的NS我已经经历过了。短距离的最大效率,我达到了约68%,但你可能明白,这并不稳定,而且是因地制宜。
 
eccocom#:
好吧,我把它称为人工智能可能是错误的,因为我指的只是神经网络,这是人工智能的一个特例。我和其他人一样从事着寻找圣杯的工作,做得很面,没有狂热)。苏达来寻找关于模型的想法(正是在神经网络的意义上),有一些东西可以分享给我自己。20年的经验肯定是没有的,但对于一百个变体的NS我都经历过。我在短距离内达到的最大效率约为68%,但你可能明白,这并不稳定,而且是因地制宜。
是的,我当然知道...
但要小心那些有20年经验的专家,他们向别人乞求代码;)
 
mytarmailS#:
是的,我当然明白...
但要注意那个20多岁的专家,他一直在向别人乞求代码。 ;)
我不介意代码,只要这个人是好的)。顺便说一下,我读了米哈伊尔-马奇卡耶斯的 文章,那里的一些想法也在我的使用范围内,但我的理由与作者完全不同讨论哪些模型的变体与哪些层是最有效的,这将是很有趣的。从间接证据来看,Mikhail似乎使用了全链接的Sequential()层。

Mihail Marchukajtes
Mihail Marchukajtes
  • 2021.10.12
  • www.mql5.com
Профиль трейдера
 
eccocom#:
我不介意代码,只要人好)。顺便说一下,我读了米哈伊尔-马奇卡耶斯的 文章。 我也使用了那里的一些想法,但我的理由与作者的完全不同讨论哪些模型的变体与哪些层是最有效的,这将是很有趣的。从间接证据来看,Mikhail似乎使用了全链接的Sequential()层。

他根本不用神经元,他用的是作者现成的平庸程序(SVM和MSUA的某种混合体),他既不用Python也不用R编程,所以Sequential()这个词对他来说很陌生,他在神经网络方面有20年的经验,现在对它感兴趣还为时尚早...


 
mytarmailS#:
他根本不用神经元,他用的是作者现成的平庸程序(是SVM和MGUA的混合体),他不用Python或R代码编程,所以Sequental()这个词他不知道,20年的神经网络经验,现在介入还早...


)))).我明白了,看来你有相当大的沟通包袱。我自己可能写了10个印度教代码 中的8个)),但如果能分享我的经验,我会很高兴而且,如果能找到那些用Python写的人,不仅是神经网络,而且是一般的EA的整个结构,那就太好了。