交易中的机器学习：理论、模型、实践和算法交易

JeeyCi 2021.11.07 16:35 #24921

eccocom#:
阅读TensorFlow文档，所有东西都是以构造函数的形式出现的。实际是。真的是黑盒子。如果你有兴趣，我可以给你手写的感知器的代码，顺便说一下，这都是矩阵计算，这就是它的基础。

我刚刚回来，看到 Evgeny Dyuka 和他的ServerNN（阅读代码）关于TensorFlow的帖子

因为我在爱好上看到了一种对Python库的批评。

在sklearn堆栈中，xgboost、lightGBM包有内置的方法来估计 "木头模型 "的特征重要性。

1.Gain
这个指标显示了每个特征对模型的相对贡献。为了计算这个指标，我们去看每个树节点，看哪个特征导致了节点分裂，根据这个指标（Gini杂质，信息增益），模型的不确定性降低了多少。
对于每个特征，其贡献在所有的树上相加。

2.封面
显示每个特征的观察值的数量。比方说，你有4个特征，3棵树。假设节点中的fich 1在树1、2和3中分别包含10、5和2个观测值。那么，给定fich的重要性将是17（10+5+2）。

3.频率
显示一个给定的特征在树节点中出现的频率，即它统计每棵树中每个特征的树分的总数。

所有这些方法的主要问题是，不清楚一个给定的特征到底是如何影响模型预测的。例如，我们已经了解到，收入水平在评估银行客户的贷款支付能力方面很重要。但究竟如何？更高的收入对模型预测的影响有多大？

我想在这里避免 "木制模型"，因为它们会占用大量的内存（而我是一个速度和紧凑的粉丝）...

- 总之，你的问题的答案是 "方便"，"感兴趣"。是的，我就是这么想的，神经网络都是矩阵计算（这就是为什么我在问它和它的图书馆）。

p.s.

我只是不明白，如果引文中的那些库不能预测多项式系数（回答：预测多少），那么它们怎么能描述一个动态模型？(不是线性，不是回归[这是同样的事情]）......这就是为什么到目前为止我还在想做一个模型（试图记住分化......有困难）。

Машинное обучение в трейдинге: теория, практика, торговля и не только

2021.10.23
www.mql5.com

Добрый день всем, Знаю, что есть на форуме энтузиасты machine learning и статистики...

eccocom 2021.11.07 16:45 #24922

JeeyCi#:

我刚刚回来，看到叶夫根尼-迪尤卡的一篇文章

因为我在爱好上看到了对Python库的某种批评。

在sklearn堆栈中，xgboost、lightGBM包有内置的方法来估计 "木头模型 "的特征重要性。

增益
这个指标显示了每个特征对模型的相对贡献。为了计算这个指标，我们去看每个树节点，看哪个特征导致了节点分裂，根据指标（基尼杂质，信息增益），模型的不确定性降低了多少。
对于每个特征，其贡献在所有的树上相加。
封面
显示每个特征的观测数量。比方说，你有4个特征，3棵树。假设节点中的fich 1在树1、2和3中分别包含10、5和2个观测值。那么这个fich的重要性是17（10+5+2）。
频率
显示一个给定的特征在树节点中出现的频率，即它计算每棵树中每个特征的树节点分区的总数。

所有这些方法的主要问题是，不清楚一个给定的特征到底是如何影响模型预测的。例如，我们已经了解到，收入水平在评估银行客户的贷款偿还能力方面很重要。但究竟如何？更高的收入对模型预测的影响有多大？

对于我的口味来说，蟒蛇被那些不知道如何烹饪的人批评。所有其他的事情都不需要用现成的解决方案，而是使用库来编写，顺便说一下，使用numpy，你可能会得到比C++更快的速度，因为它是用Fortran编写的。现在Python很容易与MT5集成，因此可以说是直来直去，它允许使用AI而不需要任何带套接字的服务器。

Aleksei Kuznetsov 2021.11.07 16:46 #24923

JeeyCi#:

我刚刚回来，看到叶夫根尼-迪尤卡的一篇文章

因为我在爱好上看到了对Python库的某种批评。

在sklearn堆栈中，xgboost、lightGBM包有内置的方法来估计 "木头模型 "的特征重要性。

增益
这个指标显示了每个特征对模型的相对贡献。为了计算这个指标，我们去看每个树节点，看哪个特征导致了节点分裂，根据指标（基尼杂质，信息增益），模型的不确定性降低了多少。
对于每个特征，其贡献在所有的树上相加。
封面
显示每个特征的观测数量。例如，你有4个特征，3棵树。假设节点中的fich 1在树1、2和3中分别包含10、5和2个观测值。那么这个fich的重要性是17（10+5+2）。
频率
显示一个给定的特征在树节点中出现的频率，即它计算每棵树中每个特征的树节点分区的总数。

所有这些方法的主要问题是，不清楚一个给定的特征到底是如何影响模型预测的。例如，我们已经了解到，收入水平在评估银行客户的贷款偿还能力方面很重要。但究竟如何？更高的收入对模型预测的影响有多大？

所有这些方法都是不合适的。这里是他们的验证https://www.mql5.com/ru/blogs/post/737458
树木和森林的数量很快--你也可以只是一个一个地添加/删除功能。并找到那些能改善的和那些能恶化的结果。

Сравнение разных методов оценки важности предикторов.

www.mql5.com

Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За

eccocom 2021.11.07 16:50 #24924

至于模型，这与它们无关，而是人工智能本质上是一个近似器，这是它在所有其他情况下的优势，除了市场，因为在平稳的海面下有太多的鱼和鹅卵石引起价格波动。虽然一切都建立在价格上的假设是真的，但这种情况太多了。一个神经网只能是某个系统的一小部分，谁要是不同意这一点，就是在搞自我欺骗。

mytarmailS 2021.11.07 17:07 #24925

eccocom#:
至于模型，这与它们无关，而是人工智能本质上是一个近似器，这是它在所有其他情况下的优势，除了市场，因为在平稳的海面下有太多的鱼和鹅卵石引起价格波动。虽然一切都建立在价格上的假设是真的，但这种情况太多了。神经网只能是某个系统的一小部分，谁要是不同意这一点，就是在搞自我欺骗。

还有，谁把更新者称为AI，他们是做什么的？)

eccocom 2021.11.07 17:44 #24926

mytarmailS#:
而不管是谁叫来的人工智能近似值，他们是做什么的？)

好吧，我把它称为人工智能可能是错误的，因为我的意思只是一个神经网络，但它是人工智能的一个特殊案例。我和其他人一样，在寻找圣杯，做的是面子工程，没有狂热)。我来到这里是为了寻找模型的想法（在神经网络的意义上），有一些东西可以分享给自己。20年的经验肯定是没有的，但对于一百个变种的NS我已经经历过了。短距离的最大效率，我达到了约68%，但你可能明白，这并不稳定，而且是因地制宜。

mytarmailS 2021.11.07 17:56 #24927

eccocom#:
好吧，我把它称为人工智能可能是错误的，因为我指的只是神经网络，这是人工智能的一个特例。我和其他人一样从事着寻找圣杯的工作，做得很面，没有狂热）。苏达来寻找关于模型的想法（正是在神经网络的意义上），有一些东西可以分享给我自己。20年的经验肯定是没有的，但对于一百个变体的NS我都经历过。我在短距离内达到的最大效率约为68%，但你可能明白，这并不稳定，而且是因地制宜。

是的，我当然知道...

但要小心那些有20年经验的专家，他们向别人乞求代码；)

eccocom 2021.11.07 18:27 #24928

mytarmailS#:
是的，我当然明白...

但要注意那个20多岁的专家，他一直在向别人乞求代码。 ;)

我不介意代码，只要这个人是好的）。顺便说一下，我读了米哈伊尔-马奇卡耶斯的文章，那里的一些想法也在我的使用范围内，但我的理由与作者完全不同。讨论哪些模型的变体与哪些层是最有效的，这将是很有趣的。从间接证据来看，Mikhail似乎使用了全链接的Sequential()层。

Mihail Marchukajtes

2021.10.12
www.mql5.com

Профиль трейдера

mytarmailS 2021.11.07 18:39 #24929

eccocom#:
我不介意代码，只要人好）。顺便说一下，我读了米哈伊尔-马奇卡耶斯的文章。我也使用了那里的一些想法，但我的理由与作者的完全不同。讨论哪些模型的变体与哪些层是最有效的，这将是很有趣的。从间接证据来看，Mikhail似乎使用了全链接的Sequential()层。

他根本不用神经元，他用的是作者现成的平庸程序（SVM和MSUA的某种混合体），他既不用Python也不用R编程，所以Sequential()这个词对他来说很陌生，他在神经网络方面有20年的经验，现在对它感兴趣还为时尚早...

eccocom 2021.11.07 18:59 #24930

mytarmailS#:
他根本不用神经元，他用的是作者现成的平庸程序（是SVM和MGUA的混合体），他不用Python或R代码编程，所以Sequental()这个词他不知道，20年的神经网络经验，现在介入还早...

)))).我明白了，看来你有相当大的沟通包袱。我自己可能写了10个印度教代码中的8个）），但如果能分享我的经验，我会很高兴。而且，如果能找到那些用Python写的人，不仅是神经网络，而且是一般的EA的整个结构，那就太好了。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2493