交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2022.04.07 22:01 #26251
Maxim Dmitrievsky #: 如果你拿到了就给我看看，我给你看看我的方法结果，我没有时间去完成。
它仍在开发中，在计算机资源方面是一个非常昂贵的过程，而我正在优化代码。

mytarmailS 2022.04.11 15:52 #26252
有趣的文章，值得思考的问题https://www.autodesk.com/research/publications/same-stats-different-graphs

mytarmailS 2022.04.12 14:05 #26253
移动窗口中标志的重要性（指标和价格）。
在某一时刻，该指标可能是10%的重要性，而在另一时刻，它可能是0.05%的重要性，这就是生活的真相)
如果你认为它解决了一切问题，你应该为它感到骄傲。
这就是费舍尔虹膜的四个标志的样子。
或者如果你放大滑动窗口。

Aleksei Kuznetsov 2022.04.12 23:09 #26254
mytarmailS #:移动窗口中标志的重要性（指标和价格）。在某一时刻，该指标可能是10%的重要性，而在另一时刻，它可能是0.05%的重要性，这就是生活的真相)如果你认为它解决了一切问题，你应该为它感到骄傲。这就是费舍尔虹膜的四个标志的样子。或者如果你放大滑动窗口。
很明显，虹膜（和类似问题）有一个稳定的模式。每一个用它们做实验的人都已经发现，所有的东西都会在引号中 "浮动"。
我想知道在图表的每个点上，指标的意义是如何不同的。它是针对所有训练线上建立的整个模型一次性确定的。还是你那里有5000个模型？
一般来说，要解释你的图表，上面有什么，以及它们是如何建立的。

mytarmailS 2022.04.12 23:22 #26255
elibrarius #:虹膜（和类似问题）有一个稳定的模式，这个事实已经很清楚了。而一切 "漂浮 "在引号中的事实，也是每个做过实验的人都清楚的。我想知道在图表的每个点上，指标的意义是如何不同的。它是针对所有训练线上建立的整个模型一次性确定的。还是你那里有5000个模型？
一般来说，解释你的图表，上面有什么，以及它们是如何建立的。
有很多方法可以找出一个特征的信息量，有些你不需要训练一个模型。
我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/它计算出特征的熵...为什么每一点的重要性都不同？是的，因为特征的信息量是在一个滑动窗口中计算的，正如我上面写的那样。

[删除] 2022.04.13 06:43 #26256
mytarmailS #:
有很多方法可以找出性状的信息量，对于一些人来说，你不需要训练一个模型。
我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/他计算了特征的熵...
为什么每一点的重要性都不同？是的，因为特征的信息量是在我上面写的滑动窗口中计算的。
因此，你必须寻找重要性没有跳跃的时期，你可以使用2个模型。否则，就是一团糟。
我在网上做了窗口培训，如果不按时间过滤就全部拿出来，性能很差。我当时没有想到要用过滤法来做。在我关于熵的文章中，有一个关于这种机器人的例子
最有可能的是，重要性的跳跃是由于熵的变化，如果像回报的迹象
但所有前门的信徒都有自己的现实，而不是基于实践。

mytarmailS 2022.04.13 07:07 #26257
Maxim Dmitrievsky #:但各种前门的信徒都有自己的现实，不是基于实践的。
那是什么？我认为你需要寻找一个模式，并为它建立一个模型，往往MO不能建立一个模型，即使是一个可理解的模式，你必须用你的双手来做所有的事情。

[删除] 2022.04.13 07:09 #26258
mytarmailS #:
那是什么？
我认为你需要寻找一个模式，并为它建立一个模型，往往MO不能建立一个模型，即使是一个可理解的模式，你必须全部手工完成。
嗯，有各种各样的复发网络，这里有一个
直接通过模式，寻找它的行为模式 :)很简单：训练它，在测试中检查它，确定它脱落和工作的时期，得出结论/尝试过滤它，确定一个模式你不应该把统计数字与MO分开，你应该把统计数字用于模型，它们是随机训练的如果你知道这个模式，你就不需要MO了。

mytarmailS 2022.04.13 08:29 #26259
Maxim Dmitrievsky #:
你应该直接去找模型，找一个模式，在那里它的行为就像一个模式一样:)
如果非常简单：教它，在考试中测试它，确定它倾泻和工作的时期，得出结论/尝试过滤它，确定一个模式
是的，原则上是可以的，甚至更好，按照这个顺序你可以在机器上做
Maxim Dmitrievsky#:
如果很简单：教学，测试，确定浇灌和工作的时期，得出结论/试图过滤掉，检测出一个模式
或不倒））。
Maxim Dmitrievsky#:
你不应该把统计数字与MO分开，你应该把统计数字用于模型，它们是随机训练的
对我来说，没有必要做复杂的模型，一个简单的规则就足够了，否则就不能称之为模式。
Maxim Dmitrievsky#:
如果你知道这个模式，那么MO就没有必要了。
我总是想做得更好）））。

Aleksei Kuznetsov 2022.04.13 08:35 #26260
mytarmailS #:
有很多方法可以找出一个特征的信息量，有些你不需要训练一个模型。
我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/他计算了特征的熵...
为什么每一点的重要性都不同？是的，因为特征的信息量是在滑动窗口中计算的，正如我上面写的那样
我在比较
几种估计属性重要性的方法。我把最耗费资源的一个作为基准：通过逐个去除特征来训练模型。
快速方法与基准不吻合。它们也不相互匹配。fselector更快，我认为它也不会与任何东西相匹配。
Сравнение разных методов оценки важности предикторов.
www.mql5.com
Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За
很明显，虹膜（和类似问题）有一个稳定的模式。每一个用它们做实验的人都已经发现，所有的东西都会在引号中 "浮动"。
我想知道在图表的每个点上，指标的意义是如何不同的。它是针对所有训练线上建立的整个模型一次性确定的。还是你那里有5000个模型？
一般来说，要解释你的图表，上面有什么，以及它们是如何建立的。
虹膜（和类似问题）有一个稳定的模式，这个事实已经很清楚了。而一切 "漂浮 "在引号中的事实，也是每个做过实验的人都清楚的。
我想知道在图表的每个点上，指标的意义是如何不同的。它是针对所有训练线上建立的整个模型一次性确定的。还是你那里有5000个模型？
一般来说，解释你的图表，上面有什么，以及它们是如何建立的。
有很多方法可以找出性状的信息量，对于一些人来说，你不需要训练一个模型。 我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/
我在网上做了窗口培训，如果不按时间过滤就全部拿出来，性能很差。我当时没有想到要用过滤法来做。在我关于熵的文章中，有一个关于这种机器人的例子
那是什么？
嗯，有各种各样的复发网络，这里有一个直接通过模式，寻找它的行为模式 :)
你应该直接去找模型，找一个模式，在那里它的行为就像一个模式一样:)
如果非常简单：教它，在考试中测试它，确定它倾泻和工作的时期，得出结论/尝试过滤它，确定一个模式
是的，原则上是可以的，甚至更好，按照这个顺序你可以在机器上做
或不倒））。
对我来说，没有必要做复杂的模型，一个简单的规则就足够了，否则就不能称之为模式。
我总是想做得更好）））。
有很多方法可以找出一个特征的信息量，有些你不需要训练一个模型。 我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/
快速方法与基准不吻合。它们也不相互匹配。fselector更快，我认为它也不会与任何东西相匹配。