Maxim Dmitrievsky #:
如果你拿到了就给我看看，我给你看看我的方法结果，我没有时间去完成。
它仍在开发中，在计算机资源方面是一个非常昂贵的过程，而我正在优化代码。
 
有趣的文章，值得思考的问题

 

移动窗口中标志的重要性（指标和价格）。

在某一时刻，该指标可能是10%的重要性，而在另一时刻，它可能是0.05%的重要性，这就是生活的真相)

如果你认为它解决了一切问题，你应该为它感到骄傲。


这就是费舍尔虹膜的四个标志的样子。


或者如果你放大滑动窗口。


 
很明显，虹膜（和类似问题）有一个稳定的模式。每一个用它们做实验的人都已经发现，所有的东西都会在引号中 "浮动"。

我想知道在图表的每个点上，指标的意义是如何不同的。它是针对所有训练线上建立的整个模型一次性确定的。还是你那里有5000个模型？
一般来说，要解释你的图表，上面有什么，以及它们是如何建立的。


 
有很多方法可以找出一个特征的信息量，有些你不需要训练一个模型。 我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/
它计算出特征的熵...

为什么每一点的重要性都不同？是的，因为特征的信息量是在一个滑动窗口中计算的，正如我上面写的那样。
因此，你必须寻找重要性没有跳跃的时期，你可以使用2个模型。否则，就是一团糟。

我在网上做了窗口培训，如果不按时间过滤就全部拿出来，性能很差。我当时没有想到要用过滤法来做。在我关于熵的文章中，有一个关于这种机器人的例子

最有可能的是，重要性的跳跃是由于熵的变化，如果像回报的迹象
但所有前门的信徒都有自己的现实，而不是基于实践。
 
我认为你需要寻找一个模式，并为它建立一个模型，往往MO不能建立一个模型，即使是一个可理解的模式，你必须用你的双手来做所有的事情。
嗯，有各种各样的复发网络，这里有一个

直接通过模式，寻找它的行为模式 :)

很简单：训练它，在测试中检查它，确定它脱落和工作的时期，得出结论/尝试过滤它，确定一个模式

你不应该把统计数字与MO分开，你应该把统计数字用于模型，它们是随机训练的

如果你知道这个模式，你就不需要MO了。
 
是的，原则上是可以的，甚至更好，按照这个顺序你可以在机器上做

或不倒））。

对我来说，没有必要做复杂的模型，一个简单的规则就足够了，否则就不能称之为模式。

我总是想做得更好）））。

 
我在比较 几种估计属性重要性的方法。我把最耗费资源的一个作为基准：通过逐个去除特征来训练模型。
快速方法与基准不吻合。它们也不相互匹配。fselector更快，我认为它也不会与任何东西相匹配。
