交易中的机器学习:理论、模型、实践和算法交易 - 页 2758

 
Maxim Dmitrievsky #:
重新取样是为了剔除异常值、平滑样本

我一般是建议通过熵来寻找相关性,从而进行有意义的取样。使芯片的信息量更大。另外,通过各种变换,将增量添加到原始序列的最大信息量中。再加上一个非固定的停顿窗口。这是一种新方法,还没有人这么做过。但我得到了一些冠状病毒的垃圾,我正在休息 ☺️。

1.重采样并不能去除异常值。有一些方案,你可以用 Kolkhoz 的方法来做:将所有大于 +/- 0.005 的相应量化值都改成这个值。统计数据会发生显著变化。

2.非常有趣,尤其是在熵方面。相关性是针对静态序列的,我们 可以 不考虑它

 
Maxim Dmitrievsky #: 再加上一个不固定的口吃窗口。

什么是不固定的卡顿窗口?每一行的特征/列数不同?但您应该始终将相同数量的列输入模型。

[删除]  
СанСаныч Фоменко #:

1.离群值的重采样没有去除。有一些方案,但我们可以用 Kolkhoz 的方法来做:我们把大于 +/- 0.005 的相应量值都改成这个值。统计数据的变化令人惊讶。

2.非常有趣,尤其是在熵方面。相关性是针对静态序列的,你 可以 不用管它

对所有包含高斯的数据进行重采样,就能消除相关性。
[删除]  
elibrarius #:

什么是未承诺窗口?每一行的特征/列数不同?但您应该始终将相同数量的列输入模型。

如果修改者没有清理的话,我不久前在某个地方写过上面的内容。
 
Maxim Dmitrievsky #:
以上内容是最近写的,如果管理员没有清理的话

搜索 "未修改的窗口",只有这一页

 
Maxim Dmitrievsky #:
对任何含有高斯的内容进行重采样 - 删除高斯

奇怪,但非常聪明。

[删除]  
elibrarius #:

搜索 "非固定窗口",只能找到这个页面

有一种关于分形之类的想法认为,最后一个价格并不总是具有最好的预测能力。也就是说,有时有必要通过条件停止窗口,或通过另一个 ns 来固定窗口,以便让之前的条形图参与预测,而不是最后的条形图。因此,它应该在历史中来回运行。
[删除]  
СанСаныч Фоменко #:

很好奇,但非常复杂。

试试高斯混合物,我有一篇文章介绍过它。这是一个生成模型。在增量上比自动编码器更有效。
 
Maxim Dmitrievsky #:
重新取样是为了去除异常值,对样本进行高斯化处理

我一般是建议通过熵或相关性进行有意义的取样。使芯片的信息量更大。另外,通过各种变换,从原始序列中提取增量并为其添加最大信息量。再加上一个非固定的滞后窗口。这是一个新手方法,没有人做过这个。但我得到了一些冠状病毒的垃圾,我正在休息 ☺️。

随意推断本来是为了帮助挑选出信息丰富的选件,但结果却与此无关。

完全不清楚。

我很清楚,我需要在时间序列的不同部分使用不同的窗口。但问题是个老问题:如果在某一段上选择了一个窗口,那么在下一段上就不一定是同一个窗口,这就是窗口宽度非稳态的变种。

[删除]  
СанСаныч Фоменко #:

这一点也不清楚。

我可以肯定的是,有必要在时间序列的不同部分设置不同的窗口。但问题是个老问题:如果你在某个部分选取一个窗口,那么这个窗口不一定会在下一个部分,这就是窗口宽度非稳态的变种。

我的脑袋木木的,待会再举个例子
例如,有一组筹码预测会长期下跌。那么就没有必要每隔一格就移动窗口,而是在新的一格上提交相同的特征。以此类推,直到某个点,这时再移动一次。这些点也将被填充。