交易中的机器学习：理论、模型、实践和算法交易

СанСаныч Фоменко 2022.09.27 10:38 #27571

Maxim Dmitrievsky #:
重新取样是为了剔除异常值、平滑样本

我一般是建议通过熵来寻找相关性，从而进行有意义的取样。使芯片的信息量更大。另外，通过各种变换，将增量添加到原始序列的最大信息量中。再加上一个非固定的停顿窗口。这是一种新方法，还没有人这么做过。但我得到了一些冠状病毒的垃圾，我正在休息 ☺️。

1.重采样并不能去除异常值。有一些方案，你可以用 Kolkhoz 的方法来做：将所有大于 +/- 0.005 的相应量化值都改成这个值。统计数据会发生显著变化。

2.非常有趣，尤其是在熵方面。相关性是针对静态序列的，我们可以不考虑它。

Aleksei Kuznetsov 2022.09.27 10:39 #27572

Maxim Dmitrievsky #: 再加上一个不固定的口吃窗口。

什么是不固定的卡顿窗口？每一行的特征/列数不同？但您应该始终将相同数量的列输入模型。

[删除] 2022.09.27 10:41 #27573

СанСаныч Фоменко #:

1.离群值的重采样没有去除。有一些方案，但我们可以用 Kolkhoz 的方法来做：我们把大于 +/- 0.005 的相应量值都改成这个值。统计数据的变化令人惊讶。

2.非常有趣，尤其是在熵方面。相关性是针对静态序列的，你可以不用管它。

对所有包含高斯的数据进行重采样，就能消除相关性。

[删除] 2022.09.27 10:42 #27574

elibrarius #:

什么是未承诺窗口？每一行的特征/列数不同？但您应该始终将相同数量的列输入模型。

如果修改者没有清理的话，我不久前在某个地方写过上面的内容。

Aleksei Kuznetsov 2022.09.27 10:48 #27575

Maxim Dmitrievsky #:
以上内容是最近写的，如果管理员没有清理的话

搜索 "未修改的窗口"，只有这一页

СанСаныч Фоменко 2022.09.27 10:54 #27576

Maxim Dmitrievsky #:
对任何含有高斯的内容进行重采样 - 删除高斯

奇怪，但非常聪明。

[删除] 2022.09.27 10:54 #27577

elibrarius #:

搜索 "非固定窗口"，只能找到这个页面

有一种关于分形之类的想法认为，最后一个价格并不总是具有最好的预测能力。也就是说，有时有必要通过条件停止窗口，或通过另一个 ns 来固定窗口，以便让之前的条形图参与预测，而不是最后的条形图。因此，它应该在历史中来回运行。

[删除] 2022.09.27 10:55 #27578

СанСаныч Фоменко #:

很好奇，但非常复杂。

试试高斯混合物，我有一篇文章介绍过它。这是一个生成模型。在增量上比自动编码器更有效。

СанСаныч Фоменко 2022.09.27 11:00 #27579

Maxim Dmitrievsky #:
重新取样是为了去除异常值，对样本进行高斯化处理

我一般是建议通过熵或相关性进行有意义的取样。使芯片的信息量更大。另外，通过各种变换，从原始序列中提取增量并为其添加最大信息量。再加上一个非固定的滞后窗口。这是一个新手方法，没有人做过这个。但我得到了一些冠状病毒的垃圾，我正在休息 ☺️。

随意推断本来是为了帮助挑选出信息丰富的选件，但结果却与此无关。

完全不清楚。

我很清楚，我需要在时间序列的不同部分使用不同的窗口。但问题是个老问题：如果在某一段上选择了一个窗口，那么在下一段上就不一定是同一个窗口，这就是窗口宽度非稳态的变种。

[删除] 2022.09.27 11:00 #27580

СанСаныч Фоменко #:

这一点也不清楚。

我可以肯定的是，有必要在时间序列的不同部分设置不同的窗口。但问题是个老问题：如果你在某个部分选取一个窗口，那么这个窗口不一定会在下一个部分，这就是窗口宽度非稳态的变种。

我的脑袋木木的，待会再举个例子

例如，有一组筹码预测会长期下跌。那么就没有必要每隔一格就移动窗口，而是在新的一格上提交相同的特征。以此类推，直到某个点，这时再移动一次。这些点也将被填充。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2758