文章 "两样本Kolmogorov-Smirnov检验作为时间序列非平稳性的指标"

MetaQuotes 2024.11.11 12:39

新文章两样本Kolmogorov-Smirnov检验作为时间序列非平稳性的指标已发布：

本文探讨了最著名的非参数同质性检验之一——两样本柯尔莫哥洛夫-斯米尔诺夫（Kolmogorov-Smirnov）检验。文章对模型数据和实际价格都进行了分析。此外，本文还给出了构建非平稳性指标（iSmirnovDistance）的一个示例。

在本研究中，我将使用经验分布函数来检验金融时间序列的狭义平稳性。概率论和数理统计作为前者的一个特定部分，都是基于平稳性假设的。分析平稳过程的方法有很多，包括回归分析、自相关分析、光谱分析方法以及使用神经网络等。然而，将这些方法应用于非平稳数据可能会导致显著的预测误差。

对于交易者来说，平稳性问题与用于计算各种指标数据量的选择密切相关。在平稳过程的情况下，可用的数据越多，所有统计特性的计算就越准确。然而，在分析非平稳过程时，很难确定最佳数据量。数据量过大可能包含已过时且不再影响当前情况的信息。如果数据量太少，则由于代表性不足，我们将无法充分评估过程的统计特性。

随机过程最完整的特性是其分布律（概率函数）。因此，构建一个能够跟踪时间序列分布函数随时间变化的指标是一项重要任务。这个指标反过来将作为重新衡量用于计算标准技术指标数据量的信号。在数学统计学中，检验随机变量的分布函数是否随时间发生变化的问题被称为“检验同质性假设”。

作者：Evgeniy Chernish

fxsaber 2024.05.03 14:23 #1

Перейдем к анализу реальных данных. В качестве примера я взял минутные бары валютной пары EURUSD и золота XAUUSD.

我完全不明白所比较的是什么。显然，有必要研究一下资料来源。

ZЫ 我看了源代码。看起来它应该在 D1 上运行（我还没有试过），占用更少的条数而不是 1440（PERIOD_M5 而不是PERIOD_M1）。球" - 收盘增量

fxsaber 2024.05.03 14:46 #2

Стоит сказать, что есть разница на каком таймфрейме рассчитывается расстояние Смирнова. Для минутных данных как мы видели, наблюдается существенная нестационарность ряда, в то же время для пятиминутного таймфрейма ряд более стационарен, гипотеза однородности отвергается гораздо реже. Отчасти это связано с объемом данных, 1440 для минутного таймфрейма против 287 для пятиминутного. С постепенным увеличением данных с 287 до 1440 показатель отклонение нулевой гипотезы растет, тем не менее гипотеза однородности чаще отвергается именно для минутного графика.

我相信，如果比较的是周而不是天（1435 个 M5 增量），M5 仍然会比 M1 更 "静止"。这与数据量无关，而是与增量的构造性质有关。

你可以采用不同的增量构造规律：TF 增量、ZZ 增量等。

也就是说，静态检验的结果取决于初始数据的准备。为什么采用 TF 增量是个谜。一天中的小时间框架是苍蝇和肉片的肉酱。有翻转、低流动性和新闻。然后比较当天的碎片。例如，欧元兑美元从 02:00 到 08:00。

毕竟，没有人强迫您全天候交易或学习。

Evgeniy Chernish 2024.05.03 14:47 #3

fxsaber PERIOD_M1）。球" - 收盘增量

在日线时间框架上运行该指标，分析对数价格增量PERIOD_M5 的时间序列。也可以使用分钟，但这种数据太不稳定。

我们每天都会分析时间序列收益分布规律的变化程度，为此我们使用斯米尔诺夫同质性标准。该统计本身基于两个样本分布函数的比较。差值的最大模数就是这两个函数的差值。

fxsaber 2024.05.03 14:49 #4

Евгений Черныш #:

在日线时间框架上运行该指标，分析对数价格增量PERIOD_M5 的时间序列。也可以使用分钟，但这种数据太不稳定。

我从上到下读了这篇文章。我读到了这句话。

让我们继续分析真实数据。我以欧元兑美元货币对和黄金 XAUUSD 的分钟条形图为例。

更多的图表没有解释。好像他们忘了写一个小段落。

Evgeniy Chernish 2024.05.03 15:07 #5

fxsaber #:

我相信，如果比较的是周而不是天（1435 个 M5 增量），M5 仍然会比 M1 更 "静止"。这与数据量无关，而是与增量结构的性质有关。

你可以采用不同的增量构造法则：TF 增量、ZZ 增量等。

是这样的，M5 比 M1 更固定，至少斯米尔诺夫标准表明了这一点。

分钟或极端情况下 5 分钟的时间框架是为了获得足够的滞后性。例如，如果我们对 1440 进行 5 分钟的分析，那么根据斯米尔诺夫标准，我们每两周就能得到一次结果。这就不需要增加时间框架，相反，可能需要降低到最小刻度线以下，这样可以更快地对不断变化的情况做出反应。不幸的是，我没有刻度线作为分析基础，所以我分析的是分钟。

但比较不同的盘中时段是个好主意。例如，把亚洲时段排除在外，因为那里有很多零增量，波动性也大不相同，等等。

另外，什么是 ZZ 增量？

Evgeniy Chernish 2024.05.03 15:29 #6

fxsaber #:

我从上到下读了这篇文章。我读到了这样一句话

然后是没有解释的图表。好像他们忘了写一个小段落。

图表下面有简要说明。如果有不太清楚的地方，请给我写信，我会尽量解释清楚。

[删除] 2024.05.03 15:44 #7

好文章，谢谢。关于窗口大小应可变的结论很有意思。

Evgeniy Chernish 2024.05.03 16:09 #8

Maxim Dmitrievsky #:
好文章，谢谢。关于窗口大小应可变的结论很有意思。

谢谢。当然，我在这里还没有发现美国=)

Aleksey Nikolayev 2024.05.03 19:15 #9

我认为，值得考虑的是每日的波动。例如，可以用当时的平均波动率对增量进行归一化处理。根据我的估计，以这种方式归一化的增量与噪声的差异会小很多。

对于行，更多的是说分解测试。这种检验通常是基于同质性检验，但原则上这是 matstat 的一个独立领域。例如，计量经济学中经常使用 Pettitt 检验。

总的来说，这篇文章不错。

fxsaber 2024.05.03 19:19 #10

Евгений Черныш #:

附：什么是 ZZ 增量？

通过 HighBid/LowAsk 建立 ZigZag，并在顶点之间取增量。

1 2 3 4 5 6

新评论