文章 "希尔伯特-施密特独立性判据(HSIC)" - 页 2

 
Maxim Dmitrievsky #:


我还注意到,使用快速MO模型来确定相关性,通常比使用那些通常速度较慢的各种标准更快。虽然按理说应该是相反的 :)
我们花在计算显著性上的时间很多,其实它本身计算统计量很快
[删除]  
Evgeniy Chernish #:
我们花时间在计算显著性上,其实它本身计算统计数据很快
没错,我差点忘了这一点。
 
Maxim Dmitrievsky #:
将时间延迟设得大一些

那里的区间(X1、X2、Y)没有重叠。

 
Evgeniy Chernish #:
HSIC 不能用于非平稳时间序列。应采用价格增量而非价格本身。皮尔逊相关系数同样因这一原因显示出“相关性”。

HSIC 的计算复杂度(包括显著性检验)比皮尔逊相关系数高出许多数量级,因此原本预期结果会有所不同。

如果增量是独立的,而它们的和却“相关”,那么对于如此耗费资源的检验标准而言,即使在理论上,这也是一个奇怪的结果。

[删除]  
fxsaber #:

那里,区间 (X1, X2, Y) 互不重叠。

选择性SBB滤波器的衰减速度更慢,甚至根本不会衰减。粗略地说,这些计算毫无意义 :)

 
Maxim Dmitrievsky #:

选择性AKF SB的衰减速度更慢,甚至根本不会衰减

我不明白这个论点与讨论背景有何关联。

 

命题。

如果对序列进行变换后(不丢失信息——可以恢复到初始状态)得到独立性,则原始序列是相互独立的。

[删除]  
fxsaber #:

我不明白这个论点与讨论背景有何关联。

这些方法在非平稳序列上得出的结果与预期不符。因此,我们可以以自相关函数(ACF)为基础,并以此为例进行说明。 相关系数会随着时间步长 t 的变化而变化。在时间序列中,自相关性取决于时间。这些内容都有记载,可以在网上查阅。
自相关是指时间序列与其自身(带滞后)之间的相关性。它取决于时间滞后。
这是时间序列分析的基础。
建议查阅相关资料,了解简单自相关函数和选择性自相关函数在时间序列中随滞后如何变化。

本文提出的方法的唯一区别在于,它处理的是非线性相关性。
 
fxsaber #:

命题。

如果对序列进行变换后(不丢失信息——可以恢复到初始状态)得到独立性,则原始序列是相互独立的。

三个独立序列。

if (SData == Nonlinear_dependence){
double x1 [];
MathRandomUniform(-5,5,data_,x1);
double x2 [];
MathRandomUniform(-5,5,data_,x2);
double y[];
MathRandomUniform(-5,5,data_,y);


得到如下结果。

Коэффициент корреляции (X1, Y) = 0.0283
Коэффициент корреляции (X2, Y) = -0.0097
----------------Nonlinear_dependence-------------
Время выполнения: 13.469 seconds
-----------------------------------
Number observations 1000
HSIC: 0.00028932
p-value: 0.5100
Critical value: 0.0005
Не отвергаем H0: Наблюдения независимы


现在将它们转换为和(不会丢失信息)。

double sum1 = 0, sum2 = 0, sum = 0;

for (int i=0;i<data_;i++){
x1[i] = (sum1 += x1[i]);
x2[i] = (sum2 += x2[i]);
y[i] = (sum += y[i]);
}


结果为“相关”。

Коэффициент корреляции (X1, Y) = 0.3930
Коэффициент корреляции (X2, Y) = 0.1924
----------------Nonlinear_dependence-------------
Время выполнения: 12.890 seconds
-----------------------------------
Number observations 1000
HSIC: 0.01020060
p-value: 0.0000
Critical value: 0.0009
Отвергаем H0: Наблюдения зависимы
[删除]  
fxsaber #:

三个独立的系列。


得到如下结果。


现在将它们转换为和(不会造成信息丢失)。


结果是“有条件的”。

信息损失巨大。趋势、季节性及周期性因素均被剔除。这是两组不同的时间序列。