Discussão do artigo "Critério de homogeneidade de Smirnov como indicador de não-estacionaridade de séries temporais" - página 4

 
O teste de Smirnov, por definição, aplica-se a amostras (a) independentes, (b) identicamente distribuídas que são definidas exclusivamente por suas distribuições univariadas.

Tentar usar esse teste para determinar violações de (a) e (b) em amostras não é uma boa ideia. Obviamente, cada amostra pode ter uma violação diferente e a soma das possíveis violações é um grande número de violações possíveis.
 
Aleksey Nikolayev #:

Nós nos referimos à fractalidade como tal, não a seu indicador específico. Geralmente, ela está associada à persistência/antipersistência de uma série, que está relacionada à dependência de incrementos vizinhos, que, por sua vez, é determinada por sua distribuição conjunta.

Se falarmos de indicadores específicos de fractalidade, o FDI não é muito bom porque requer muitos dados para o cálculo e não fornece valores para o intervalo de confiança da dimensionalidade.

Acho que você está misturando duas coisas. O algoritmo para calcular uma estatística específica e a consequência que podemos ter se ela assumir determinados valores.
Você deve ter querido dizer que, se o índice de fractalidade rejeitar a hipótese de SB, então a função de probabilidade de um vetor bidimensional (Xn,Xn-1) não é igual ao produto de vetores unidimensionais, entendi corretamente?

F(Xn,Xn-1) != F(Xn)*F(Xn-1)



 
Aleksey Nikolayev #:
Por definição, o teste de Smirnov se aplica a amostras (a) independentes e (b) identicamente distribuídas que são definidas exclusivamente por suas distribuições univariadas.

Tentar usar esse teste para determinar violações de (a) e (b) em amostras não é uma boa ideia. Obviamente, a violação de cada amostra pode ser diferente e a soma totaliza um grande número de possíveis violações.
Independência, sim. Mas isso não é motivo para abandonar o critério de Smirnov. Veja como ele pode funcionar. Você compara duas amostras homogêneas e independentes e observa a hipótese nula o tempo todo; então, em algum momento, digamos, aparecem dependências na série, o critério de Smirnov reagirá a isso rejeitando a hipótese nula, porque ele "não gosta" de dependências. Portanto, para um trader, esse efeito colateral indesejável é apenas uma vantagem.

E o que significa exigir a mesma distribuição de amostras ????

Infelizmente, as séries temporais econômicas não podem se dar a esse luxo. Essa exigência é impossível a priori e nunca será cumprida. Não controlamos o experimento ou a experiência como os físicos podem fazer e obter condições ideais para obter dados igualmente distribuídos.





 
Евгений Черныш #:
Acho que você está confundindo duas coisas. O algoritmo de cálculo de uma estatística específica e a consequência que podemos ter se ela assumir determinados valores.
Você provavelmente quer dizer que, se o índice de fractalidade rejeitar a hipótese de SB, então a função de probabilidade de um vetor bidimensional (Xn, Xn-1) não é igual ao produto de vetores unidimensionais, entendi corretamente?

F(Xn,Xn-1) != F(Xn)*F(Xn-1)



Raciocinar sobre fractalidade, FDI e outras coisas do gênero nos leva para fora do domínio do matstat. Que distribuição tem o FDI no caso do SB? Eu não sei (e ninguém sabe, exceto que provavelmente é possível calcular a distribuição assintótica). Portanto, o termo "estatística" tem pouca aplicação ao IDE. Nos poucos estudos normais (quando o método Monte Carlo foi usado para calcular o valor de p para Hurst em SB) sobre preços reais, a hipótese nula de SB não pôde ser rejeitada.

Temos apenas suposições empíricas sobre a relação entre a dimensionalidade fractal e as correlações incrementais. Nesse nível, sim, você me entendeu corretamente - se for dito sobre fractalidade, então a dependência {F(Xn,Xn-1) != F(Xn)*F(Xn-1)} aparece e não podemos mais falar sobre a aplicabilidade do teste de Smirnov. É por isso que acho que Smirnov e IDE não são semelhantes. No máximo, em nível empírico, pode-se considerar que Smirnov é mais aplicável quando o IDE está próximo de seu valor teórico no SB (embora haja um pouco de dúvida sobre isso para ativos com tendência).

 

Евгений Черныш #:

O que significa exigir que as amostras sejam igualmente distribuídas?

Cada uma das duas amostras deve ser obtida de um conjunto i.i.d. de variáveis aleatórias. Já escrevi que, devido às flutuações diárias na volatilidade (devido à sessão de mercado, por exemplo), a condição i.i.d. é violada.

 
Евгений Черныш #:
Independência, sim. Mas isso não é motivo para abandonar o critério de Smirnov. Veja como ele pode funcionar. Você compara duas amostras homogêneas e independentes e observa a hipótese nula o tempo todo; então, em algum momento, digamos, aparecem dependências na série, o critério de Smirnov reagirá a isso rejeitando a hipótese nula, porque ele "não gosta" de dependências. Portanto, para um trader, esse efeito colateral indesejável é apenas uma vantagem.

Você não conseguirá distinguir entre a violação de i. e a violação de i.d. da condição i.i.d.) Você não conseguirá determinar para qual das amostras elas são violadas. Faça as contas você mesmo - há 16=4*4 variantes no total, das quais apenas uma não viola as condições.

Portanto, Smirnov foi criado justamente para "não gostar" de desvios no i.d.) E você quer confundi-lo).

 
Aleksey Nikolayev #:

As discussões sobre fractalidade, FDI e outras coisas do gênero nos levam para fora da área de matstat. Que distribuição tem o FDI no caso do SB? Eu não sei (e ninguém sabe, exceto que provavelmente é possível calcular a distribuição assintótica). Portanto, o termo "estatística" tem pouca aplicação ao IDE. Nos poucos estudos normais (quando o método Monte Carlo foi usado para calcular o valor de p para Hurst em SB) sobre preços reais, a hipótese nula de SB não pôde ser rejeitada.

Temos apenas suposições empíricas sobre a relação entre a dimensionalidade fractal e as correlações incrementais. Nesse nível, sim, você me entendeu corretamente - se for dito sobre fractalidade, então a dependência {F(Xn,Xn-1) != F(Xn)*F(Xn-1)} aparece e não podemos mais falar sobre a aplicabilidade do teste de Smirnov. É por isso que acho que Smirnov e IDE não são semelhantes. No máximo, em nível empírico, pode-se considerar que Smirnov é mais aplicável quando o IDE está próximo de seu valor teórico no SB (embora haja um pouco de dúvida sobre isso para ativos com tendência).

Você está levando muito ao pé da letra o requisito de independência do critério de Smirnov. Esse requisito é necessário para que a distribuição de uma determinada estatística convirja para a distribuição de Kolmogorov a fim de testar a hipótese nula. Portanto, se o requisito de independência for violado, o critério de Smirnov poderá ser um indicador para detectar relações estatísticas nos dados. Ou seja, o requisito de independência em nenhum caso proíbe a aplicação do critério de Smirnov aos dados nos quais pode haver algumas relações estatísticas. Além disso, ninguém proíbe o cálculo da correlação dos dados estudados. Se não for encontrada nenhuma dependência linear, considere que o requisito de independência foi praticamente atendido e que a diferença na distribuição das distâncias de Smirnov é causada apenas pela heterogeneidade dos dados. Para dependências não lineares, a distribuição das distâncias de Smirnov difere de forma insignificante da distribuição de Kolmogorov (pelo menos para o mapeamento logístico é assim). Ou seja, está claro que um critério de Smirnov não pode ser usado sozinho, precisamos usar métodos adicionais de análise.

Quanto ao FDI, é muito provável que ele tenha exatamente a mesma distribuição para o SB que o índice de Hurst, ou seja, normal. Com a ajuda do método de Monte Carlo, tudo pode ser calculado, e Peters fez isso em seu trabalho "Fractal analysis of financial markets" (Análise fractal dos mercados financeiros). O IDE não é diferente de qualquer outra estatística no sentido de que ele próprio é uma variável aleatória, como a média da amostra ou a variância da amostra, portanto, é possível descobrir facilmente como essa estatística se comporta no SB, em amostras pequenas, em amostras grandes etc.

 
Aleksey Nikolayev #:

Cada uma das duas amostras deve ser obtida de um conjunto i.i.d. de variáveis aleatórias. Já escrevi que, devido às flutuações diárias na volatilidade (devido à sessão de mercado, por exemplo), a condição i.i.d. é violada.

As exigências de distribuição igual são boas para a comprovação de teoremas, provas rigorosas e dentro do departamento de Estatística Matemática, mas para dados reais essa exigência é muito rigorosa. É preciso controlar o curso do experimento, certificar-se de que as condições sob as quais a observação de uma variável aleatória não mudam com o tempo. É claro que, no caso das cotações de ações, não controlamos nada. Simplesmente observamos como a mão invisível do mercado tira um determinado número (incremento de preço) da caixa, mas não sabemos se, a cada momento, o conteúdo dessa caixa é alterado ou não (e ninguém jamais saberá). Essa é a realidade e temos que trabalhar com o que temos.

Em minha opinião, a comparação dia a dia está correta, pois temos sessões asiáticas, europeias e americanas em cada amostra. Se eu fosse comparar a sessão asiática com a americana, estaria errado. Bem, é claro, cada um decide por si mesmo.

 
Aleksey Nikolayev #:

Você não será capaz de distinguir entre a violação i. e a violação i.d. da condição i.i.d.)

Eu posso e você pode, pelo menos para dados de modelo.

O processo autorregressivo é igualmente distribuído? Ele é distribuído de forma idêntica.

Ele é independente? Não.

O critério de Smirnov "vê" isso? Sim.

 
Евгений Черныш #:

Você leva muito ao pé da letra o requisito de independência do critério de Smirnov. Esse requisito é necessário para que a distribuição de uma determinada estatística converja para a distribuição de Kolmogorov para testar a hipótese nula. Portanto, se o requisito de independência for violado, o critério de Smirnov poderá ser um indicador para detectar relações estatísticas nos dados. Ou seja, o requisito de independência não proíbe, em hipótese alguma, a aplicação do critério de Smirnov a dados em que possa haver alguma relação estatística.

Na minha opinião, há um problema claro com a lógica. Tautologia, da qual algo mais pode ser deduzido.