Discussão do artigo "Critério de homogeneidade de Smirnov como indicador de não-estacionaridade de séries temporais"

 

Novo artigo Critério de homogeneidade de Smirnov como indicador de não-estacionaridade de séries temporais foi publicado:

Este artigo analisa um dos mais conhecidos critérios de homogeneidade não-paramétricos, o critério de Smirnov. São analisados tanto dados modelados quanto cotações reais. É apresentado um exemplo de construção do indicador de não-estacionaridade (iSmirnovDistance).

Neste estudo, verificarei a estacionaridade de séries temporais financeiras justamente no sentido restrito, utilizando funções empíricas de distribuição. A teoria da probabilidade e a estatística matemática, como um ramo específico desta, baseiam-se em pressupostos de estacionaridade. Existem muitos métodos para a análise de processos estacionários, incluindo análise de regressão, análise de autocorrelação, métodos de análise espectral e o uso de redes neurais. No entanto, a aplicação desses métodos a dados não-estacionários pode levar a erros significativos nas previsões. 

Para os traders, a questão da estacionaridade está intimamente relacionada à escolha do volume de dados para o cálculo de diferentes indicadores. No caso de processos estacionários, quanto mais dados estiverem disponíveis, mais precisamente podemos calcular todas as características estatísticas. Entretanto, ao analisar processos não-estacionários, é difícil determinar o volume ideal de dados. Um volume muito grande pode conter informações obsoletas, que já não influenciam a situação atual; se os dados forem muito poucos, devido à insuficiente representatividade, não seremos capazes de avaliar adequadamente as propriedades estatísticas do processo.

A característica mais completa de um processo aleatório é a sua lei de distribuição (função de probabilidade). Portanto, a construção de um indicador que permita acompanhar a mudança da função de distribuição da série temporal ao longo do tempo é uma tarefa importante. Esse indicador, por sua vez, servirá como um sinal da necessidade de revisar o volume de dados para o cálculo de indicadores padrão de análise técnica. Na estatística matemática, a tarefa de verificar "se a função de distribuição de uma determinada variável aleatória mudou ao longo do tempo" é chamada de "teste de hipótese de homogeneidade".

Autor: Evgeniy Chernish

 
Перейдем к анализу реальных данных. В качестве примера я взял минутные бары валютной пары EURUSD и золота XAUUSD.

Eu não entendi o que estava sendo comparado. Aparentemente, é necessário estudar a fonte.

ZЫ Eu dei uma olhada na fonte. Parece que deve ser executado (não tentei) em D1, com menos barras tomadas em vez de 1440 (PERIOD_M5 em vez de PERIOD_M1). E "bolas" - Incrementos de fechamento

 
Стоит сказать, что есть разница на каком таймфрейме рассчитывается расстояние Смирнова. Для минутных данных как мы видели, наблюдается существенная нестационарность ряда, в то же время для пятиминутного таймфрейма ряд более стационарен, гипотеза однородности отвергается гораздо реже. Отчасти это связано с объемом данных, 1440 для минутного таймфрейма против 287 для пятиминутного. С постепенным увеличением данных с 287 до 1440 показатель отклонение нулевой гипотезы растет, тем не менее гипотеза однородности чаще отвергается именно для минутного графика. 

Tenho certeza de que se você comparar semanas em vez de dias (1435 incrementos de M5), M5 ainda será "estacionário" em relação a M1. Não se trata da quantidade de dados, mas da natureza da construção dos incrementos.

Você pode adotar diferentes leis de construção de incrementos: incrementos TF, incrementos ZZ, etc.

Ou seja, o resultado dos testes de estacionariedade depende da preparação dos dados iniciais. Por que usar os incrementos TF é um mistério. Os períodos de tempo pequenos em um dia são uma carne moída de moscas e costeletas. Há rollovers, baixa liquidez e notícias. Então, compare as partes do dia. Por exemplo, EURUSD das 02:00 às 08:00.


Afinal de contas, ninguém o está forçando a negociar ou aprender 24 horas por dia, 7 dias por semana.

 
fxsaber PERIOD_M1). E "bolas" - Incrementos de fechamento

Execute o indicador no período diário, a série temporal de incrementos de preço logarítmicos PERIOD_M5 é analisada. Os minutos também podem ser usados, mas esses dados são muito não-estacionários.

Todos os dias, analisamos o quanto a lei de distribuição dos retornos da série temporal muda e, para isso, usamos o critério de homogeneidade de Smirnov. Essa estatística em si se baseia na comparação de duas funções de distribuição de amostra. O módulo máximo da diferença é considerado como a diferença entre essas duas funções.

 
Евгений Черныш #:

Execute o indicador no período diário, a série temporal de incrementos de preço logarítmicos PERIOD_M5 é analisada. Minutos também podem ser usados, mas esses dados são muito não-estacionários.

Todos os dias, analisamos o quanto a lei de distribuição dos retornos da série temporal muda e, para isso, usamos o critério de homogeneidade de Smirnov. Essa estatística em si se baseia na comparação de duas funções de distribuição de amostra. O módulo máximo da diferença é considerado como a diferença entre essas duas funções.

Li o artigo de cima para baixo. Cheguei a esta frase.

Vamos passar para a análise de dados reais. Como exemplo, peguei barras de minutos do par de moedas EURUSD e do ouro XAUUSD.

Outros gráficos sem explicações. Como se tivessem se esquecido de escrever um pequeno parágrafo.

 
fxsaber #:

Tenho certeza de que se você comparar semanas em vez de dias (1435 incrementos de M5), M5 ainda será "estacionário" em relação a M1. Não se trata da quantidade de dados, mas da natureza da construção dos incrementos.

Você pode adotar diferentes leis de construção de incrementos: incrementos TF, incrementos ZZ, etc.

Ou seja, o resultado dos testes de estacionariedade depende da preparação dos dados iniciais. Por que usar os incrementos TF é um mistério. Os períodos de tempo pequenos em um dia são uma carne moída de moscas e costeletas. Há rollovers, baixa liquidez e notícias. Então, compare as partes do dia. Por exemplo, EURUSD das 02:00 às 08:00.

É assim, M5 é mais estacionário do que M1, pelo menos o critério de Smirnov indica isso.

O período de tempo de um minuto ou, no caso extremo, de 5 minutos, é usado para obter uma defasagem adequada. Se analisarmos, por exemplo, 1440 por 5 minutos, obteremos o resultado de acordo com o critério de Smirnov uma vez a cada quinze dias. É necessário não aumentar o período de tempo, mas, ao contrário, provavelmente descer até o piso abaixo dos ticks, o que seria mais rápido para reagir às mudanças nas condições. Infelizmente, eu não tinha uma base de ticks para análise, então analisei os minutos.

Mas comparar sessões intraday separadas é uma boa ideia. Retire a sessão asiática, por exemplo, pois há muitos incrementos zero lá, volatilidade bastante diferente etc.

P.S.: o que são incrementos ZZ?

 
fxsaber #:

Eu estava lendo o artigo de cima para baixo. Cheguei a esta frase.

Depois, há gráficos sem explicações. Era como se tivessem se esquecido de escrever um pequeno parágrafo.

Há breves explicações abaixo dos gráficos. Se algo específico não estiver muito claro, escreva para mim e tentarei explicar tudo.

[Excluído]  
Bom artigo, obrigado. A conclusão de que o tamanho da janela deve ser variável foi interessante.
 
Maxim Dmitrievsky #:
Bom artigo, obrigado. A conclusão de que o tamanho da janela deve ser variável foi interessante.
Obrigado. Bem, eu não descobri a América aqui, é claro =)
 

Na minha opinião, valeria a pena levar em conta as flutuações diárias da volatilidade. Por exemplo, você poderia normalizar os incrementos pela volatilidade média naquele momento do dia. De acordo com minhas estimativas, os incrementos normalizados dessa forma diferem significativamente menos do ruído.

Em relação às linhas, é mais frequente falar sobre testes de decomposição. Esses testes geralmente se baseiam em testes de homogeneidade, mas, em princípio, trata-se de uma área independente do matstat. Por exemplo, o teste de Pettitt é usado com frequência em econometria.

Em geral, o artigo é bom.

 
Евгений Черныш #:

P.S. O que são incrementos ZZ?

Crie o ZigZag por HighBid/LowAsk e faça incrementos entre os vértices.