Discussão do artigo "Critério de homogeneidade de Smirnov como indicador de não-estacionaridade de séries temporais" - página 2

 
É interessante comparar a iSmirnovDistance com uma dimensão fractal (como esta https://www.mql5.com/en/code/20586).
Fractal dimension index (Sevcik/Matulich)
Fractal dimension index (Sevcik/Matulich)
  • www.mql5.com
Mandelbrot describes the Fractal Dimension Index (FDI) as a way to measure "how convoluted and irregular" something is. The FDI can be used as a stock market indicator. The closer prices move in a one-dimensional straight line, the closer the FDI moves to 1.0. The more closely prices resemble a two-dimensional plane, the closer the FDI moves to 2.0.
 
Stanislav Korotky #:
É interessante comparar o iSmirnovDistance com a dimensão fractal (como este https://www.mql5.com/en/code/20586).
O critério de Smirnov (e outros semelhantes) é um indicador, se assim posso dizer, do nível básico zero. Ele não diz se você deve comprar ou vender, mas sim quantos dados devem ser usados para analisar os indicadores de primeiro nível, como o FDI, que já fornecem sinais para negociação. Pelo menos é assim que eu vejo.
 
Aleksey Nikolayev econometria.

Em geral, o artigo é bom.

De fato, há muitos testes de heterogeneidade, pois o tópico é muito importante.
Sei que o teste de Pettitt é baseado em classificações, mas não encontrei muitas informações sobre ele.
 

Para mim, a janela de observações é muito pequena.

Entretanto, mesmo que tomemos essa pequena janela, talvez faça sentido compará-la não com uma janela vizinha, mas com janelas do último ano ou cinco anos? Esse será um tabuleiro de xadrez no qual poderemos ver quantas janelas eram semelhantes, agrupá-las e talvez classificá-las. E então avaliar os padrões e seus resultados probabilísticos.

Eugene Chernysh, você já fez algo parecido com isso?

 

Евгений Черныш #:

Sei que o pettit é baseado em classificações, mas não encontrei quase nenhuma informação sobre ele.

Normalmente, uso sua implementação do pacote trend no R. Há referências a fontes na descrição.

 
Aleksey Vyazmikin #:

A janela de observação é muito pequena para mim.

Entretanto, mesmo que tomemos essa pequena janela, talvez faça sentido compará-la não com uma janela vizinha, mas com janelas do último ano ou cinco anos? Esse será um tabuleiro de xadrez no qual poderemos ver quantas janelas eram semelhantes, agrupá-las e talvez classificá-las. E então avaliar os padrões e seus resultados probabilísticos.

Na minha opinião, isso seria um típico p-hacking.

 
Aleksey Vyazmikin #:

A janela de observação é muito pequena para mim.

Entretanto, mesmo que tomemos essa pequena janela, talvez faça sentido compará-la não com uma janela vizinha, mas com janelas do último ano ou cinco anos? Esse será um tabuleiro de xadrez no qual poderemos ver quantas janelas eram semelhantes, agrupá-las e talvez classificá-las. E então avaliar os padrões e seus resultados probabilísticos.

Eugene Chernysh, você já fez algo parecido com isso?

Não, eu não tentei, como você disse, mas me parece que a distribuição das distâncias de Smirnov será a mesma com essa abordagem e com o cálculo de dois dias consecutivos. Mas para coletar estatísticas sobre o número médio de dias entre duas rejeições da hipótese nula de homogeneidade, isso pode ser feito. Ter uma ideia de quanto tempo temos, em média, até que uma nova distribuição seja estabelecida no mercado.



 
Aleksey Nikolayev #:

Na minha opinião, isso se tornaria um típico p-hacking.

Como você vê isso? Estou falando de um estudo sobre a similaridade de dias e a similaridade do comportamento do preditor nesses dias.

Não conheço o resultado, portanto, não há propósito em ajustar o estudo ao resultado desejado.

Se pudermos classificar esses grupos, mesmo em um dia, poderemos usar modelos separados para eles em preditores com maior probabilidade.

 
Евгений Черныш #:
A distribuição das distâncias de Smirnov será a mesma que no cálculo de dois dias consecutivos.

Como isso é possível? Entendo corretamente que o último dia e o dia 100 dias atrás terão métricas estimadas semelhantes, como se o último dia e o penúltimo dia não fossem semelhantes? Ou seja, a diferença varia em um intervalo estreito?

Eugene Chernysh #:
Mas coletar estatísticas do número médio de dias entre duas rejeições da hipótese nula de homogeneidade é algo que pode ser feito. Ter uma ideia de quanto tempo, em média, temos até que uma nova distribuição seja estabelecida no mercado.

Bem, também é interessante observar o histograma de frequências de mudança de distribuição.

 
Aleksey Vyazmikin #:

Como você vê isso?


Como de costume, várias repetições do mesmo teste nos mesmos dados. Se houver N dias, então o número de repetições do teste é N*(N-1)/2 (o número de pares de dias). Tem que ser N/2.

Não que eu esteja tentando proibir alguém de fazer isso.