Discusión sobre el artículo "El criterio de homogeneidad de Smirnov como indicador de la no estacionariedad de las series temporales" - página 2

 
Es interesante comparar iSmirnovDistance con una dimensión fractal (como esta https://www.mql5.com/en/code/20586).
Fractal dimension index (Sevcik/Matulich)
Fractal dimension index (Sevcik/Matulich)
  • www.mql5.com
Mandelbrot describes the Fractal Dimension Index (FDI) as a way to measure "how convoluted and irregular" something is. The FDI can be used as a stock market indicator. The closer prices move in a one-dimensional straight line, the closer the FDI moves to 1.0. The more closely prices resemble a two-dimensional plane, the closer the FDI moves to 2.0.
 
Stanislav Korotky #:
Es interesante comparar iSmirnovDistance con la dimensión fractal (como este https://www.mql5.com/en/code/20586).
El criterio de Smirnov (y similares) es un indicador, si se me permite la expresión, del nivel cero, básico. No te dice si debes comprar o vender, te dice cuántos datos debes tomar para analizar los indicadores de primer nivel como el IED, que ya dan señales para operar. Al menos así lo veo yo.
 
Aleksey Nikolayev econometría.

En general, el artículo es bueno.

Efectivamente, hay muchas pruebas de heterogeneidad, ya que el tema es muy importante.
Tengo entendido que la prueba de Pettit se basa en rangos, pero no he encontrado mucha información al respecto.
 

Para mí, la ventana de observaciones es demasiado pequeña.

Sin embargo, aunque tomemos esta pequeña ventana, ¿quizá tenga sentido compararla no con una ventana vecina, sino con las ventanas del último año o de los últimos cinco años? Será como un tablero de ajedrez a partir del cual podremos ver cuántas ventanas eran similares, agruparlas y quizá clasificarlas. Y luego evaluar en busca de patrones y sus resultados probabilísticos.

Eugene Chernysh, ¿has hecho algo así?

 

Евгений Черныш #:

Tengo entendido que pettit se basa en rangos, no he encontrado casi información al respecto.

Suelo utilizar su implementación del paquete trend en R. Hay referencias a fuentes en la descripción.

 
Aleksey Vyazmikin #:

La ventana de observación es demasiado pequeña para mí.

Sin embargo, aunque tomemos esta pequeña ventana, ¿quizá tenga sentido compararla no con una ventana vecina, sino con las ventanas del último año o de los últimos cinco años? Será como un tablero de ajedrez a partir del cual podremos ver cuántas ventanas eran similares, agruparlas y quizá clasificarlas. Y luego evaluar en busca de patrones y sus resultados probabilísticos.

En mi opinión, esto sería el típico p-hacking.

 
Aleksey Vyazmikin #:

La ventana de observación es demasiado pequeña para mí.

Sin embargo, aunque tomemos esta pequeña ventana, ¿quizá tenga sentido compararla no con una ventana vecina, sino con las ventanas del último año o de los últimos cinco años? Será como un tablero de ajedrez a partir del cual podremos ver cuántas ventanas eran similares, agruparlas y quizá clasificarlas. Y luego evaluar en busca de patrones y sus resultados probabilísticos.

Eugene Chernysh, ¿has hecho algo así?

No, no lo he probado como dices, pero me parece que la distribución de las distancias de Smirnov será la misma con este enfoque que con el cálculo de dos días consecutivos. Pero para recoger estadísticas sobre el número medio de días entre dos rechazos de la hipótesis nula de homogeneidad, que se puede hacer. Tener una idea de cuánto tiempo tenemos por término medio hasta que se establezca una nueva distribución en el mercado.



 
Aleksey Nikolayev #:

En mi opinión, resultaría ser el típico p-hacking.

¿Cómo lo ve? Estoy hablando de un estudio sobre la similitud de los días, y la similitud del comportamiento de los predictores en esos días.

No conozco el resultado, así que no tiene sentido ajustar el estudio al resultado deseado.

Si podemos clasificar esos grupos, incluso dentro de un mismo día, podemos utilizar modelos separados para ellos en los predictores con mayor probabilidad.

 
Евгений Черныш #:
distribución de las distancias de Smirnov será la misma que en el cálculo de dos días consecutivos.

¿Cómo es esto posible? ¿Entiendo correctamente que el último día y el de hace 100 días tendrán métricas estimadas similares, como si el último día y el anteúltimo no fueran similares? Es decir, ¿la diferencia varía dentro de un estrecho margen?

Eugene Chernysh #:
Pero recopilar estadísticas del número medio de días entre dos rechazos de la hipótesis nula de homogeneidad es algo que se puede hacer. Hacerse una idea de cuánto tiempo de media tenemos hasta que se establece una nueva distribución en el mercado.

También es interesante observar el histograma de frecuencias de cambio de distribución.

 
Aleksey Vyazmikin #:

¿Cómo lo ve?


Como siempre, múltiples repeticiones de la misma prueba con los mismos datos. Si hay N días, el número de repeticiones de la prueba es N*(N-1)/2 (el número de pares de días). Tiene que ser N/2.

No es que intente prohibir a nadie que haga esto) Sólo que, en mi opinión, éste es el primer paso hacia el autoengaño.