Discusión sobre el artículo "El criterio de homogeneidad de Smirnov como indicador de la no estacionariedad de las series temporales"

 

Artículo publicado El criterio de homogeneidad de Smirnov como indicador de la no estacionariedad de las series temporales:

El artículo analiza uno de los criterios de homogeneidad no paramétricos más famosos: el criterio de Smirnov. Asimismo, se consideran tanto datos modelo como cotizaciones reales, y se ofrece un ejemplo de construcción de un indicador de no estacionariedad (iSmirnovDistance).

En este artículo, comprobaremos la estacionariedad de las series temporales financieras precisamente en sentido estricto, utilizando funciones de distribución empíricas. La teoría de la probabilidad y la estadística matemática, como sección específica de la misma, se basan en supuestos de estacionariedad. Existen diversos métodos para analizar los procesos estacionarios, como el análisis de regresión, el análisis de autocorrelación, las técnicas de análisis espectral y el uso de redes neuronales. No obstante, la aplicación de estos métodos a datos no estacionarios puede dar lugar a errores significativos en las predicciones. 

Para los tráders, la cuestión de la estacionariedad está estrechamente relacionada con la elección de la cantidad de datos para calcular diversos indicadores. En el caso de los procesos estacionarios, cuantos más datos estén disponibles, con mayor precisión podrán calcularse todas las características estadísticas. Sin embargo, resulta difícil determinar la cantidad óptima de datos cuando se analizan procesos no estacionarios. Un volumen demasiado grande puede contener información obsoleta que ya no influya en la situación actual; si se toman pocos datos, no podremos evaluar adecuadamente las propiedades estadísticas del proceso debido a que la representatividad será insuficiente.

La caracterización más completa de un proceso aleatorio será su ley de distribución (función de probabilidad). Por consiguiente, la construcción de un indicador que permita monitorear el cambio de la función de distribución de una serie temporal a lo largo del tiempo será una tarea importante. Este indicador, a su vez, servirá de señal que indicará la necesidad de revisar el volumen de datos para calcular los indicadores estándar del análisis técnico. En estadística matemática, la tarea de comprobar "si la función de distribución de alguna variable aleatoria ha cambiado con el tiempo" se denomina "prueba de la hipótesis de homogeneidad".

Autor: Evgeniy Chernish

 
Перейдем к анализу реальных данных. В качестве примера я взял минутные бары валютной пары EURUSD и золота XAUUSD.

No entendí en absoluto lo que se comparaba. Al parecer, es necesario estudiar la fuente.

ZЫ He mirado la fuente. Parece que debería ejecutarse (no lo he probado) en D1, con menos barras tomadas en lugar de 1440 (PERIOD_M5 en lugar de PERIOD_M1). Y "bolas" - Cerrar incrementos

 
Стоит сказать, что есть разница на каком таймфрейме рассчитывается расстояние Смирнова. Для минутных данных как мы видели, наблюдается существенная нестационарность ряда, в то же время для пятиминутного таймфрейма ряд более стационарен, гипотеза однородности отвергается гораздо реже. Отчасти это связано с объемом данных, 1440 для минутного таймфрейма против 287 для пятиминутного. С постепенным увеличением данных с 287 до 1440 показатель отклонение нулевой гипотезы растет, тем не менее гипотеза однородности чаще отвергается именно для минутного графика. 

Estoy seguro de que si se comparan semanas en lugar de días (1435 incrementos de M5), M5 seguirá siendo "estacionario" que M1. No se trata de la cantidad de datos, sino de la naturaleza de la construcción de los incrementos.

Se pueden tomar diferentes leyes de construcción de incrementos: incrementos TF, incrementos ZZ, etc.

Es decir, el resultado de las pruebas de estacionariedad depende de la preparación de los datos iniciales. Por qué tomar incrementos TF es un misterio. Los plazos pequeños de un día son un picadero de moscas y chuletas. Hay rollovers y poca liquidez y noticias. Entonces compara los trozos del día. Por ejemplo, EURUSD de 02:00 a 08:00.


Al fin y al cabo, nadie le obliga a operar o a aprender las 24 horas del día.

 
fxsaber PERIOD_M1). Y "bolas" - Cerrar incrementos

Ejecutar el indicador en el marco de tiempo diario, se analiza la serie de tiempo de los incrementos logarítmicos de precios PERIOD_M5. También se pueden utilizar minutos, pero estos datos son demasiado no estacionarios.

Cada día se analiza cuánto cambia la ley de distribución de los rendimientos de la serie temporal, para ello se utiliza el criterio de homogeneidad de Smirnov. Este estadístico se basa en la comparación de dos funciones de distribución muestral. El módulo máximo de la diferencia se toma como la diferencia entre estas dos funciones.

 
Евгений Черныш #:

Ejecute el indicador en el marco temporal diario, se analiza la serie temporal de incrementos logarítmicos de precios PERIOD_M5. También se pueden utilizar minutos, pero estos datos son demasiado no estacionarios.

Cada día se analiza cuánto cambia la ley de distribución de los rendimientos de la serie temporal, para ello se utiliza el criterio de homogeneidad de Smirnov. Este estadístico se basa en la comparación de dos funciones de distribución muestral. El módulo máximo de la diferencia se toma como la diferencia entre estas dos funciones.

He leído el artículo de arriba abajo. Llegué a esta frase.

Pasemos al análisis de datos reales. Como ejemplo, tomé barras de minutos del par de divisas EURUSD y del oro XAUUSD.

Más gráficos sin explicaciones. Como si se hubieran olvidado de escribir un pequeño párrafo.

 
fxsaber #:

Estoy seguro de que si se comparan semanas en lugar de días (1435 incrementos de M5), M5 seguirá siendo "estacionario" que M1. No se trata de la cantidad de datos, sino de la naturaleza de la construcción de los incrementos.

Se pueden tomar diferentes leyes de construcción de incrementos: incrementos TF, incrementos ZZ, etc.

Es decir, el resultado de las pruebas de estacionariedad depende de la preparación de los datos iniciales. Por qué tomar incrementos TF es un misterio. Los plazos pequeños de un día son un picadero de moscas y chuletas. Hay rollovers y poca liquidez y noticias. Entonces compara los trozos del día. Por ejemplo, EURUSD de 02:00 a 08:00.

Es así, M5 es más estacionario que M1, al menos el criterio de Smirnov así lo indica.

Se toma el timeframe de un minuto o en caso extremo de 5 minutos para obtener un desfase adecuado. Si analizamos por ejemplo 1440 durante 5 minutos, obtendremos el resultado según el criterio de Smirnov una vez cada quince días. Es necesario no aumentar el marco temporal, sino al contrario, probablemente bajar al piso por debajo de los ticks, lo que sería más rápido para reaccionar a las condiciones cambiantes. Desafortunadamente, no tenía una base de ticks para el análisis, así que analicé minutos.

Pero comparar sesiones intradía por separado es una buena idea. Quitar la sesión asiática, por ejemplo, ya que allí hay muchos incrementos de cero, una volatilidad bastante diferente, etc.

P.D. ¿Qué son los incrementos ZZ?

 
fxsaber #:

Estaba leyendo el artículo de arriba abajo. Llegué a esta frase.

Luego hay gráficos sin explicaciones. Era como si se hubieran olvidado de escribir un pequeño párrafo.

Hay breves explicaciones debajo de los gráficos. Si algo concreto no está del todo claro, escríbeme e intentaré explicarlo todo.

 
Buen artículo, gracias. Interesante la conclusión de que el tamaño de la ventana debe ser variable.
 
Maxim Dmitrievsky #:
Buen artículo, gracias. Interesante la conclusión de que el tamaño de la ventana debe ser variable.
Gracias. Bueno, yo no he descubierto América aquí, por supuesto =)
 

En mi opinión, convendría tener en cuenta las fluctuaciones diarias de la volatilidad. Por ejemplo, se podrían normalizar los incrementos por la volatilidad media en ese momento del día. Según mis estimaciones, los incrementos normalizados de este modo difieren bastante menos del ruido.

Para las filas se suele hablar más de pruebas de descomposición. Tales pruebas se basan a menudo en pruebas de homogeneidad, pero en principio es un área independiente de matstat. Por ejemplo, la prueba de Pettitt se utiliza a menudo en econometría.

En general, el artículo es bueno.

 
Евгений Черныш #:

P.D. ¿Qué son los incrementos ZZ?

Construye ZigZag por HighBid/LowAsk y toma incrementos entre vértices.