Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 2

 
alexeymosc:

En primer lugar, la ciclicidad no está en el gráfico diario, sino en el gráfico horario. Por cierto, yo escribí allí.

Y para los gráficos diurnos el resultado no será cíclico, tienes razón.

Perdón, repetimos para el gráfico horario.

El gráfico original para 120 horas.

No veo ciclicidad en el gráfico, la tendencia está ahí. Comprobemos la normalidad:

En la Cerveza Asada, no es normal en absoluto. Comprueba el ACF:

Hay una tendencia y no una ciclicidad - resultado diferente.

Si hay una tendencia, no es necesario hacer un análisis estadístico. Vamos a desdramatizar con el mismo Hodrick:

El residuo es ruido blanco. Mira los ciclos en él:


Por supuesto que hay una ola, pero no es sólida y no es nada hermosa comparada con la suya. Creo que toda la diferencia es la desviación. Si no se eliminan los componentes detrimentales, es imposible hacer estadísticas.

 
Estás haciendo algo propio. No tiene ninguna relación con lo que hago ))) Empecemos por el hecho de que trabajo con una serie de incrementos. Entonces, si tomas los valores de esta serie módulo (es decir, los más y los menos) y construyes un autocorrelograma, seguro que obtienes una bonita ciclicidad con periodo 24. Esto es lógicamente más cercano a mi caso.
 
Ayer añadí un extracto sobre la teoría de la información a un artículo de Hubra. Puede ayudar a comprender el proceso de búsqueda de variables importantes.
 
alexeymosc:
Estás haciendo algo propio. No tiene ninguna relación con lo que estoy haciendo ))) Empecemos por el hecho de que trabajo con un número de incrementos. Entonces, si tomas los valores de esta serie módulo (es decir, los más y los menos) y construyes un autocorrelograma, apuesto a que obtendrás una bonita ciclicidad con periodo 24. Esto está lógicamente más cerca de mi negocio.

Lo que tú digas. Calculo el incremento como la diferencia de cada uno de los sucesivos con el anterior. Obtengo un gráfico:

Para estos incrementos calculo el ACF

Tenga en cuenta que la última columna es la probabilidad de que no haya correlación entre las barras.

Tomo el cuadrado de los incrementos. Aquí está el gráfico:

Estos son los picos de volatilidad, ¿qué tiene que ver la ciclicidad de los incrementos? ¿Tal vez la ciclicidad de la volatilidad? Eso también es interesante. Comprobemos la ciclicidad de la acreción:

Pues bien, aquí no hay ciclicidad, y fíjese en la última columna: altísima probabilidad de que no haya correlación.

Otras dos cifras son interesantes. Comprobemos la normalidad de los incrementos:

Obsérvese que, según Jarque-Bera, la probabilidad de normalidad es igual a cero.

¿Qué tipo de distribución es ésta? Ojalá fuera normal. Siempre me ha parecido cuestionable la idea de trabajar con incrementos derivados como la diferencia del posterior al anterior.

Finalmente. Por alguna razón no puedo obtener su resultado.

 

faa1947, tus cálculos no tienen nada que ver con el flujo medio de información del que hablaba el iniciador del tema. Tú estás procesando datos de los últimos 5 días, mientras que el gráfico de Alexei es el resultado de procesar datos de relojes de más de una docena de años. Lo de Alexei es una estadística, mientras que lo tuyo es un caso único y aislado que no demuestra nada en el contexto de la discusión.

La periodicidad que muestra el topicstarter no tiene nada que ver directamente con la volatilidad o los rendimientos. No se trata de una periodicidad de precios, sino de una in-forma-na-na. En el eje de abscisas está el retardo y en el de ordenadas la información mutua media en bits. Y el autocorrelograma fue mencionado por Alexey para confundir a todos :) ¡No es la autocorrelación de los rendimientos! No hablamos de ello en absoluto, porque estas dependencias de información son obviamente no lineales en su mayor parte, y no pueden ser detectadas por los retornos ACF en absoluto.

¿Has leído detenidamente el artículo sobre hubra? No tiene nada que ver con tu querida estacionariedad, ni con la normalidad de la corriente de retorno, ni siquiera con la periodicidad condicional de la volatilidad. Por supuesto, sería bueno comprobar la estacionariedad aquí también, pero sería de un tipo muy diferente, en cuanto a la información (si es que la hay).

2 Avals: Me temo que no puedo encontrar un historial de ticks profundos para probar tu hipótesis de volatilidad directamente. Sí, y los cálculos aquí serían completamente demenciales en volumen (ya son bastante voluminosos). Juzgaremos lo que se encuentre mediante intentos de predicción directa (si funciona, claro; hay muchas, muchas trampas).

 
Mathemat:

Lo de Alexey es una estadística, mientras que lo tuyo es un caso único y aislado, que no demuestra nada en el contexto de la discusión.

Sólo quiero señalar que cuando el número de observaciones es superior a 30, la estadística t converge a la estadística z. Es una gran noticia para mí que 10000 observaciones sean necesariamente mejores que 1000. Para revelar la periodicidad semanal de los datos horarios, se necesitan varias semanas en horas. Pero eso no viene al caso.


La periodicidad mostrada por el tema-inicio no tiene nada que ver con la volatilidad o los rendimientos. No es una periodicidad de precios en absoluto, es una in-form-ma-tsion-na-na.

Mucho más importante es el valor metodológico del enfoque. Para mí es axiomático que cualquier cálculo matemático debe tener una interpretación económica cualitativa. La periodicidad de la información es una fórmula que revela la periodicidad en los datos, que es intrínsecamente una relación incremental. Para volver atrás debemos ser capaces de retroceder a la serie temporal original, encontrar estos lugares y encontrar una explicación económica, es decir, volver a los precios es obligatorio, de lo contrario sólo es otra astucia matemática. Por eso relacionaba este tema con los ciclos regulares.
 
Mathemat: Esto no es autocorrelación de los rendimientos. No estamos hablando de ello en absoluto, ya que estas dependencias de información son obviamente no lineales en su mayor parte y no son detectables por los retornos ACF en absoluto.

En realidad, al final del artículo se aplicaron los métodos habituales de la estadística matemática.

Me resarzo de mi malentendido y tomo la proporción de los precios de los vecinos.

Gráfico de la relación de precios:

Comprobar la normalidad

Sorprendentemente, la normalidad se rechaza estrictamente.

Trazamos el ACF - son las dependencias entre los rezagos + el ACF parcial que se limpia de las dependencias en el ACF

Obsérvese la última columna: la probabilidad de que no haya dependencias es muy alta.

Tengo una clara explicación económica para estos cuadros, bien apoyada por el cuadro de cotizaciones. ¿Cómo se confirma en los presupuestos iniciales, cuál es la justificación económica? Sin respuestas a estas preguntas, no puedo entender el significado de la "dependencia de la información".

 
La respuesta más fácil para ti es. Está utilizando la autocorrelación, es decir, sólo busca dependencias lineales. La información mutua indica la presencia de dependencias arbitrarias, que es de donde proviene toda la diferencia. Además, experimenté con muestras estadísticamente redundantes de miles y decenas de miles de incrementos, y tú tardaste una semana. Esa semana podría ser cualquier cosa, es un caso especial. Sus resultados no son significativos.
 
faa1947: La periodicidad informativa es una fórmula que revela la periodicidad en los datos que es inherentemente una relación incremental.

Se equivoca fundamentalmente. No se trata de ninguna periodicidad en los datos como una relación incremental.

Se revela la dependencia de la información, que no tiene por qué conducir a la periodicidad de la relación de incrementos en absoluto. Eso es lo que tiene la minería de datos, que permite identificar estructuras que no están en la superficie.

Para volver atrás debemos ser capaces de retroceder a la serie temporal original, encontrar estos lugares y encontrar una explicación económica, es decir, volver a los precios es obligatorio, de lo contrario sólo es otra astucia matemática. Por eso he vinculado este tema a los ciclos regulares.

Sí, deberían, no lo discuto. No tiene por qué haber una explicación económica. Es suficiente para volver a los precios. Pero su vinculación de este fenómeno con los ciclos normales es errónea. No estoy tan ciego como para no notar la falta de periodicidad pronunciada en el gráfico.

Alexey ya te ha hablado de la diferencia entre dependencias lineales y no lineales.

 
alexeymosc:
La respuesta más fácil para usted. Está utilizando la autocorrelación, es decir, está buscando exclusivamente dependencias lineales. La información mutua indica la presencia de dependencias de un tipo arbitrario, de ahí toda la diferencia. Además, experimenté con muestras estadísticamente redundantes de miles y decenas de miles de incrementos y tardaste una semana. Esa semana podría ser cualquier cosa, es un caso especial. Sus resultados no son significativos.

Además, yo estaba experimentando con muestras estadísticamente redundantes de miles y decenas de miles de incrementos, y tú tardaste una semana. Esa semana podría ser cualquier cosa, es un caso especial. Sus resultados no son significativos.

Me parece que aumentar el tamaño de la muestra sólo tiene interés dentro del teorema del límite de convergencia de la probabilidad a la ley normal. Si no nos fijamos ese objetivo, el simple hecho de aumentar el tamaño de la muestra no sirve de nada. A continuación doy un ejemplo de aumento por un factor de 10.

El gráfico de incrementos como la relación entre el siguiente precio y el anterior:

El cuadrado de este gráfico:

El gráfico es algo similar al tuyo. Tenía una pregunta sobre la interpretación económica de este gráfico, pero no has dado una respuesta


Siguiente:


Si se compara con una muestra 10 veces menor, ¡no ha cambiado nada!



Algo nuevo aquí: la probabilidad de que no haya relación es cero.


La información mutua indica la presencia de dependencias de un tipo arbitrario, de ahí toda la diferencia.

Yo también tendría cuidado con la "linealidad" y la "no linealidad", porque esta cuestión puede y debe plantearse en el marco del modelo, mediante el cual se aproxima la serie temporal. Analizando los coeficientes de este modelo se puede concluir que estos coeficientes son: constantes (o casi constantes), funciones deterministas o funciones estocásticas. Se trata de un proceso perfectamente concreto y constructivo de análisis del tipo de dependencias. ¿Y qué hay de constructivo en descubrir esta dependencia de la información? Y de nuevo, ¿cómo lo ves en la serie temporal original?