Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 16

 
Y he conceptualizado un nuevo curso de investigación (escribiendo para los interesados, no para los que insultan en el lenguaje de las fórmulas). Si tenemos dependencia de la volatilidad (dependencia tanto de los rezagos más cercanos como de los cíclicos - 24 horas para H1), entonces por qué no calcular la misma información mutua para los retornos tomados en módulo (que será volatilidad pura), y luego restar la cantidad de información obtenida de los similares (donde los retornos fueron con signo +-). Si todo está bien calculado, entonces tendremos una dependencia del signo en el atraso. Este caso ya puede compararse con una serie temporal de ruido.
 
alexeymosc:
Y he conceptualizado un nuevo curso de investigación (escribiendo para los interesados, no para los que juran en el lenguaje de las fórmulas). Si tenemos dependencia de la volatilidad (dependencia tanto de los rezagos más cercanos como de los cíclicos - 24 horas para H1), entonces por qué no calcular la misma información mutua para los retornos tomados en módulo (que será volatilidad pura), y luego restar la cantidad de información obtenida de los similares (donde los retornos fueron con signo +-). Si todo está bien calculado, entonces tendremos una dependencia del signo en el atraso. Este caso se puede comparar con las series temporales de ruido.

Incluso si se encuentra algo no trivial, siempre habrá una cuestión de aplicación correcta de las fórmulas y, lo que es más importante, de cómo aplicarlo en la práctica. Es decir, el interés es puramente académico)))
 
avatara:

Pero, Alexey, ¿podrías formular con más claridad (utilizando tu tabla) qué hipótesis sobre la distribución de los rendimientos corresponde a la estimación de chi-cuadrado?

¿El "marrón" prima facie, o algo más fresco?

Ninguna. Al estimar la relación chi-cuadrado, no se inventa ninguna hipótesis sobre las distribuciones. Resulta ser un criterio no paramétrico.

 
Mathemat:

Ninguna. Al estimar la dependencia con chi-cuadrado, no se formulan hipótesis sobre las distribuciones. Así que es un criterio no paramétrico.

¿Cómo que ninguna?

¿Puede escribir la dependencia que hay que estimar?

Quizá después de las fórmulas me haga a la idea. ¿O esperas una distribución uniforme...

;)

 
Avals:

Aunque se encuentre algo no trivial, siempre quedará la cuestión de la aplicación correcta de las fórmulas y, sobre todo, de cómo aplicarlo en la práctica. Es decir, el interés es puramente académico)))
Creo que los resultados de los experimentos de predicción son el criterio principal. Si es evidente que las estadísticas de TI ayudan, entonces todo está bien. Y para aplicar las fórmulas correctamente por supuesto, ahora estoy leyendo artículos al respecto.
 
avatara: ¿Cómo que ninguna?

¿Puedo anotar la relación estimada?

Tal vez después de las fórmulas me haga una idea. ¿O esperas una distribución uniforme...

No, en absoluto, te digo la verdad. Hipótesis non fingo.

¿Has probado a aplicar el criterio chi-cuadrado de independencia de los valores? Yo mismo no sabía cómo hacerlo hace unos meses, pero lo hice. Pruébalo, no hay nada difícil. Busca un manual de matstat de alguna institución de fuera del estado y léelo. Cuanto más sencillo y claro sea el método descrito, más rápido lo entenderás.

En realidad, hay varios criterios de chi-cuadrado. Pero me refiero al que evalúa la independencia de los valores. Este criterio no lo evalúa en base a distribuciones dadas a priori. Sólo comprueba la hipótesis de independencia de dos variables a un nivel de significación determinado (normalmente 0,95 o 0,99). Cuanto más se acerque el nivel de significación a 1, más fiable será la conclusión.

La base ideológica del criterio es la fórmula habitual de la probabilidad conjunta de dos cantidades. En los dedos: si P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) para cualquier x1,y1 admisible, entonces X e Y son independientes. Y viceversa. Y el chi-cuadrado calcula, a grandes rasgos, una suma ponderada de desviaciones de esta igualdad para todos los casos posibles y la compara con algún valor límite. Si la suma obtenida es mayor que este valor límite, no se acepta la hipótesis de independencia de las variables (Nula). Si es menor, no se rechaza la hipótesis nula.

 
Mathemat:

Ninguno, te digo la verdad. Hipótesis non fingo.

¿Has probado a aplicar el criterio chi-cuadrado de independencia de los valores? Yo mismo no sabía cómo hacerlo hace unos meses, pero lo hice. Pruébalo, no hay nada difícil. Busca un manual de matstat de alguna institución de fuera del estado y léelo. Cuanto más sencillo y claro sea el método descrito, más rápido lo entenderás.

De hecho, existen varios criterios de chi-cuadrado. Pero me refiero al que evalúa la independencia de los valores. No evalúa la independencia basándose en distribuciones a priori. Sólo prueba la hipótesis de independencia de dos valores a un nivel de significación determinado (normalmente 0,95 o 0,99). Cuanto más se acerque el nivel de significación a 1, más fiable será la conclusión.

La base ideológica del criterio es la fórmula habitual de la probabilidad conjunta de dos cantidades. En los dedos: si P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) para cualquier x1,y1 admisible, entonces X e Y son independientes. Y viceversa. Y el chi-cuadrado calcula, a grandes rasgos, una suma ponderada de desviaciones de esta igualdad para todos los casos posibles y la compara con algún valor límite. Si la suma obtenida es mayor que este valor límite, se acepta la hipótesis de dependencia de los valores. Si es menor, no se rechaza la hipótesis de independencia.

No seas ridículo...

Te han preguntado por la hipótesis de la distribución, y acabas de conocer este método ayer.

Quiero saber insistentemente: ¿cuál es la hipótesis nula? ¿Que son independientes?

 

Cero: "los rendimientos son independientes". No es divertido, de verdad.

¡No hay hipótesis sobre las distribuciones que he probado! Eso es otro chi-cuadrado. ¡Y sólo he probado la dependencia!

Si quiere comprobar la distribución, adelante. Es Laplaciano con una precisión decente.

 
Mathemat:

Cero - "los rendimientos son independientes". Nada divertido, en realidad.

¡No hay hipótesis sobre las distribuciones que he probado! Eso es otro chi-cuadrado. ¡Y sólo he probado la dependencia!

Si quieres probar la distribución, adelante. Es Laplaciano con una precisión decente.

De acuerdo.

Echemos un vistazo.

---

¿Es la hipótesis de independencia la misma que la hipótesis de una distribución uniforme o de una distribución normal?

Eso es lo que quiero averiguar.

Entonces con "Laplace-like" todo tiene sentido.

 
alexeymosc:
Y he conceptualizado un nuevo curso de investigación (escribiendo para los interesados, sin jurar en el lenguaje de las fórmulas). Si tenemos dependencias de la volatilidad (dependencia de los rezagos más cercanos, así como cíclica - 24 horas para H1), entonces por qué no calcular la misma información mutua para los retornos tomados en módulo (que sería la volatilidad pura), y luego restar la cantidad de información obtenida de la similar (donde los retornos fueron con signo +-). Si todo está bien calculado, entonces tendremos una dependencia del signo en el atraso. Este caso ya puede compararse con una serie temporal de ruido.

¿Puedo ponerlo a mi manera?

Por lo tanto, el enfoque elegido muestra que hay dependencias. La más evidente, razonable y visible a simple vista es la periodicidad diaria de la volatilidad.

Por lo tanto, el siguiente paso lógico en mi investigación sería tratar de excluir esta dependencia obvia y muy fuerte de los datos y ver si nuestro (su) método muestra la presencia de otras dependencias.

Como método de eliminación propongo simplemente relacionar los incrementos con el perfil de volatilidad diario.