Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 23

 
joo:
... ¿y en qué combinación?"
Es más complicado que eso. Mucho más complicado y caro computacionalmente. Permítanme decirlo así: seleccionar un conjunto de variables informativas es fácil, eliminar las variables redundantes (mutuamente informativas) es más difícil; y seleccionar pares, triples.... Las variables cuyas combinaciones influyen en la variable objetivo son exponencialmente más difíciles, en primer lugar, por la enorme cantidad de cálculos.
 
alexeymosc:
Es más complicado que eso. Mucho más complicado y caro computacionalmente. Permítanme decirlo así: es fácil seleccionar un conjunto de variables informativas, es más difícil eliminar las variables redundantes (mutuamente informativas); y es más difícil seleccionar pares, triples.... de variables cuyas combinaciones influyen en la variable objetivo es exponencialmente más difícil, en primer lugar, por la enorme cantidad de cálculos.
¿y cómo se realiza la búsqueda, no por fuerza bruta?
 

Es muy extraño que la distribución resultante para GARCH(1,1) parezca normal. Es más, simplemente no puede ser. Una marca registrada de estos modelos es el alargamiento y las colas gruesas, para imitar las distribuciones reales del mercado. Al parecer, el gráfico resultante no es representativo o el periodo de contabilización de la volatilidad (P=1, Q=1) no es lo suficientemente largo, por lo que muestra signos de delgadez.

Pero hay otra cosa interesante:

En el gráfico calculado se ve claramente la huella de la influencia de GARCH(1,1), es decir, en el primer tramo hay una perturbación significativa de la "relación" y la incertidumbre en todos los demás datos. Esto es exactamente como debería ser, porque el modelo sólo recuerda la volatilidad de la barra anterior. Estoy seguro de que los tres primeros rezagos estarán claramente marcados para GARCH(3,3), los veinte primeros rezagos para GARCH(20, 20), etc.

Intentaré luchar con MathLab y obtener los datos GARCH(20, 20). Si su análisis muestra la correlación de 20 períodos, el asunto está claro: la fórmula muestra la correlación de la volatilidad.

 
C-4:


Intentaré luchar con MathLab y obtener datos GARCH(20, 20). Si su análisis muestra la correlación para 20 períodos, el asunto está claro: la fórmula muestra la correlación de la volatilidad.

No lo hace. Ya sé que la fórmula tiene en cuenta esto... Mira el gráfico de 5 minutos. La relación obvia de vol en los lags más cercanos y en el lag 288 es un ciclo diario. Pero adelante, si quieres. Lo comprobaré.

Tratamos de encontrar "otras dependencias", porque la información mutua absorbe todas las dependencias posibles. Debemos ser capaces de separarlos.

 

EURUSD H1.

I en la serie original (misma discretización por 5 cuantiles):

Suma de la información mutua: ¡3,57 Bits! El valor más alto de todos los plazos probados.

Ahora tomemos los rendimientos ^ 2, eliminemos el signo y estudiemos la volatilidad:

Eso parece. Pero la suma de I = 5,35 Bits.

¡Tiene sentido! Al fin y al cabo, la incertidumbre en la serie de volatilidad neta es menor.

¿Y qué ocurre si se resta una de la otra?

 
alexeymosc: Este es el aspecto de una matriz de frecuencias (el primer retardo es la variable objetivo) para datos aleatorios con características de 5 minutos.

Maldita sea. Sus matrices me dieron la impresión de un avance y un logit. Lo he mirado en el buscador, y de qué se trata... entonces me di cuenta de que sólo era la probabilidad y su logaritmo.

P.D. Lu-u-u-dee, ¿te queda todo claro en estas tablas? Si no lo entiendes, pregunta, pregunta. Para las preguntas estúpidas, no vamos a golpear (porque soy un poco tonto sentir a mí mismo aquí).

Por una vez hay un tema decente, que casi no tiene humor, es sarcástico y se centra en los peces inmediatos en lugar de la caña de pescar - pero hay un proceso muy interesante de búsqueda de la verdad...

¿En qué lugar de la econometría se pueden encontrar estas preguntas?

 
anonymous:


Es cierto que el mercado es más complejo. Pero eso no es razón para ignorar el fenómeno observado

No hago investigaciones científicas sobre el mercado. El objetivo específico es hacer una predicción un paso por delante.

Sobre las pruebas: la heteroscedasticidad es un hecho generalmente aceptado en la literatura

Es un eslogan que dice que has visto algo en alguna parte. Leer estas publicaciones no me hace ganar más dinero.

Para ser precisos, las pruebas de heteroscedasticidad no son sólo para los reterms, que se calculan utilizando diferentes fórmulas, sino para los residuos del modelo, que es el estándar en los paquetes de econometría.

A veces se aplican pruebas de heteroscedasticidad a los predictores y a los errores del modelo.

Si por "errores del modelo" se entiende el residuo del modelo = la diferencia entre la cotización original y el modelo, entonces estoy de acuerdo. Y las pruebas de heteroscedasticidad se aplican no a veces, sino siempre. Si hay heteroscedasticidad en el residuo del modelo, entonces se modela, y el objetivo final del modelo agregado es obtener un residuo estacionario (mo y varianza son una constante). Si el mo y/o la varianza son variables, entonces no es posible la predicción, ya que el error de predicción se convierte en una variable.

 
Mathemat:?

Por una vez hay un tema decente...

Me gustaría señalar que todos los posts que cuestionaban la decencia del tema fueron ignorados.

 
no generan SBs basadas en GARCH. Hay que tomar una serie real y generar una SB basada en la volatilidad real. He publicado un script aquí https://forum.mql4.com/ru/41986/page10 que sustituye el historial offline de un instrumento real por un SB utilizando tick volumétrico. Una SB de este tipo reproducirá casi al 100% el vol real. GARCH, etc. no tienen en cuenta muchos matices como los diferentes ciclos de onda y muchos otros. Si hay alguna diferencia entre esta fila de SB y la fila de la que se genera, es más interesante :)
 
alexeymosc:

EURUSD H1.

I en la serie original (misma discretización por 5 cuantiles):

¿Recuerdo correctamente que el dato bruto aquí es el módulo incremental porcentual?

Pero si es así, es de hecho la misma volatilidad (es decir, su función monótona e inequívoca), podemos esperar que todos los efectos relacionados con la volatilidad aparezcan aquí también, aunque de forma algo filtrada. Y como los efectos de la volatilidad parecen superar con creces todos los demás fenómenos del mercado, la perspectiva de ver "algo más" en su fondo parece bastante problemática. Repito, creo que es más prometedor intentar excluir sistemáticamente los efectos conocidos pero "inútiles" de los datos brutos.

Por cierto, Alexey(Mathemat), ¿también tienes los datos en bruto como módulos?

Razón de la queja: