Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 19

 
Candid:

No hace falta que comentes, sino que intentes responder a mis preguntas. Te contaré un secreto: están diseñados para que entiendas algo al tratar de responderlos).

He leído la discusión, por cierto, ¿en serio quieres discutir una mezcla de 17 páginas de moscas y chuletas?

¿Estoy en lo cierto al adivinar cómo se llaman los dos procesos?

No sé en qué parte de la página 17 viste una mezcla de chuletas y moscas. Ya surgió antes...

En cuanto a la comprensión - recomiendo mirar la tabla de Alexey y responder - bajo el supuesto de qué distribución teórica se construye?

;)

 

y los dos procesos son teóricos (la hipótesis nula) y reales.

Tendrías que saberlo.

 
joo:

No entiendo para nada la mitad de las palabras de este hilo, pero hasta yo entendí, que las distribuciones no tienen nada que ver.

La distribución de un proceso, en el que existen dependencias entre recuentos individuales, no tiene por qué ser ni uniforme ni normal. Eso es obvio.

Ejemplo: los poemas de Pushkin. Si el texto menciona las palabras "roble" y "cadena", entonces en algún lugar cerca hay "gato". Esta relación entre palabras no tiene nada que ver con la distribución de la palabra "tom", o cualquier otra, en los párrafos.

¿Sabes lo primitivo que es comprobar la autenticidad de la autoría?

Así es como por la frecuencia de las combinaciones "dub-chain-cat" de los textos de "referencia" y los comprobados - hacer una conclusión.

Porque siempre hay una base de comparación.

Pero aquí no entiendo qué se está comparando con qué?

Donde es la frecuencia teórica. ¿O más bien de quién es?

¿Quizás Candid tenga razón y sólo tengamos que emigrar a Grecia, y todo se pondrá en su sitio?

;)

 
avatara:

No sé dónde has visto una mezcla de chuletas y moscas en la página 17. Estaba allí antes...

Aquí está el problema con los finales de nuevo, 17 páginas se convirtieron en la página 17. ¿Te importaría releer esas 17 páginas en busca de otros "errores" de percepción?
y los dos procesos son teóricos (hipótesis nula) y reales
En realidad, mi primer post citaba al iniciador del tema, sería más lógico suponer que me refería a su versión en primer lugar. Especialmente porque él, a diferencia de Alexey, lo describió con gran detalle. Pero no estoy seguro de que la identificación de las hipótesis con los procesos contribuya a la claridad de la presentación.
En cuanto a la comprensión - recomiendo mirar la tabla Alexey, y la respuesta - bajo el supuesto de que la distribución teórica que se construye?

Francamente, no lo sé. Me basaría en una distribución empírica.
 
avatara:

y los dos procesos son teóricos (la hipótesis nula) y reales.

Deberías saberlo.

No, mal. Estoy interpretando este criterio. Por cierto, tiene las mismas estadísticas. Sólo se aplica a otras cantidades.

Ahora las dos variables cuya independencia se está probando. En la tabla de bloques que publiqué, son los rendimientos de dos barras separadas por 310 barras (309 barras entre ellas). Las estadísticas se comprueban en toda la población de estos pares de barras en el historial. Si hay 60000 barras en el historial, entonces hay 59690=60000-310 pares de barras de este tipo.

La barra que está más adelante es la fuente de S . Su barra emparejada más cercana al presente es el receptor R . Los retornos S y R son los valores cuya independencia se comprueba. Más concretamente, no los rendimientos en sí, sino los números de cuantiles en los que caen. El motivo de dividir por cuantiles ya se explicó anteriormente: para que funcione la chi-cuadrado (frecuencias de al menos 10).

Sobre el buey como fuente principal del fenómeno - lo pensaré. Algo no es tan simple aquí... Pero la sugerencia de Candid tiene sentido para probarlo (quitar el buey).

 

He echado un vistazo al artículo del autor. Tengo la sospecha de que el autor no encontró una correlación entre las variables barra actual <-> barra pasada, sino sólo el hecho de la agrupación de la volatilidad. Por supuesto, incluso sobre esa base, el gráfico es interesante, ya que una correlación segura de la volatilidad hasta 50-60 rezagos es algo nuevo. Naturalmente, al mezclar los datos mediante el método de Montecarlo, la agrupación se rompe, lo que resulta evidente en los gráficos.

Para entender lo que se ha encontrado, es necesario probar la fórmula propuesta en distribuciones no normales y obviamente independientes, especialmente en la clásica GARCH(1,1) o mejor aún, en GARCH(3,3); si se puede encontrar dependencia en ella también, la fórmula no da nada nuevo, simplemente define un caso especial de la martingala de una manera más.

Si el autor lo desea, puedo proporcionarle retornos sintéticos GARCH.

 

Gracias. Dame algunos datos artificiales, los probaré el fin de semana.

En cuanto a la fórmula, sí, no hay nada especialmente maravilloso en ella, es un análisis estocástico desde un ángulo diferente.

En cuanto a la volatilidad, ya se ha dicho mucho aquí y estoy de acuerdo con las opiniones. Pero el número de rezagos en los que las variables independientes llevan la información de la volatilidad para la barra cero está realmente indicado. Y la profundidad del desfase es diferente para los distintos instrumentos financieros, manteniendo la relevancia de la información.

 
En general, creo que si no se pueden predecir las rentabilidades basándose en las rentabilidades pasadas, siempre existe, para mí personalmente, la posibilidad de volver al problema de la selección de variables independientes (varios indicadores) para la predicción. El tema se llama selección de características, y estaría encantado de discutir otros métodos, como el análisis de componentes principales, utilizando NS con memoria auto-asociativa, análisis de redes entrenadas (pesos), análisis de cluster, chi-cuadrado, también hay exponente de Lipschitz (corrección: constante). En definitiva, gente, es un gran tema...
 
C-4: Por supuesto, incluso sobre esa base, el gráfico es interesante, ya que una relación de volatilidad segura con 50-60 rezagos es algo nuevo.

Gracias por notarlo. Eso es lo alarmante. Probablemente, sí, la vola explica una parte importante del fenómeno, pero no parece explicarlo todo. Y en el reloj, esa correlación se remonta aún más... cientos barras de profundidad.

Por cierto, hay muchas menos correlaciones en los días que en H4, que, a su vez, tienen muchas menos correlaciones que en H1.

 
Mathemat:

Gracias por notarlo. Eso es lo alarmante. Probablemente, sí, la vola explica una parte importante del fenómeno, pero no parece explicarlo todo. Y en el reloj, esa correlación se extiende aún más. cientos barras de profundidad.

Por cierto, hay muchas menos correlaciones en los días que en H4, que, a su vez, tienen muchas menos correlaciones que en H1.


Si se trata de nuevo de la volatilidad, entonces se puede explicar muy bien por una clara ciclicidad en función de la hora del día:

No hace falta ser Einstein para notar, incluso a simple vista, la agrupación del buey alrededor de las 16:30. Por lo tanto, en las escalas intradiarias estas "correlaciones" son naturalmente mucho más definidas. Y, por supuesto, esto no nos aporta nada de todos modos. Sólo sabemos que se producen fuertes movimientos a las 16:30 (como podemos ver en el gráfico), causados por la entrada de volatilidad, pero aún no sabemos la dirección del movimiento ni sus objetivos.

Como prometí, pego una sintaxis - GARCH(1,1) con los parámetros estándar que ofrece MathLab: garchset('P',1,'Q',1,'C', 0.0001, 'K', 0.00005, 'GARCH', 0.8, 'ARCH', 0.1); no conseguí hacer GARCH(3,3) o incluso más - conozco mal el programa y un simple cambio de 'P',1,'Q',1 a 'P',3,'Q',3 no funcionó. La serie contiene 10 000 pruebas, que creo que serán suficientes. Aquí está su gráfico de precios:

También sería interesante generar una SB basada en datos de volatilidad horaria del mismo EURUSD. Tendrá el mismo carácter de volatilidad que en el EURUSD, pero el gráfico en sí estará formado por un 100% de ruido. Si detecta la dependencia, significa que el método no es adecuado para la previsión de precios, pero si no revela la dependencia, entonces seremos testigos del nacimiento de un nuevo indicador, capaz de determinar si estamos tratando con abstrusos sintéticos sin sentido o con el mercado real.

Archivos adjuntos:
garch.zip  91 kb
Razón de la queja: