Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 25

 
Candid:

¿Recuerdo correctamente que los datos de entrada aquí son el módulo de porcentaje incremental?

Pero si es así, se trata esencialmente de la misma volatilidad (es decir, su función monótona e inequívoca), cabría esperar que todos los efectos relacionados con la volatilidad aparecieran también aquí, aunque de forma algo filtrada. Y como los efectos de la volatilidad parecen superar con creces todos los demás fenómenos del mercado, la perspectiva de ver "algo más" en su fondo parece bastante problemática. Repito, creo que es más prometedor intentar excluir sistemáticamente los efectos conocidos pero "inútiles" de los datos brutos.

Por cierto, Alexei(Mathemat), ¿también tienes datos de origen en módulos?

¡Buenos días!

Para todos los gráficos de Forex calculo en pips (en contraste con el mercado de valores).

Segundo - guardo los signos, es decir, no tomo módulo. Todo lo que ha visto para D1, M5, H1 - se calcula sobre la base de los rendimientos en pips, discretizados a 5 símbolos del alfabeto, el signo del cambio de precios se conserva.

Último gráfico para H1 - He elevado al cuadrado los rendimientos para eliminar el signo.

 
HideYourRichess:

En realidad, tanto el gran Bohr como el gran Shannon, en la solución de sus problemas pasaron de la esencia, la "física", a las cifras, a diferencia de lo que ocurre aquí.

Segundo problema, no es posible explicar a las personas que quieren creer, que su creencia es falsa. Cómo es posible explicar a la gente que el método no es aplicable, ya que está diseñado para la estacionariedad y la independencia. Dejemos incluso la independencia en forma de cadenas de Markov, en cualquier caso excluye la aplicabilidad del método a los datos con presencia de "memoria" más larga que la considerada. La no estacionariedad y la dependencia (quiero enfatizar una vez más, que esta dependencia también es no estacionaria, por lo que no funcionan ni la CM, ni las entropías condicionales) se derivan directamente de la comprensión de los procesos de mercado que generan un flujo de cotizaciones.

No, no venían del punto, venían de los hechos :)) Es una broma :).

¿Exige usted una estacionariedad estricta a los procesos reales? Espero que no. Sigamos adelante. Necesitamos regularidad, es decir, un efecto que exista durante un tiempo suficiente. Es decir, nos interesan los procesos estacionarios (al menos aproximadamente y al menos durante el tiempo limitado por nuestra muestra) en el mercado. En otras palabras, el aparato es bastante adecuado para el propósito.

 
alexeymosc:

¡Buenas tardes!

Para todos los gráficos de Forex cuento en pips (a diferencia del mercado de valores).

En segundo lugar, guardo los signos, es decir, no los tomo como un módulo. Todo lo que ha visto para D1, M5, H1 - se calcula sobre la base de los rendimientos en pips, discretizados a 5 símbolos del alfabeto, el signo del cambio de precios se conserva.

Último gráfico para H1 - He elevado al cuadrado los rendimientos para eliminar el signo.

La presencia de un cartel marca una gran diferencia, por supuesto. Es que en su artículo, las funciones de densidad de probabilidad sólo se dan para valores positivos.
 
Candid:
La presencia del cartel marca una gran diferencia, por supuesto. Lo que ocurre es que en su artículo las funciones de densidad de probabilidad se dan sólo para valores positivos.

Estas funciones no son por rendimientos, sino por el valor de la información mutua calculada, y este valor no puede ser negativo.

En el artículo de Habra para las devoluciones también se mantuvo el signo, pero allí tomé incrementos porcentuales. Pero no hay mucha diferencia.

Aquí - compare los dos últimos gráficos para el EURUSD H1. En el primero se conserva el signo de los incrementos, en el segundo se omite. La informatividad del segundo sistema es naturalmente mayor. Pero la informatividad no es baja ni siquiera con el signo de la dirección del movimiento. Ya es interesante.

 
alexeymosc:
Estas funciones no se basan en los rendimientos, sino en los valores de la información mutua calculada, y este valor no puede ser negativo.

Sí, ya me he dado cuenta de que estaba equivocado.

En cualquier caso, si la metodología percibe los efectos de la volatilidad incluso en datos significativos, eso habla bastante a su favor, en mi opinión.

 
Candid:

Sí, ya me he dado cuenta de que estaba equivocado.

En cualquier caso, si la metodología percibe los efectos de la volatilidad incluso en los datos de referencia, eso habla bastante a su favor, en mi opinión.

He dado aquí la tabla de cálculo real abajo - esto es las cotizaciones reales de EURUSD M5: https://www.mql5.com/ru/forum/135430/page22

El estado 1 es el cuantil inferior (fuerte movimiento a la baja), el estado 5 es un fuerte movimiento al alza. La variable independiente vuelve un paso atrás, es decir, el retardo más cercano. Se puede ver que si el valor de la fuente = 1, el receptor tiene más probabilidades de tomar el valor 1 o 5, pero con un sesgo de 5.

Si la fuente tomó un valor de 5, el receptor tiene 1 o 5 más probabilidades de estar sesgado hacia el 1. Estas cosas reducen la incertidumbre del estado del receptor. Tanto la volatilidad como la asimetría con respecto a valores específicos desempeñan un papel en este caso. Al aislar la volatilidad por separado, se mantiene el componente informativo para valores específicos (en lugar de pares de valores polares de 1-5).

He publicado esta captura de pantalla a propósito para que quede más clara la esencia de la investigación. Todo se basa en la probabilidad y la función de densidad.

 
joo:
¿cómo se hace la búsqueda, no por fuerza bruta?

La exageración es una opción. Podrías probar un algoritmo de búsqueda genética con información mutua como función de aptitud.

Imagina que tienes un conjunto de 100 variables, que están igualmente muestreadas. Podría ocurrir que si la variable 5 toma el valor 3 y la variable 76 toma el valor 1, la probabilidad de que la variable dependiente tome el valor 4 es del 75%. Pero para muestrear este par de variables independientes, necesitamos medir la información mutua entre las dos variables independientes y la variable dependiente 100 * 100 - 100 veces. Y si queremos ver las combinaciones de las tres variables independientes

 
Avals:
no generan SBs basadas en GARCH. Hay que tomar una serie real y generar una SB basada en la volatilidad real. He publicado un script aquí https://forum.mql4.com/ru/41986/page10 que sustituye el historial offline de un instrumento real por un SB utilizando tick volumétrico. Una SB de este tipo reproducirá casi al 100% el vol real. GARCH, etc. no tienen en cuenta muchos matices como los diferentes ciclos de onda y muchos otros. Si hay una diferencia entre esta fila de SB y la fila de la que se genera, es más interesante :)

Aquí hay un gráfico generado de SB con idéntica volatilidad con el EURUSD. Alexey, por favor, realiza un análisis para ello. Veamos si hay diferencias.
Archivos adjuntos:
eurusd_r.zip  499 kb
 
Candid:

No, no venían del punto, venían de los hechos :)) Es una broma :).

¿Exige usted una estacionariedad estricta a los procesos reales? Espero que no. Sigamos adelante. Necesitamos regularidad, es decir, un efecto que exista durante un tiempo suficiente. Es decir, nos interesan los procesos estacionarios (al menos de forma aproximada y durante el tiempo limitado por nuestra muestra) en el mercado. Es decir, el aparato es bastante adecuado para el objetivo.

Exactamente, eso esperas. Según mis cálculos, los procesos que tienen lugar en distintos momentos del mercado difieren, digamos, muchas veces. No son los porcentajes que esperas. Se trata de comparar procesos que ocurren en un momento dado con un proceso de otro momento, de donde proceden la estacionariedad y la adecuación de los métodos. Los reflejos de esta no estacionariedad pueden verse en los cambios de volatilidad (tanto cíclicos como esporádicos), pero ni siquiera eso es completo.

Aquí parece que mucha gente ha leído la conferencia de Shiryaev sobre la obra de Pastukhov y parece que cuando el contador dice que "la volatilidad en sí misma es volátil" debe quedar claro que no todo es sencillo y que debemos mirar con cuidado lo que hacemos. Pero no, una vez más vemos otro intento de sacar al mercado algunas fórmulas.

En resumen, haz lo que quieras, es tu tiempo y tus pérdidas. Por supuesto, si disfrutas del proceso de estudio de los números, eso es otra cosa, sólo queda la diversión del pasatiempo.

 
HideYourRichess:

Exactamente, eso esperas. Según mis cálculos, los procesos que tienen lugar en distintos momentos del mercado difieren, digamos, muchas veces. No en los porcentajes que usted espera.

En primer lugar, lo entendemos. La no estacionalidad es un hecho que hay que aguantar, en el peor de los casos desprendiéndose de tu dinero de sangre.

En segundo lugar, al discretizar por 5 cuantiles, hacemos más gruesas las series de datos y el ruido se absorbe, al menos parcialmente, dentro de los rangos de los cuantiles. La función de densidad se vuelve uniforme.

Razón de la queja: