Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 72

 
Mathemat:

Exacto, eso es exactamente así. El ACF es inútil.

La información mutua, sin embargo, debe ser, ya que no hay olor a cero, incluso a una distancia de cientos de bares.



Por favor, envíeme sus resultados: cómo los ha calculado, qué datos ha utilizado, etc.
 
Avals:

Necesito que me envíes los resultados: cómo lo has calculado, qué datos has utilizado, etc.

No he contado las tomas de contacto. Tengo otras cosas - estadísticas. El criterio de chi-cuadrado de la relación entre series de datos. Lo publicaré más tarde. Tendré que aclararlo para que quede claro.

De hecho, esto es muy parecido a lo que hace el homónimo. Incluso las fórmulas son muy similares allí.

 
alexeymosc:

El máximo puede ser de 2.098 bits. Se trata de la información media de esta serie de datos en particular. Si, por ejemplo, una barra en el lag 1 determina completamente una barra cero, su información mutua será de 2,098 bits.

¿Qué tipo de número es ese? Es una medida de información ) Hay que leer artículos sobre TI. En resumen, los bits reflejan una medida de la aleatoriedad de los valores de la fuente de datos según la fórmula de la información propia de un valor concreto

I(X) = - log(P(x))*P(x).

Otro ejemplo. Lanzamos una moneda y contamos la información mutua entre dos eventos consecutivos. Por fórmulas que he traducido en mi artículo obtenemos que la información mutua I(X;Y) = 0. Y si una tirada de cruz indica precisamente una tirada de cruz (o de cara) posterior, entonces I(X;Y) sería 1 - esta es la información media de la fuente de datos de la "moneda justa".

Alexey! Yo también utilizo la información mutua para seleccionar entradas significativas para una red neuronal. Suelo obtener modelos con una previsibilidad del 52 al 54%. Me parece que se obtendrán resultados dignos cuando la información mutua sea > 0,1 bits. En el caso de la volatilidad, es posible encontrar tales aportaciones significativas.

 
VNG: Quién se pone en el cinco no lo sé. Sin embargo, veo que se tropezó con un resultado muy interesante mientras investigaba y no lo vio.

Me doy cuenta de que mis mensajes en este hilo están al borde de la falta, casi del off-topic.

En el cinco, hrenfx.

Los posts están bien, muy dentro del tema. También sobre la aplicabilidad de TI al tema, aquí algunos tienen dudas.

- Que haya alguna invariabilidad cuando cambia la escala, lo siento, no lo entiendo. Entiendo la invariancia como la presencia de un factor de escala (en el caso general puede ser cualquier número o función), al multiplicarlo por el que obtenemos un nuevo patrón de escala diferente. Es decir, la transformación afín, que es una manifestación de la estructuración en el flujo caótico de datos. El problema se reduce entonces a encontrar dicho coeficiente. Cuando se encuentra un patrón, simplemente se multiplica por este coeficiente. Y dicha transformación funciona tanto "hacia arriba" como "hacia abajo". Y eso es todo.

Vale, que sea así. Estaba hablando demasiado de la fractalidad. Está ahí, pero no es perfecto. Más concretamente, la invariabilidad fractal no es perfecta.

- si se investiga la relación entre ambas cantidades.

- por qué esto es así, qué causa esta afirmación

Qué declaración - no entiendo.

- ¿Por qué a las dos, y no a las tres y cinco y media

- ¿Qué dos valores?

Aquí está más claro.

1. Dos porque tomamos una fuente condicional y un receptor condicional y tratamos de averiguar si hay alguna dependencia entre ellos.

Hacemos un abecedario (yo divido la distribución de los rendimientos en cuantiles, me resulta más cómodo; el homónimo lo hace un poco diferente, pero no afecta mucho al resultado), aplicamos TI. Hay algunas dudas sobre el canal de comunicación. Quizá el tiempo sea el canal de comunicación.

Si fijamos la diferencia entre barras (los números se calculan en MT4) igual a, por ejemplo, 238, entonces la fuente es la serie

return(Bars-1), return(Bars-2), ... return(238) (unos 80 000 valores a los 12 años de reloj)

El receptor es una serie de

return(Bars-1 - 238), return(Bars-2 - 238), ... return(0).

En definitiva, sólo una serie de retornos y lo mismo, desplazado respecto a sí mismo por 238.

Puedes calcular el ACF. Es casi seguro que será igual a cero o diferirá de él de forma estadísticamente insignificante. Pues sí, no hay relaciones lineales significativas entre estas series, todas triviales, sin peces.

Pero los alexianos no contamos los ACF, sino las dependencias no lineales, cualquier dependencia. Para eso está la distribución conjunta de estas dos cantidades. Lo tenemos. (Por cierto, también es necesario para calcular el ACF, algo que la gente suele pasar por alto).

El homónimo tomó inmediatamente el toro por los cuernos y contó la información mutua de estas dos series.

Evalué la prueba de chi-cuadrado de la relación entre las dos variables aleatorias.

Los resultados son muy similares.

- La distribución conjunta de las dos cantidades representa una superficie. ¿Qué, nos vamos a otro rayelnost?

Hace tiempo que estamos ahí, lo que pasa es que no todo el mundo se da cuenta.

Hasta ahora es sólo un proyecto de caña de pescar, no es un pez en absoluto.

 
IgorM:

La única manera de comprobar la eficiencia del mercado es comprobarlo uno mismo o de lo contrario se quedará en el plano de "créalo o no". No puedo decirlo mejor de lo que ya lo he hecho:

Ojalá me equivoque, pero tus "manchas mágicas" están más en mi cabeza, el TS por canales es muy parecido al TS por intuición, aquí tienes un pronóstico incumplido

Yo "retuerzo" los niveles con diferentes builds, los veo funcionando al 50/50 en el TS propuesto con resultados muy similares, sospecho que incluso si tomo una década de movimiento de precios, coincidirán en el historial o en el futuro cercano


Igor, no tiendo a idealizar a nadie ni a nada. Pero ya he dicho

- No son TSs, son modelos de movimientos de mercado. Tienes que construir tú mismo una ST basada en ellos.

- El autor siempre ha estado en contra de las previsiones. La esencia de su trabajo se expresa en una frase: rebote, vaya a la anterior, avance, vaya a la siguiente.

- Por lo que veo no es una predicción, sino un posible objetivo, en el que personalmente no me he centrado.

- Buscas defectos sin intentar llegar al fondo de lo que se propone. Entiendo tu escepticismo, pero has empezado con mal pie. Intenta primero entrar en las reglas y en la esencia de las construcciones. Para facilitarte las cosas, el canal de Vadim es la misma vela, pero sin relación con el TF.

El TAdv postula el desarrollo del movimiento según seis puntos de control. El canal son los puntos 1 y 2 del Tadp. El balanceo es los puntos 1,2,3 de Tadv. Tenga en cuenta que ni Jan, que es uno de los autores de TAdv, ni Vadim, el autor de V-Channels y V-Swings, prueban y convencen a nadie de nada, aparecen aquí sólo en casos estrictamente definidos y no piden nada a nadie, no hacen publicidad de nada. No se burlan y se comportan correctamente. ¿No es un indicador de convicción y fuerza interior? Simplemente ayudan de forma desinteresada y comparten sus avances. TAdv se presentó hace más de 10 años, VKanals y Vsvings, temo mentir, algo así como 7, han sido probados por el tiempo y tienen muchos seguidores. La única manera de comprobar la eficacia es profundizar en ella y probarla para ver si funciona. O bien se quedará en el plano de "créalo o no".

Buena suerte.

 
VNG: Igor, no tiendo a idealizar a nadie ni a nada. Pero ya he dicho
hmm, la experiencia fue un éxito, mi post estuvo en el hilo durante unos 5 minutos, pero incluso consiguió enganchar, y no a los habituales del lugar
 
renegate:

Alexey! Yo también utilizo la información mutua para seleccionar entradas significativas para una red neuronal. Por lo general, obtengo modelos con una previsibilidad de los rendimientos del 52 al 54%. Me parece que se obtienen buenos resultados cuando la información mutua es > 0,1 bits. En el caso de la volatilidad, es posible encontrar tales aportaciones significativas.

Me alegra ver que entra alguien que también ha aprendido a aplicar TI al problema de la selección de variables significativas.

Sólo que sus consejos son un poco incompletos o algo así. El hecho es que la información media de una fuente de datos puede ser diferente. El umbral de información mutua significativa también dependerá de ello. ¿Cuál es su flujo de información medio H(X)?

 
Mathemat:

En un cinco - hrenfx.

Los puestos están bien, bastante al punto. Además de la aplicabilidad de TI al tema, algunos tienen dudas al respecto.

Muy bien, que así sea, con la fractalidad me excedí. Lo hay, pero no es lo ideal. Más concretamente, la invariabilidad fractal no es ideal.

Qué declaración - no entiendo.

Aquí está más claro.

1. Dos porque tomamos una fuente condicional y un receptor condicional y tratamos de averiguar si hay alguna dependencia entre ellos.

Hacemos un abecedario (yo divido la distribución de los rendimientos en cuantiles, me resulta más cómodo; mi tocayo lo hace un poco diferente, pero no afecta mucho al resultado), aplicamos TI. Hay algunas dudas sobre el canal de comunicación. Quizá el tiempo sea el canal de comunicación.

Si fijamos la diferencia entre las barras (los números se calculan en MT4) en, digamos, 238, - entonces la fuente es la serie

return(Bars-1), return(Bars-2), ... return(238) (unos 80 000 valores en 12 años)

El receptor es una serie

return(Bars-1 - 238), return(Bars-2 - 238), ... return(0).

En definitiva, sólo una serie de retornos y lo mismo, desplazado respecto a sí mismo por 238.

Es posible calcular el ACF. Es casi seguro que será igual a cero o diferirá de él de forma estadísticamente insignificante. Pues sí, no hay relaciones lineales significativas entre estas series, todas triviales, sin peces.

Pero los alexianos no contamos los ACF, sino las dependencias no lineales, cualquier dependencia. Para eso está la distribución conjunta de estas dos cantidades. Lo tenemos. (Por cierto, también es necesario para calcular el ACF, sólo que no todo el mundo lo entiende).

Tezka tomó inmediatamente el toro por los cuernos y calculó la información mutua de estas dos series.

Evalué una prueba de chi-cuadrado de la relación entre dos variables aleatorias.

Los resultados son muy similares.

Sí, hemos estado ahí durante mucho tiempo, pero no todo el mundo lo entiende.

Todo esto y hasta ahora sólo hay una barra de tiro, no es un pez en absoluto.


Gracias Alexey, ahora todo está claro.

En el contexto de este problema, las características del canal de comunicación son absolutamente irrelevantes, se contabilizarán automáticamente a través de la entropía de la información.

 
IgorM:
Hmmm, la experiencia fue un éxito, mi post estuvo en el hilo durante unos 5 minutos, pero incluso fue bloqueado, y no por los habituales del lugar

¿Cuál fue la experiencia?
 
Mathemat:


Pero nosotros, Alexei, no contamos los ACF, sino las dependencias no lineales, cualquier dependencia. Para eso está la distribución conjunta de las dos cantidades. Lo tenemos. (Por cierto, también es necesario para calcular el ACF.

Bien dicho. Nosotros, Alexei, estamos a favor de la ineficiencia del mercado. Y ya tenemos resultados prácticos que lo demuestran, pero que no son visibles a través del prisma del enfoque estadístico-econométrico clásico.

Razón de la queja: