Estadística de la dependencia entre comillas (teoría de la información, correlación y otros métodos de selección de características) - página 3

 
alexeymosc:

He intentado buscar correlaciones en las cotizaciones de un instrumento financiero utilizando métodos estadísticos. Para empezar, tomé el índice industrial Dow Jones, datos diarios, y transformé la serie en una serie de incrementos porcentuales.

Los incrementos son heteroscedásticos. Si quiere pronosticar la dirección del movimiento de los precios, debe tenerlo en cuenta.

Para predecir la volatilidad, es mejor utilizar modelos más específicos en lugar de NS.

 

Respuesta faa1947:

"Sobre la "linealidad" y la "no linealidad" yo también sería cauto, ya que esta cuestión puede y debe plantearse en el marco del modelo con el que se aproxima la serie temporal. Analizando los coeficientes de este modelo se puede concluir que estos coeficientes son: constantes (o casi constantes), funciones deterministas o funciones estocásticas. Se trata de un proceso perfectamente concreto y constructivo de análisis del tipo de dependencias. ¿Y qué hay de constructivo en descubrir esta dependencia de la información? Y de nuevo, ¿cómo lo ves en la serie temporal original?"


Podría hacer un enlace al componente económico también, pero lo siento, sólo hay que leer las respuestas a mi primer post en el hilo, se trata sólo de eso: la volatilidad intradía es cíclica. Y la información mutua lo ha demostrado. En el caso de los marcos temporales diarios y superiores, la situación es totalmente diferente, ya que no hay ciclos evidentes.

¿Cómo se ve en la serie inicial? Nada más fácil, mira el historial de al menos medio año en las barras horarias y observa si hay diferencia en la volatilidad (en el tamaño de las velas) por tiempo. Y en cuanto a las barras diarias, personalmente no he encontrado ningún ciclo natural ni ninguna otra lógica cotidiana o económica. Es sólo una estructura de dependencia interna en los precios.

Y todavía no estoy aproximando las series temporales, sino que estoy extrayendo datos de los precios que me permiten ver los precios conocidos desde un ángulo ligeramente diferente. Aquí se ve la falta de dependencias en los incrementos, y veo que estás utilizando la autocorrelación. Eso me dice mucho. Ahí no hay dependencia lineal ni nunca la hubo, y no es necesario mostrar constantemente autocorrelogramas, yo mismo tuve bastantes durante mucho tiempo ya, y eran los mismos que los tuyos. )

 
anonymous:

Los incrementos son heteroscedásticos. Si quiere predecir la dirección del movimiento de los precios, debe tenerlo en cuenta necesariamente.

Para predecir la volatilidad, es mejor utilizar modelos más específicos en lugar de NS.


¿Y qué modelos son más específicos para el mercado de divisas que, por ejemplo, para el mercado de valores? Sólo me interesa su opinión. Hay muchos modelos en el mundo.
 
alexeymosc:

¿Y qué modelos son más específicos para el mercado de divisas que, por ejemplo, para el mercado de valores? Sólo me interesa su opinión. Hay muchos modelos en el mundo.

No me refería a los modelos específicos del forex (hay muchos, sobre todo para los derivados: https://en.wikipedia.org/wiki/Vanna_Volga), sino a los modelos específicos de la volatilidad (hay muchos, además del ARCH).

NS no es un enfoque específico de Forex, porque se utiliza en todas partes (o incluso al revés: donde da pereza construir modelos normales y se dispone de muchos recursos informáticos, se utiliza allí).

Los enfoques para predecir la volatilidad y la dirección de los precios deberían ser diferentes. Para la primera no se debe utilizar NS (complicación poco razonable), para la segunda se puede intentar.

 

faa1947, por favor, ten más cuidado con la disposición de tus mensajes. A veces no se puede separar inmediatamente lo que se cita de su respuesta.

Ahora vamos al grano:

faa1947: Как мне кажется, увеличение объема выборки представляет интерес только в рамках предельной теоремы о сходимости по вероятности к нормальному закону. Хочу Вас разочаровать, что если мы не ставим перед собой такой задачи, то простое увеличение выборки ничего не дает. Ниже привожу увеличение выборки в 10 раз.

Dedo en el cielo, lo siento. ¿De qué normalidad en el límite estás hablando? ¿Normalidad de qué? ¿La distribución de los rendimientos? En este momento esta hipótesis no me parece ni caliente ni fría. No necesito ninguna hipótesis sobre la distribución de los rendimientos y a qué ley tienden.

Personalmente, tengo el siguiente requisito en mi reloj: como pretendía utilizar el criterio de chi-cuadrado de independencia de variables aleatorias (así lo quería), el tamaño de la muestra debía ser tal que se garantizara que cualquier frecuencia de un evento conjunto fuera al menos 5. Esta restricción también debe ser conocida por usted. Por eso salió una muestra tan débil en los relojes.

Pero así soy yo. No sé por qué alexeymosc utilizó una muestra tan grande como la suya. Pero puedo adivinar: probablemente quería establecer un patrón para toda la serie y no para una parte de ella.

faa1947: Yo más bien vigilaría lo de la "linealidad" y la "no linealidad", porque esta cuestión puede y debe ponerse en el marco de un modelo, por el que se aproximan las series temporales. Analizando los coeficientes de este modelo se puede concluir que estos coeficientes son: constantes (o casi constantes), funciones deterministas o funciones estocásticas. Se trata de un proceso perfectamente concreto y constructivo de análisis del tipo de dependencias.

Todavía no hay modelos. Sólo la minería de datos con métodos estadísticos no paramétricos.

Estoy seguro de que se trata precisamente de una relación no lineal: no hay ninguna relación lineal significativa detectable por la correlación de Pearson a rezagos superiores a 10. Tú mismo lo sabes. Pero también se encuentran relaciones con rezagos muchomayores. Así que no son lineales.

faa1947: ¿Y qué hay de constructivo en la detección de esta dependencia informativa? Y de nuevo, ¿cómo lo ves en la serie temporal original?

No es fácil de ver, aquí estoy de acuerdo contigo. Sólo conocemos la cantidad media de información transmitida a la barra de cero desde una historia bastante lejana, y no conocemos el mecanismo de este "ataque informativo del pasado". Todavía tenemos que conseguir convertir esos bits desnudos en una herramienta de previsión. ¿Quién dijo que sería fácil?

Los incrementos son heteroscedásticos. Si quiere pronosticar la dirección del movimiento del precio, debe tenerlo en cuenta necesariamente.

Soy un gran ignorante de los modelos econométricos modernos, incluyendo el ARCH y la familia relacionada. ¿Puede explicar con los dedos por qué hay que tener esto en cuenta en una etapa en la que no se construyen modelos de comportamiento incremental? No hay modelos, sólo una aplicación contundente de la teoría de la información. Gracias.

 
anonymous:

No me refería a los modelos específicos del forex (hay muchos, sobre todo para los derivados: https://en.wikipedia.org/wiki/Vanna_Volga), sino a los modelos específicos de la volatilidad (hay muchos, además del ARCH).

El NS no es un enfoque específico de Forex, porque se utiliza en todas partes (o incluso al revés: donde da pereza construir modelos normales y se dispone de muchos recursos informáticos, se utiliza allí).

Los enfoques para predecir la volatilidad y la dirección de los precios deberían ser diferentes. Para la primera no es necesario usar NS (complicación poco razonable), para la segunda puedes probar.


En principio estoy de acuerdo con lo de NS, aunque el método en sí no es tan sencillo. También hay muchas convenciones, que es deseable y a veces obligatorio seguir (desde el preprocesamiento de datos y la selección de variables relevantes, hasta la construcción de redes). Y en general, hay personas a las que les gusta aplicar los conocimientos que conocen a los fenómenos estudiados, y hay quienes se ponen a estudiar desde cero, y los últimos probablemente prefieran la NS. EN MI OPINIÓN.

Pero no voy a predecir la volatilidad, siempre trato de predecir la dirección del movimiento de los precios. En este problema utilizo NS.

 
alexeymosc:

Respuesta faa1947:


...la volatilidad intradía es cíclica. Y la información mutua lo ha demostrado.

Su información mutua no me mostró nada. Debe asegurarse de que no hay componentes deterministas en el PA antes de realizar el procesamiento de las estadísticas. Si están presentes en la BP, "marcarán" las estadísticas y no se podrá confiar en todas las encuestas. Tengo que decepcionarte porque la definición de volatilidad por parte de BP inicial es errónea. Consigo construir modelos con los siguientes parámetros: 44 pips de volatilidad y su fluctuación más menos dos pips, es decir, puedo considerarlo constante. La volatilidad que queda para el análisis depende en gran medida del modelo aplicado.

Y todavía no aproximo las series temporales, sino que extraigo datos de los precios que me permiten observar los precios habituales desde un ángulo ligeramente diferente. Aquí se ve la falta de dependencias en los incrementos

Humo delante de la locomotora. En realidad, a nivel de libro de texto, se define el orden del análisis de BP: estacionario/no estacionario - para el no estacionario la elección del método de transformación es estacionario. Seguramente este primer paso implicará la eliminación de la tendencia. A continuación, veamos.

 

No entiendo lo que estás haciendo aquí. Decidí refrescar mis conocimientos sobre la Teoría de la Información (TI) y la busqué en el glosario de términos:

TI considera la noción de "información" únicamente desde el punto de vista cuantitativo, sin hacer referencia a su valor o incluso a su significado. Con este enfoque, una página de texto mecanografiado contiene como máximo siempre aproximadamente la misma cantidad de información, determinada únicamente por el número de caracteres y espacios (es decir, caracteres) de la página y sin depender de lo que se imprima en ella, incluido el caso de un conjunto de caracteres sin sentido y caótico. Para modelar los sistemas de comunicación, este enfoque es válido, ya que están diseñados para transmitir información representada por cualquier conjunto de caracteres sin errores a través del canal de comunicación. En los casos en los que es esencial considerar el valor y el significado de la información, el enfoque cuantitativo no es aplicable. Esta circunstancia impone restricciones esenciales a los campos de aplicación posibles de la CT. No tenerlo en cuenta condujo en las primeras fases de desarrollo a una sobreestimación de la importancia aplicada.

A este respecto, tengo tres posibles respuestas:

1. Estás seguro de que el diccionario miente y en realidad no es así.

2. Se encuentra en las "primeras fases de desarrollo" y aún no ha realizado una evaluación de la "relevancia aplicada".

3. Tú eres algo más.

 
Mathemat:

Soy un gran ignorante de los modelos econométricos modernos...

Eso aclara mucho. En realidad, la econometría es una ciencia (subrayo lo de ciencia) que lleva estudiando las series temporales económicas desde hace al menos 100 años. La Sociedad de Econometristas de Estados Unidos se formó en los años 30. A juzgar por tus mensajes, esta es una ciencia que se te da bien. No estás solo en este foro y como nota al margen: según los desarrolladores de este sitio hay un error gramatical en la palabra "econometría" y sus derivados.

 
faa1947: Su información mutua no me mostró nada. Hay que asegurarse de que no hay componentes deterministas antes de hacer el tratamiento estadístico de BP.

De nuevo, 25, un pulgar en el cielo. El estudio no se hizo en relación con una serie de precios, sino con sus rendimientos. Esto es lo primero.

En segundo lugar, el preprocesamiento de datos como el que usted menciona viene determinado principalmente por los objetivos del análisis, no por los requisitos dogmáticos que se imponen al estudio sin tener en cuenta los objetivos.

Humo delante de la locomotora. En realidad, a nivel de libro de texto, se define el orden del análisis de BP: estacionario/no estacionario - para el no estacionario la elección del método de transformación es estacionario. Seguramente este primer paso implicará la eliminación de la tendencia. A continuación veremos.

Véase mi objeción anterior. Adecuar los métodos de investigación a sus objetivos. Y, por último, deja de murmurar tus conjuros sobre estacionariedad, destendimiento y otras cosas que son irrelevantes para el tema del estudio.

2 HideYourRichess: Hoy estoy un poco de vacaciones, así que tengo libertad temporal para decir lo que me parezca :) ¿Estamos teniendo un enfrentamiento religioso sobre lo que es la información?

2 faa1947:

En realidad, la econometría es una ciencia (subrayo lo de ciencia) que lleva estudiando las series temporales económicas desde hace al menos 100 años.

Bien, que sea una ciencia. Según recuerdo, la econometría es muy aficionada a imponer sus modelos a los datos financieros. No los impongo. Entonces no estoy haciendo econometría. ¿Alguna otra pregunta?

Razón de la queja: