Predicción de mercado basada en indicadores macroeconómicos - página 2

 
Un tema interesante para la investigación. Pensando en este tema he llegado a la conclusión de la necesidad de analizar los datos macroeconómicos en dinámica - en mi opinión no es suficiente decir que las solicitudes de subsidio de desempleo han aumentado, ya que esto puede ser debido a las fluctuaciones estacionales y es de naturaleza a corto plazo - el mercado puede o no reaccionar y de nuevo dependiendo de la tendencia que prevalece en el mercado. Así que, ¿quizás se intente investigar la fuerza de los indicadores en términos de su capacidad para invertir una tendencia? Por ejemplo, tome un zigzag, o identifique los puntos de inversión y corrección de la tendencia en el gráfico y busque una inversión de los indicadores macroeconómicos en los tres días anteriores a la ruptura, y reúna un grupo de dichos indicadores para analizar lo que muestran estos indicadores y luego busque patrones. No todos los indicadores serán la razón del retroceso del mercado: el potencial, la tendencia del mercado y el indicador de los períodos anteriores son importantes, así como la totalidad de otros indicadores económicos.
 
-Aleks-:
Este es un objeto interesante para investigar. Reflexionando sobre este tema llegué a la conclusión de la necesidad de analizar los datos macroeconómicos de forma dinámica - en mi opinión no basta con decir que las solicitudes de subsidio de desempleo han aumentado ya que esto puede deberse a fluctuaciones estacionales y es a corto plazo - el mercado puede reaccionar o no dependiendo de la tendencia que prevalezca en el mercado. Así que, ¿quizás se intente investigar la fuerza de los indicadores en términos de su capacidad para invertir una tendencia? Por ejemplo, tome un zigzag, o identifique los puntos de inversión y corrección de la tendencia en el gráfico y busque una inversión de los indicadores macroeconómicos en los tres días anteriores a la ruptura, y reúna un grupo de dichos indicadores para analizar lo que muestran estos indicadores y luego busque patrones. No todos los indicadores serán la razón del retroceso del mercado: el potencial, la tendencia del mercado y el indicador de los períodos anteriores son importantes, así como la totalidad de otros indicadores económicos.

Es una idea muy interesante. Es decir, centrarse sólo en las rupturas de tendencia e identificar los indicadores clave que influyen en esas rupturas.

He estado pensando mucho en los valores atípicos. ¿Hay que ignorarlos o, por el contrario, hay que prestarles más atención? La teoría clásica de la regresión enseña a ignorarlos. Pero a veces me parece que las pequeñas fluctuaciones del precio en torno a una tendencia son un ruido, mientras que la regresión clásica le da la mayor importancia. Los giros bruscos en las tendencias (valores atípicos) son probablemente una señal más importante. Pero todos mis intentos de construir un modelo prestando más atención a los valores atípicos (por ejemplo, eligiendo u>1) condujeron a un mayor error cuadrático medio de predicción. Al suavizar los valores atípicos se redujo el error de predicción.

 
faa1947:

Por lo tanto, hay que mirar manualmente toda la lista de variables de entrada y decidir intuitivamente, o basándose en alguna otra consideración, que "es probable que esta variable de entrada afecte y esta otra no".

...Seleccionó manualmente alguna lista, luego filtró por un algoritmo y obtuvo la lista. Y el valor de tal lista es fundamental: los modelos que utilizan tal conjunto de entradas "influyentes" (utilizando 3 tipos diferentes de modelos) NO tienen la propiedad de sobreaprendizaje, que es la principal emboscada. La principal consecuencia de utilizar datos de entrada con "ruido" es el exceso de ajuste.


¿Se muestreó la parcela de la historia dentro de la muestra y se comprobó en la parcela fuera de la muestra? Si se muestrean los predictores en todo el gráfico y luego se calcula el error fuera de muestra en parte del mismo gráfico, eso es mirar hacia el futuro.
 
gpwr:
¿Ha hecho un muestreo en el gráfico de la historia dentro de la muestra y ha comprobado el gráfico fuera de la muestra? Si se seleccionan los predictores en todo el gráfico y luego se calcula el error fuera de la muestra en parte del mismo gráfico, eso es mirar hacia el futuro.

Aún más difícil.

Siguiendo el hilo con gran interés.

Teniendo en cuenta el post de -Aleks-, no está claro qué vas a predecir: ¿dirección o magnitud? Si es de "dirección", se trata de modelos de clasificación, y si es de "magnitud", se trata de modelos de regresión, y tienen problemas con diferentes ARIMA y ARCH. La desviación con diferenciación no resuelve el problema por completo, para todos en macroeconomía la estacionalidad se confunde....

La idea de-Aleks- para la selección de predictores es muy interesante. En general, en la primera etapa haría dos pasos preliminares:

1. seleccionar por-Aleks- algún conjunto bastante amplio de variables independientes.

2. Se construye una regresión y se descartan todas las variables que tienen coeficientes insignificantes.

El último paso no es nada fácil. Todo es como escribí siempre que no haya correlación entre las variables independientes. Y siempre hay una correlación superior a 0,7 y la lista de predictores descartados depende del orden en que se haga.

Después se puede mirar y decidir qué hacer a continuación.

 
avtomat:

El requisito de estacionariedad es muy estricto y totalmente injustificado.

.

Y los modelos "no estacionarios" funcionan bien ;)

gpwr:
Se puede decir lo mismo de cualquier modelo, no sólo de regresión, sino también de modelos neuronales, ARMA y otros. Si no hay relación entre las entradas y las salidas, cualquier modelo generará una predicción, pero inexacta.
Algún consejo sobre por dónde empezar para entender la estacionariedad, ARMA, modelos neuronales. Llevo mucho tiempo queriendo explorar esta dirección. Muchas fuentes y es difícil entenderlo todo desde cero.
 
faa1947:

Una cantidad grande o pequeña de datos de entrada es todo relativo.

A mi modo de ver, hay que revisar los datos uno por uno, identificar los relevantes y luego utilizarlos en tu EA. Sólo si se empieza a optimizar los valores de los datos es posible que se produzcan aciertos aleatorios. Por lo tanto, probablemente, el rango de enumeración en la optimización debe ser abordado con mucho cuidado.
 
gpwr:

Es una idea muy interesante. Es decir, centrarse sólo en las rupturas de tendencia e identificar los indicadores clave que influyen en esas rupturas.

He estado pensando mucho en los valores atípicos. Hay que ignorarlos o, por el contrario, prestarles más atención. La teoría clásica de la regresión enseña a ignorarlos. Pero a veces me parece que las pequeñas fluctuaciones del precio en torno a una tendencia son un ruido, mientras que la regresión clásica les da la mayor importancia. Los giros bruscos en las tendencias (valores atípicos) son probablemente una señal más importante. Pero todos mis intentos de construir un modelo prestando más atención a los valores atípicos (por ejemplo, eligiendo u>1) condujeron a un mayor error cuadrático medio de predicción. Al suavizar los valores atípicos se redujo el error de predicción.

Profundizando en la idea, deberíamos dividir los diferentes indicadores por la frecuencia de su publicación - probablemente cuanto más raro sea el indicador que se publica, más tiempo tendrá un impacto en el mercado - esto necesita ser probado. Personalmente, me resulta más fácil percibir la información visualmente y en la dinámica de cambio en el tiempo - es necesario transferir los indicadores por conveniencia a MT en forma de gráfico (mi sueño), pero estos indicadores deben estar sincronizados - digamos que las noticias se publican una vez al mes, entonces ¿qué pasa con los marcos de tiempo inferiores? Como opción - rellenarlas con barras de un indicador a otro según una función lineal - así veremos claramente el vector de movimiento en MT. Conociendo el vector, podemos analizar el vector de movimiento y su cambio - el momento de la ruptura con respecto a la ruptura del vector del precio del símbolo por el zig-zag.
Así, podemos considerar el desfase - y calcular la desviación porcentual de la ruptura del precio cuando el indicador económico sale. Todavía hay algunas ideas, pero la obviedad de su uso se puede entender en el momento.
En general, muchos datos económicos son relativos al mes o al año anterior, lo que también debe tenerse en cuenta en la representación gráfica...
Otra idea - probablemente no son los datos en sí los que influyen en el cambio de tendencia, sino su desviación de los datos esperados o de la dinámica pasada - aquí también se puede comprobar - comparando la dinámica pasada del movimiento del índice con su cambio (cambio fuerte a lo largo del vector o en contra - por lo menos usando SMA) y mirar el cambio del vector del movimiento del precio con un retraso.
No estoy seguro de que todo este trabajo pueda ser realizado por una sola persona - se necesita un plan de acción claro y una metodología de análisis de los resultados intermedios - puede ser el trabajo de toda una vida, que responderá a la pregunta de cómo se influyó en el comportamiento económico del mercado en el pasado... Sin embargo, la metodología desarrollada le permitirá buscar patrones en los movimientos actuales del mercado.
 
-Aleks-:
Desarrollando la idea, deberíamos dividir los diferentes indicadores por la frecuencia de su publicación - probablemente cuanto más raro sea el indicador, más tiempo tendrá un impacto en el mercado

No. Los más influyentes para los EE.UU. son lostipos porcentuales de la UR y dela reunión del FOMC. Son mensuales.

Si los datos del desempleo se formalizan, las actas de las reuniones de la Fed no pueden formalizarse en absoluto.

De lo contrario, sería como dos dedos...

 

Para este número de variables, 65 observaciones son muy pocas.

Al menos i*10 observaciones + 15-20% para una prueba de avance.

 
Demi:

No. Los más influyentes para los EE.UU. son lostipos porcentuales de la UR y dela reunión del FOMC. Son mensuales.

Si los datos del desempleo se formalizan, las actas de las reuniones de la Fed no pueden formalizarse en absoluto.

De lo contrario, sería como dos dedos...

Estas actas contienen datos económicos, entiendo que se pueden obtener. Si no es así, hay que estimar estas reuniones de tres maneras - +1/-1/0 - la información para la estimación se puede tomar de los medios de comunicación como una opción.
Razón de la queja: