Discusión sobre el artículo "Análisis regresivo de la influencia de datos macroeconómicos en el cambio de precio de las divisas" - página 2

 
Salavat:

Hasta ahora no se han encontrado otros enfoques....

Ahí es donde te equivocas.
 
De acuerdo. No voy a discutir, voy a reformularlo: Entre las muchas alternativas, propongo prestar atención a tal método esbozado en el artículo como prometedor
 
Salavat:
De acuerdo. No voy a discutir, voy a reformularlo: De las muchas alternativas, sugiero que el método esbozado en el artículo también se considere prometedor

La herramienta que ha esbozado puede resultar indudablemente útil en las siguientes circunstancias.

1. En trabajos sobre la construcción de una CT con un gran número de variables independientes, varias decenas o centenares, el enfoque que usted ha esbozado será útil para marcar algunas direcciones de búsqueda. Si estas direcciones formales se emparejan con razonamientos sustantivos sobre la influencia de la variable independiente en la variable dependiente y sobre la influencia mutua de las variables independientes, está bien.

2. 2. La herramienta que propones como paso previo a un conjunto más amplio de herramientas. La cuestión es que STATISTICS, que yo recuerde, es un conjunto de herramientas muy limitado y no está actualizado. Una vez dado este primer paso hacia el análisis de la significación de las variables para la variable objetivo, será natural pasar a un conjunto más amplio de herramientas, como las que ofrece el shell caret en R.

 
Mucho más cuestionable es la fuente de los datos. ¿Qué publicación de indicadores macroeconómicos se ha utilizado? A menudo, estos datos no están marcados con la fecha de publicación, sino con la fecha del final del periodo al que se refieren. Por lo tanto, si se utiliza, por ejemplo, una serie del PIB que no es de la primera publicación, se puede mirar fácilmente seis meses en el futuro (por no hablar de la revisión de los métodos de cálculo y el redibujado de décadas de historia, como ocurrió recientemente con el PIB de EE.UU.).
 

El artículo es interesante. Gracias. Pero es más bien una guía para utilizar las estadísticas. Y hay muchos conceptos erróneos en él.

  1. Predecir (y esta palabra aparece en el encabezamiento Ecuación de regresión y previsión final) para 5 días utilizando indicadores macroeconómicos es una tontería. Los indicadores macroeconómicos se publican mensual y trimestralmente y luego se ajustan a lo largo de varios meses. Además, los indicadores macroeconómicos tienen mucho ruido incluso en intervalos trimestrales y anuales, por no hablar de los intervalos diarios.
  2. El artículo apenas explica cómo se eligieron estos indicadores macroeconómicos. Simplemente toma los 99 más populares que se mencionan a menudo en las noticias. Casi todos ellos son incapaces de predecir el mercado, ya que son rezagados, no adelantados. Incluso si tomas los Pedidos de Fábrica o los Permisos de Construcción, aunque se consideran líderes, en realidad no lo son, porque incluyen indicadores constitutivos que ya se anunciaron hace un par de meses y a los que el mercado ya ha reaccionado. Te contaré un secreto gratis: busca indicadores de Consumo diferentes que no tengas en tu lista de datos. Son realmente líderes. Al bajar el Consumo, bajaron los Pedidos de Fábrica y los Permisos de Construcción, y con ellos el PIB y el mercado. Así que todo comienza con el consumo. Esto está incluso bien descrito en El Capital de Marx.
  3. El análisis de regresión es incluso muy aplicable a los modelos económicos. faa1947 utiliza algunos dogmas en lugar de entrar en la esencia del método matemático. El problema no está en el método, sino en los datos y su preparación. Los datos deben ser estacionarios, no importa si se trata de una regresión o de un "proceso controlado". Los datos económicos son no estacionarios en su forma original. Pero pueden transformarse fácilmente en datos estacionarios, por ejemplo mediante diferenciación y normalización.
  4. El problema de la regresión es que cualquier otra serie, incluso completamente ajena a la modelizada, puede insertarse en cualquier serie modelizada, si tales series de entrada se eligen en número suficiente. Por ejemplo, las fluctuaciones de la temperatura del aire en Alaska, los datos sobre la contaminación atmosférica en Los Ángeles, etc. pueden incorporarse con éxito a los precios de las divisas. El error de regresión puede reducirse a cero incluyendo esos "datos extraños". La precisión de la previsión también será cero. Por lo tanto, hay que saber elegir los datos adecuados, en qué cantidad y con qué retraso.
  5. También es útil conocer el mecanismo de funcionamiento de las empresas. Por ejemplo, a todo el mundo le gusta citar la tasa de desempleo. Consideran que esta tasa es un barómetro de la economía. Pero en realidad, una vez que la Tasa de Paro ha subido, es demasiado tarde para reaccionar, pues la economía ya está en declive y lo ha estado durante mucho tiempo. El problema de la UR es que incluye a todos los mayores de 16 años. Hay docenas de tasas de desempleo diferentes para distintos segmentos de la población y distintas ocupaciones. He aquí una pregunta para el relleno: si las empresas ven una disminución de la demanda de sus productos, ¿a quién despiden primero? Y la segunda pregunta es: ¿qué empresas son las primeras en sentir una caída de la demanda?
 
gpwr:

El artículo es interesante. Gracias. Pero es más bien una guía para utilizar las estadísticas. Y hay muchos conceptos erróneos en él.

  1. Predecir (y esta palabra aparece en el encabezamiento Ecuación de regresión y previsión final) para 5 días utilizando indicadores macroeconómicos es una tontería. Los indicadores macroeconómicos se publican mensual y trimestralmente y luego se ajustan a lo largo de varios meses. Además, los indicadores macroeconómicos tienen mucho ruido incluso en intervalos trimestrales y anuales, por no hablar de los intervalos diarios.
  2. El artículo apenas explica cómo se eligieron estos indicadores macroeconómicos. Simplemente toma los 99 más populares que se mencionan a menudo en las noticias. Casi todos ellos son incapaces de predecir el mercado, ya que son rezagados, no adelantados. Incluso si tomas los Pedidos de Fábrica o los Permisos de Construcción, aunque se consideran líderes, en realidad no lo son, porque incluyen indicadores constitutivos que ya se anunciaron hace un par de meses y a los que el mercado ya ha reaccionado. Te contaré un secreto gratis: busca indicadores de Consumo diferentes que no tengas en tu lista de datos. Son realmente líderes. Al bajar el Consumo, bajaron los Pedidos de Fábrica y los Permisos de Construcción, y con ellos el PIB y el mercado. Así que todo comienza con el consumo. Esto está incluso bien descrito en El Capital de Marx.
  3. El análisis de regresión es incluso muy aplicable a los modelos económicos. faa1947 utiliza algunos dogmas en lugar de entrar en la esencia del método matemático. El problema no está en el método, sino en los datos y su preparación. Los datos deben ser estacionarios, no importa si se trata de una regresión o de un "proceso controlado". Los datos económicos son no estacionarios en su forma original. Pero pueden transformarse fácilmente en datos estacionarios, por ejemplo mediante diferenciación y normalización.
  4. El problema de la regresión es que cualquier otra serie, incluso completamente ajena a la modelizada, puede insertarse en cualquier serie modelizada, si tales series de entrada se eligen en número suficiente. Por ejemplo, las fluctuaciones de la temperatura del aire en Alaska, los datos sobre la contaminación atmosférica en Los Ángeles, etc. pueden incorporarse con éxito a los precios de las divisas. El error de regresión puede reducirse a cero incluyendo esos "datos extraños". La precisión de la previsión también será cero. Por lo tanto, hay que saber elegir los datos adecuados, en qué cantidad y con qué retraso.
  5. También es útil conocer el mecanismo de funcionamiento de las empresas. Por ejemplo, a todo el mundo le gusta citar la tasa de desempleo. Consideran que esta tasa es un barómetro de la economía. Pero en realidad, una vez que la Tasa de Paro ha subido, es demasiado tarde para reaccionar, pues la economía ya está en declive y lo ha estado durante mucho tiempo. El problema de la UR es que incluye a todos los mayores de 16 años. Hay docenas de tasas de desempleo diferentes para distintos segmentos de la población y distintas ocupaciones. He aquí una pregunta para el relleno: si las empresas ven una disminución de la demanda de sus productos, ¿a quién despiden primero? Y una segunda pregunta: ¿qué empresas son las primeras en sentir una caída de la demanda?

No he expuesto completamente mi punto de vista e intentaré compensarlo brevemente a continuación, tal vez repitiéndome.

1. El problema de la selección de los datos iniciales - predictores - es fundamental, está mal formalizado y tiende más al arte que a la ciencia. No olvidemos uno de los postulados básicos de la estadística: "Basura dentro - basura fuera".

2. Como he escrito más arriba, más de la mitad del tiempo que se dedica a construir un modelo se emplea en seleccionar y justificar la lista y el tipo de datos iniciales. Además, lo más importante es la interpretación significativa de los datos iniciales, no sus características formales y estadísticas. Matapparatus es un medio auxiliar para la selección significativa de los datos iniciales.

3. De acuerdo con la literatura, distingo entre dos tipos de previsión: una previsión, la otra predicción.

4. Previsión: tomamos la historia y la extrapolamos al futuro unos pasos por delante. Clásico: tomamos el mach y lo extrapolamos hacia delante. El principal problema es que el error se acumula a medida que aumenta el número de pasos hacia adelante, ya que el siguiente valor se basa en el anterior

5. Predicción: obtenemos el conjunto actual de datos de entrada y predecimos el futuro sin ninguna prehistoria. No se utiliza el valor anterior, es decir, si predecimos +5, no necesitamos los 4 valores anteriores para ello, a diferencia de la predicción.

5. Además de los datos iniciales es muy importante QUÉ PREDECIMOS. Cuando hacemos trading, tenemos dos tipos de órdenes (con opciones) de compra y venta. Por alguna razón predecimos el valor del precio futuro mediante regresiones y concluimos "comprar y vender" a partir de este valor del precio. Y si tenemos en cuenta el error y construimos la decisión "compra-venta" teniendo en cuenta el intervalo de confianza, rápidamente queda claro que es imposible tomar una decisión. De ello se desprende: MODELOS REGRESIONALES PROGNÓSTICOS DE SIGNIFICANCIA - INREPRESENTABLES.

6. Hay que predecir la dirección de la tendencia, que coincide con las órdenes de los sistemas de negociación. Esto se hace mediante modelos de clasificación capaces de predecir valores: "largo-corto" o "largo-lado-corto", o algo más cualitativo, pero no cuantitativo, como por ejemplo: el valor futuro del par = 1,3500.

7. Para construir modelos de clasificación, este artículo puede ser muy útil.

 
gpwr:

El artículo es interesante. Gracias. Pero es más bien una guía para utilizar las estadísticas. Y contiene muchos conceptos erróneos.

Bienvenido de nuevo al sitio. ;-) Espero que por mucho tiempo. Por fin habrá algo útil e informativo que leer.
 

He aquí un ejemplo de mi modelo de regresión para predecir el S&P500. La línea negra es el índice histórico, la línea azul horizontal continua es la media trimestral y la línea de puntos son las predicciones. Las predicciones están en trimestres. La precisión de las predicciones no es muy grande, pero es suficiente para predecir el carácter de los movimientos: a la baja, al alza, planos. El modelo predice que el mercado bajará en los 3,5 meses restantes de este año o, en el mejor de los casos, será plano. Utilizo estas predicciones sólo para salir del mercado a tiempo.

 

Pregunta o petición al autor - en el modelo obtenido, por favor vaya a la pestaña Avanzado en los resultados y haga clic en el botón Correlaciones Parciales.

Publique aquí, si no es difícil, el valor de los coeficientes PC para cada uno de los factores del modelo.

 
Demi:

Pregunta o petición al autor - en el modelo obtenido, por favor, vaya a la pestaña Avanzado en los resultados y haga clic en el botón Correlaciones Parciales.

Publique aquí, si no es difícil, el valor de los coeficientes PC para cada uno de los factores del modelo.

todas las operaciones que puede hacer usted mismo, el archivo con los datos preparados se adjunta al artículo en el archivo calendar_2010-2011_usd_out. zip .


b*in Cor. parcial Semiparcial Cor. Tolerancia R-cuadrado t(357) Valor p
Variación del precio durante 1 día 0.3500049 0.3883344 0.3045530 0.7571426 0.2428574 7.9622506 0.0000000
variación de precios en 10 días 0.3271369 0.3623699 0.2809839 0.7377407 0.2622593 7.3460567 0.0000000
USD Ventas de viviendas existentes (intermensual) 0.4499016 0.2746573 0.2064353 0.2105391 0.7894609 5.3970552 0.0000001
USD Solicitudes de hipotecas MBA -0.1070692 -0.1315908 -0.0959356 0.8028431 0.1971569 -2.5081463 0.0125795
USD Índice del coste del empleo 1.1924082 0.3459071 0.2664363 0.0499272 0.9500728 6.9657258 0.0000000
USD NAPM-Milwaukee 0.4918679 0.3281278 0.2510388 0.2604862 0.7395138 6.5631723 0.0000000
USD Ventas de viviendas existentes -0.6131716 -0.3510242 -0.2709271 0.1952275 0.8047725 -7.0831333 0.0000000
USD Tasa de desempleo -0.2303595 -0.1174173 -0.0854492 0.1375953 0.8624047 -2.2339883 0.0261025
USD ISM manufacturero 0.4683029 0.2807841 0.2114298 0.2038349 0.7961651 5.5276311 0.0000001
USD Pedidos de bienes de equipo no destinados a defensa, excluida la aviación -1.0522008 -0.3326872 -0.2549579 0.0587137 0.9412863 -6.6656324 0.0000000
USD Bienes duraderos sin transporte 1.0195595 0.3332286 0.2554246 0.0627625 0.9372375 6.6778344 0.0000000
USD Índice de compra de viviendas (QoQ) -0.6493641 -0.3164098 -0.2410558 0.1378030 0.8621970 -6.3021765 0.0000000
USD Chicago Purchasing Manager -0.7364752 -0.2854029 -0.2152134 0.0853930 0.9146070 -5.6265502 0.0000000
USD Gasto en consumo personal básico (a/a) -0.5430761 -0.2067342 -0.1527068 0.0790670 0.9209330 -3.9923747 0.0000794