Discussão do artigo "Análise de Regressão da Influência dos Dados Macroeconômicos sobre a Flutuação nos Preços da Moeda" - página 2

 
Salavat:

Até o momento, nenhuma outra abordagem foi encontrada....

É aí que você está tão errado.
 
Está bem. Não vou discutir, vou reformular: Entre as muitas alternativas, proponho prestar atenção ao método descrito no artigo como promissor
 
Salavat:
Está bem. Não vou discutir, vou reformular: Dentre as muitas alternativas, sugiro que o método descrito no artigo também seja considerado promissor

A ferramenta que você descreveu pode ser útil, sem dúvida, nas seguintes circunstâncias.

1. Em trabalhos sobre a construção de uma TC com um grande número de variáveis independentes, várias dezenas ou centenas, a abordagem que você delineou será útil para marcar algumas direções de pesquisa. Se essas direções formais forem acompanhadas de um raciocínio substantivo sobre a influência da variável independente na variável dependente e sobre a influência mútua das variáveis independentes, tudo bem.

2. Sua ferramenta proposta como uma etapa de transição para um conjunto maior de ferramentas. A questão é que, até onde me lembro, o STATISTICS é um conjunto de ferramentas muito limitado e não está atualizado. Depois de dar esse primeiro passo para analisar a importância das variáveis para a variável-alvo, será natural passar para um conjunto maior de ferramentas, como as oferecidas pelo shell caret no R.

 
Muito mais questionável é a fonte dos dados. Qual versão dos indicadores macroeconômicos foi usada? Muitas vezes, esses dados são marcados não com a data de lançamento, mas com a data do final do período a que se referem. Portanto, ao usar, por exemplo, uma série do PIB que não seja da primeira versão, pode-se facilmente olhar seis meses para o futuro (sem mencionar a revisão dos métodos de cálculo e o redesenho de décadas de história, como aconteceu recentemente com o PIB dos EUA).
 

O artigo é interessante. Obrigado. Mas é mais como um guia para o uso de estatísticas. E há muitos conceitos errôneos nele.

  1. Previsão (e essa palavra aparece no cabeçalho Equação de regressão e previsão final) para 5 dias usando indicadores macroeconômicos é um absurdo. Os indicadores macroeconômicos são divulgados mensal e trimestralmente e depois ajustados ao longo de vários meses. Além disso, os indicadores macroeconômicos têm muito ruído mesmo em intervalos trimestrais e anuais, sem mencionar os intervalos diários.
  2. O artigo pouco explica como esses indicadores macroeconômicos foram escolhidos. Ele simplesmente pega os 99 mais populares que são frequentemente mencionados nas notícias. Quase todos eles são incapazes de prever o mercado, pois são defasados, e não avançados. Mesmo se você pegar Pedidos de Fábrica ou Licenças de Construção, embora sejam considerados líderes, eles não são realmente líderes, porque incluem indicadores constituintes que já foram anunciados há alguns meses e aos quais o mercado já reagiu. Vou lhe contar um segredo de graça: procure indicadores de Consumo diferentes que você não tem em sua lista de dados. Eles são realmente importantes. Quando o consumo caiu, os pedidos de fábrica e as licenças de construção caíram e, com eles, o PIB e o mercado. Portanto, tudo começa com o consumo. Isso é até bem descrito em O Capital, de Marx.
  3. A análise de regressão é muito aplicável a modelos econômicos. faa1947 usa alguns dogmas em vez de entrar na essência do método matemático. O problema não está no método, mas nos dados e em sua preparação. Os dados devem ser estacionários, não importa se é uma regressão ou um "processo controlado". Os dados econômicos são não estacionários em sua forma original. Mas eles podem ser facilmente transformados em dados estacionários, por exemplo, por meio de diferenciação e normalização.
  4. O problema da regressão é que qualquer outra série, mesmo que não tenha relação alguma com a série modelada, pode ser inserida em qualquer série modelada, se essas séries de entrada forem escolhidas em número suficiente. Por exemplo, as flutuações da temperatura do ar no Alasca, os dados sobre a poluição do ar em Los Angeles etc. podem ser incorporados com sucesso aos preços de câmbio. O erro de regressão pode ser levado a zero com a inclusão desses "dados externos". A precisão da previsão também será zero. Portanto, você precisa saber como escolher os dados certos, em que quantidade e com que atraso.
  5. Conhecer o mecanismo de funcionamento das empresas também é útil. Por exemplo, todo mundo gosta de citar a taxa de desemprego. Eles consideram que essa taxa é um barômetro da economia. Mas, na realidade, quando a taxa de desemprego sobe, é tarde demais para reagir, pois a economia já está em declínio há muito tempo. O problema com a UR é que ela inclui todas as pessoas com mais de 16 anos de idade. Há dezenas de taxas de desemprego diferentes para diferentes segmentos da população e diferentes ocupações. Eis uma pergunta para o backfill: se as empresas perceberem um declínio na demanda por seus produtos, quem elas demitem primeiro? E a segunda pergunta é: quais empresas são as primeiras a sentir uma queda na demanda?
 
gpwr:

O artigo é interessante. Obrigado. Mas é mais como um guia para o uso de estatísticas. E há muitos conceitos errôneos nele.

  1. Previsão (e essa palavra aparece no cabeçalho Equação de regressão e previsão final) para 5 dias usando indicadores macroeconômicos é um absurdo. Os indicadores macroeconômicos são divulgados mensal e trimestralmente e depois ajustados ao longo de vários meses. Além disso, os indicadores macroeconômicos têm muito ruído mesmo em intervalos trimestrais e anuais, sem mencionar os intervalos diários.
  2. O artigo pouco explica como esses indicadores macroeconômicos foram escolhidos. Ele simplesmente pega os 99 mais populares que são frequentemente mencionados nas notícias. Quase todos eles são incapazes de prever o mercado, pois são defasados, e não avançados. Mesmo se você pegar Pedidos de Fábrica ou Licenças de Construção, embora sejam considerados líderes, eles não são realmente líderes, porque incluem indicadores constituintes que já foram anunciados há alguns meses e aos quais o mercado já reagiu. Vou lhe contar um segredo de graça: procure indicadores de Consumo diferentes que você não tem em sua lista de dados. Eles são realmente importantes. Quando o consumo caiu, os pedidos de fábrica e as licenças de construção caíram e, com eles, o PIB e o mercado. Portanto, tudo começa com o consumo. Isso é até bem descrito em O Capital, de Marx.
  3. A análise de regressão é muito aplicável a modelos econômicos. faa1947 usa alguns dogmas em vez de entrar na essência do método matemático. O problema não está no método, mas nos dados e em sua preparação. Os dados devem ser estacionários, não importa se é uma regressão ou um "processo controlado". Os dados econômicos são não estacionários em sua forma original. Mas eles podem ser facilmente transformados em dados estacionários, por exemplo, por meio de diferenciação e normalização.
  4. O problema da regressão é que qualquer outra série, mesmo que não tenha relação alguma com a série modelada, pode ser inserida em qualquer série modelada, se essas séries de entrada forem escolhidas em número suficiente. Por exemplo, as flutuações da temperatura do ar no Alasca, os dados sobre a poluição do ar em Los Angeles etc. podem ser incorporados com sucesso aos preços de câmbio. O erro de regressão pode ser levado a zero com a inclusão desses "dados externos". A precisão da previsão também será zero. Portanto, você precisa saber como escolher os dados certos, em que quantidade e com que atraso.
  5. Conhecer o mecanismo de funcionamento das empresas também é útil. Por exemplo, todo mundo gosta de citar a taxa de desemprego. Consideram que essa taxa é um barômetro da economia. Mas, na verdade, quando a taxa de desemprego sobe, é tarde demais para reagir, pois a economia já está em declínio há muito tempo. O problema com a UR é que ela inclui todas as pessoas com mais de 16 anos de idade. Há dezenas de taxas de desemprego diferentes para diferentes segmentos da população e diferentes ocupações. Aqui vai uma pergunta para o backfill: se as empresas perceberem um declínio na demanda por seus produtos, quem elas demitem primeiro? E uma segunda pergunta: quais empresas são as primeiras a sentir uma queda na demanda?

Não expus completamente meu ponto de vista e tentarei compensá-lo brevemente a seguir, talvez me repetindo.

1. O problema da seleção de dados iniciais - preditores - é fundamental, pouco formalizado e tende mais para a arte do que para a ciência. Não vamos nos esquecer de um dos postulados básicos da estatística: "Lixo entra, lixo sai".

2. Como escrevi acima, mais da metade do tempo de construção de um modelo é gasto na seleção e na justificativa da lista e do tipo de dados iniciais. Além disso, é a interpretação significativa dos dados iniciais, e não suas características formais e estatísticas, que é de suma importância. O Matapparatus é um meio auxiliar para a seleção significativa dos dados iniciais.

3. De acordo com a literatura, faço distinção entre dois tipos de previsão: uma previsão e outra predição.

4. Previsão: pegamos o histórico e o extrapolamos para o futuro com alguns passos à frente. Clássica: pegamos a máquina e a extrapolamos para o futuro. O principal problema é que o erro se acumula à medida que o número de passos à frente aumenta, pois o próximo valor se baseia no anterior

5. Previsão: obtemos o conjunto atual de dados de entrada e prevemos o futuro sem qualquer pré-história. O valor anterior não é usado, ou seja, se prevermos +5, não precisaremos dos 4 valores anteriores para isso, ao contrário da previsão.

5. Além dos dados iniciais, é muito importante O QUE PREVEMOS. Ao negociar, temos dois tipos de ordens (com opções) para comprar e vender. Por alguma razão, prevemos o valor do preço futuro por meio de regressões e concluímos "compra e venda" a partir desse valor de preço. E se levarmos em conta o erro e construirmos a decisão de "compra e venda" levando em conta o intervalo de confiança, rapidamente fica claro que é impossível tomar uma decisão. Disso resulta: MODELOS REGRESSIONAIS PROGNOSTICANDO SIGNIFICÂNCIA - INEXISTENTE.

6. Deve-se prever a direção da tendência, que coincide com as ordens dos sistemas de negociação. Isso é feito por modelos de classificação que são capazes de prever valores: "long-short" ou "long-side-short", ou algo mais qualitativo, mas não quantitativo, como: o valor futuro do par = 1,3500.

7. Para criar modelos de classificação, este artigo pode ser muito útil.

 
gpwr:

O artigo é interessante. Obrigado. Mas é mais como um guia para o uso de estatísticas. E há muitos conceitos errôneos nele.

Seja bem-vindo de volta ao site. ;-) Espero que por um longo tempo. Finalmente haverá algo útil e informativo para ler.
 

Aqui está um exemplo do meu modelo de regressão que prevê o S&P500. A linha preta é o índice histórico, a linha azul horizontal sólida é a média trimestral e a linha pontilhada são as previsões. As previsões estão em trimestres. A precisão das previsões não é tão grande, mas é suficiente para prever o caráter dos movimentos: para baixo, para cima, estável. O modelo prevê que o mercado cairá nos 3,5 meses restantes deste ano ou, na melhor das hipóteses, ficará estável. Eu uso essas previsões apenas para sair do mercado a tempo.

 

Pergunta ou solicitação ao autor - no modelo obtido, vá para a guia Avançado nos resultados e clique no botão Correlações parciais.

Poste aqui, se não for difícil, o valor dos coeficientes de PC para cada um dos fatores do modelo.

 
Demi:

Pergunta ou solicitação ao autor - no modelo obtido, vá para a guia Avançado nos resultados e clique no botão Correlações parciais.

Poste aqui, se não for difícil, o valor dos coeficientes de PC para cada um dos fatores do modelo.

Todas as operações podem ser feitas por você mesmo; o arquivo com os dados preparados está anexado ao artigo no arquivo calendar_2010-2011_usd_out. zip .


b*in Cor. parcial Semipart Cor. Tolerância R-quadrado t(357) p-valor
variação de preço em 1 dia 0.3500049 0.3883344 0.3045530 0.7571426 0.2428574 7.9622506 0.0000000
variação de preço por 10 dias 0.3271369 0.3623699 0.2809839 0.7377407 0.2622593 7.3460567 0.0000000
USD Vendas de Casas Existentes (MoM) 0.4499016 0.2746573 0.2064353 0.2105391 0.7894609 5.3970552 0.0000001
USD Pedidos de hipoteca MBA -0.1070692 -0.1315908 -0.0959356 0.8028431 0.1971569 -2.5081463 0.0125795
USD Índice de custo de emprego 1.1924082 0.3459071 0.2664363 0.0499272 0.9500728 6.9657258 0.0000000
USD NAPM-Milwaukee 0.4918679 0.3281278 0.2510388 0.2604862 0.7395138 6.5631723 0.0000000
USD Vendas de casas existentes -0.6131716 -0.3510242 -0.2709271 0.1952275 0.8047725 -7.0831333 0.0000000
Taxa de desemprego em USD -0.2303595 -0.1174173 -0.0854492 0.1375953 0.8624047 -2.2339883 0.0261025
USD ISM Manufatura 0.4683029 0.2807841 0.2114298 0.2038349 0.7961651 5.5276311 0.0000001
USD Pedidos de bens de capital sem defesa, excluindo ar -1.0522008 -0.3326872 -0.2549579 0.0587137 0.9412863 -6.6656324 0.0000000
USD Bens duráveis, exceto transporte 1.0195595 0.3332286 0.2554246 0.0627625 0.9372375 6.6778344 0.0000000
USD Índice de compra de preços de imóveis residenciais (QoQ) -0.6493641 -0.3164098 -0.2410558 0.1378030 0.8621970 -6.3021765 0.0000000
USD Gerente de Compras de Chicago -0.7364752 -0.2854029 -0.2152134 0.0853930 0.9146070 -5.6265502 0.0000000
USD Despesas de consumo pessoal básicas (YoY) -0.5430761 -0.2067342 -0.1527068 0.0790670 0.9209330 -3.9923747 0.0000794