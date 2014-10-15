Introdução

A análise fundamentalista é considerada incompreensível por muitos. Não está claro como se deve realizar tal análise, quais os parâmetros que devem ser levados em conta e quais devem ser descartados. Descobrir o impacto dos parâmetros contabilizadas e o período de tempo em que eles devem ser considerados não é simples.

Em 2011, eu me deparei com o artigo Análise de Regressão Múltipla. Gerador de Estratégia e Tester in One e achei interessante o método descrito nele. Eu tenho conduzido pesquisas sobre a aplicação deste método para a análise fundamental e irei descrever os resultados neste artigo.





O que é "Análise de Regressão Múltipla"?

Análise de regressão múltipla é um método de avaliação da dependência de uma variável a partir de duas ou mais variáveis ​​independentes.

Aqueles com uma mente não-matemática, provavelmente, não irão encontrar esta definição compreensível. O exemplo a seguir vai ilustrar o significado de análise e de como ela pode ser usada.

Imagine um pesquisador que vai estimar a eficiência de uma atividade física regular quando se faz uso de suplementação na dieta. O pesquisador realiza um experimento envolvendo 24 estudantes universitários. Os estudantes são divididos em quatro grupos de seis pessoas cada. O primeiro grupo recebe 100 mg/dia de suplemento, o segundo grupo recebe 200 mg/dia, o terceiro recebe 300 mg/dia, e o quarto - 400 mg/dia. Este experimento envolve quatro níveis de ingestão de suplemento e três níveis de atividade física. Seis pessoas em cada grupo são divididas em três pares. Um par exerce zero horas por semana, o segundo par exerce cinco horas por semana e o terceiro possui 10 horas de atividade física por semana. No fim do experimento, todos os participantes perderam peso. Os dados foram inseridos na tabela a seguir:

Participante do experimento Doze de suplementação (mg/dia) Nível de atividade física (horas/semana) Perda de peso em (lb) 1 100 0 -4 2 100 0 0 3 100 5 -7 4 100 5 -6 5 100 10 -2 6 100 10 -14 7 200 0 -5 8 200 0 -2 9 200 5 -5 10 200 5 -8 11 200 10 -9 12 200 10 -9 13 300 0 1 14 300 0 0 15 300 5 -3 16 300 5 -3 17 300 10 -8 18 300 10 -12 19 400 0 -5 20 400 0 -4 21 400 5 -4 22 400 5 -6 23 400 10 -9 24 400 10 -7

Resultado da perda de peso de cada participante

Consequentemente, nós temos duas perguntas:

O que causou a perda de peso - suplementos ou atividade física? Que tipo de relação existe entre a mudança de peso e o fator de influência?

É muito semelhante a uma situação comum nos mercados financeiros, não é? Por exemplo, quando há mudanças na taxa de câmbio, há sempre uma dúvida sobre quais itens das notícias influenciaram ela. Se existe tal fator econômico impactando o preço, então como é que os preços variam quando o fator é variado?

Análise regressiva múltipla e o programa STATISTICA ajudam a responder essas perguntas. Transfira ou importe as tabelas contendo os dados para o programa e selecione "Multiple Regression" no menu:





Fig. 1. Importação dos dados de exemplo para o programa STATISTICA

Depois de selecionar essa barra de menu, encontre o botão "Variables" e clique sobre ela:





Fig. 2. Tela de múltiplos parâmetros de análise

Ela irá abrir uma janela para selecionar as variáveis ​​utilizadas para análise. Ela é composta de duas partes: no lado esquerdo, podemos selecionar o que, acreditamos, ser uma variável dependente (no nosso caso, é a perda de peso) e no lado direito, destacamos o que poderá influenciar esta mudança.





Fig. 3. Atribuição das variáveis ​​dependentes e independentes

Clicando no botão "OK" nos levará de volta para a janela de diálogo de configurações anteriores onde temos de marcar uma caixa de seleção e, em seguida, pressionar "OK":





Fig. 4. Selecionando os parâmetros para análise múltipla

Na janela seguinte, selecione o método que "All Effects":





Fig. 5. Escolha do método

Depois de todas as manipulações, devemos receber uma janela com o resultado da análise. Esses fatores, que foram estatisticamente comprovados para influenciar o resultado está em fonte vermelha na lista de fatores (no nosso caso, é o "Nível de atividade física"). Outras variáveis:

"No. of cases" é o número de incidentes para análise;

"P" é o nível da validade estatística desta correlação (nível inferior a 0,05 é considerado confiável);

"Multiple R" é o valor de correlação multivariada entre as variáveis ​​dependentes e independentes da equação.





Fig. 6. Resultado de processamento de dados

O Valor 'Multiple R = 0,71819113' deve ser interpretado como: "R Múltiplo, o valor de correlação multivariada a entre perda de peso e os fatores de impacto, é 71,82%".

Um dos dois fatores, "nível de atividade física", está no texto em vermelho. Ele é o fator que afetou a perda de peso quando o impacto da ingestão de suplemento de dieta era insignificante.

Agora só temos que calcular quanto exatamente que os fatores influenciaram na perda de peso, fazendo uma tentativa de equação regressiva. Para fazer isso, pressione o botão "Summary: Regression results" para levá-lo a uma nova tabela. Use os valores da coluna 'b' desta tabela para fazer uma equação de regressão:





Fig. 7. As variáveis ​​da equação de regressão

Temos a seguinte equação:

Perda de peso = 0,00117 [Dose do suplemento] - 0,63750*[Nível de atividade física] - 2,5625

Colocando os valores na equação (Ctrl+C в STATISTICA -> Ctrl+V в Excel), podemos calcular a variação do peso, se o consumo de suplemento ou intensidade de exercícios físicos ficam diferentes. Por exemplo:

Mudança de peso 1 = 0,00117*100 - 0,6375*0 - 2,5625 = -2,4455. Isso significa que uma pessoa pode perder até 2,4lb ao tomar 100 mg por dia sem fazer nenhum exercício.

Mudança de peso 2 = 0,00117*100 - 0,6375*10 - 2,5625 = -8,8205. Isso significa que a perda de peso pode ser de até 8,82lb quando ingerido 100 mg de suplemento por dia e se exercitando 10 horas por semana.

Espero que este exemplo dê uma idéia clara no que a análise múltipla pode ser usada. Na verdade, alguém pode achar que é útil para verificar se sua dieta é eficiente e se eles precisam ir mais para a academia.

Agora vamos aplicar a idéia do experimento para as moedas. Vamos supor que a variável dependente é uma variação no preço do par EURUSD e as variáveis ​​independentes são as estatísticas macroeconómicas, recebidas do calendário de eventos do popular recurso Forex Factory.

Semelhante ao exemplo acima, podemos identificar os fatores macroeconômicos que influenciam os preços da moeda através da análise múltipla. Nós também podemos fazer uma equação que estime qual será o valor da cotação da moeda após a publicação das estatísticas macroeconómicas.





Preparando os Dados e Importando-o para o Programa STATISTICA

Trabalhando com o site Forex Factory, eu encontrei o seguinte problema que eu recomendo fortemente a considerar. Neste recurso, os mesmo dados são publicados em diferentes formatos. Por exemplo, os números podem ter um formato de texto ou dados de texto adicionais, o que torna difícil recolher os dados normalmente. A análise do site para reunir os dados pode falhar.

Eu juntei manualmente os valores de todos os 99 fatores do calendário de notícias a respeito dos EUA durante os últimos anos

Fig. 8. Índices macroeconômicos publicados dos EUA

Eu processei todos os números em um formato unificado, apaguei todos os dados de texto adicionais, tais como "milhões" e "bilhões", etc e trouxe todos os dados em uma tabela de sete colunas (veja o arquivo "calendar_usd.zip" anexado ao artigo) e adicionei as cotações para o EURUSD no período D1.

Cabeçalhos das colunas:

Data

Mês/Ano

Hora

Fuso horário

Moeda

Descrição

Anterior

A lista de resultados possui mais de 6.700 entradas de dados macroeconômicas e de cotações para o EURUSD e ela não possui qualquer utilidade prática para uma simples análise manual. Trazendo todos os dados em uma tabela em que ela ficou ordenada em colunas separadas pelo tipo e dispostos em linhas pela data, foi necessário o uso de um manipulador adicional. Nós usamos o script ListConvertToTable para processar os dados e convertê-lo em uma tabela.

Na janela de diálogo de configurações do script é necessário nomear um arquivo de entrada e o documento de destino. O arquivo de entrada tem de ser inicialmente colocados em terminal_data_directory/MQL5/Files, a saída é criada lá também.

Como existe uma grande quantidade de dados, o processamento da lista de notícias de uma tabela pode levar bastante tempo. Alertas, embutidos no script, irá indicar em que fase ele se encontra. A Alerta '8' vai deixar você saber quando o processo estiver concluído e quando você poderá trabalhar no arquivo. A tabela que será submetida a uma análise múltipla está no arquivo anexado a este artigo.

Eu tenho o seguinte resultado (veja o arquivo 'calendar_usd_out.zip "no anexo):

Fig. 9. Resultado da execução do script ListConvertToTable

Vamos usar novamente o programa STATISTICA para processar os dados. Para fazer o upload de um arquivo CSV para o STATISTICA, siga os passos abaixo:

Em STATISTICA abra "File", em seguida, "Open", escolha o tipo de arquivo "Data files" e abra o seu arquivo em CSV.

Na janela de importação do arquivo do tipo Texto deixe "Delimited" e pressione "OK".

Na janela aberta, inclua os elementos sublinhados

No campo "Decimal separator character" um ponto deve ser colocado, não importa se há um ou não:

Fig. 10. Importando uma tabela de formato CSV para o programa STATISTICA

Pressione "OK" e você receberá uma tabela com os dados. Os dados estão prontos para a análise de regressão múltipla. Para analisar o impacto dos dados sobre a seguinte variação de preço, é necessário somar os períodos em que a variação no preço ocorreu. Eu selecionei as notícias desde 2010 e três opções da variável dependente para a análise:

Variação do preço da moeda em um dia após a notícia ser publicada;

Variação do preço da moeda em 5 dias após a notícia ser publicada;

Variação do preço da moeda em 10 dias após a notícia ser publicada.

Estas colunas podem ser adicionados manualmente à tabela CSV antes da exportação para o programa STATISTICA ou na tabela da janela do programa:





Fig. 11. Tabela de dados estendida

Os dados estão prontos e os indicadores que, em nossa opinião, afetam a taxa de câmbio já podem ser obtidos.





Obtenha fatores que possuem um grande impacto sobre o preço da moeda

Inicie a análise de regressão ("Statistics"->"Multiple Regression"). Na janela que apareceu, permita os itens marcados na aba "Advanced". Pressione o botão "Variables".

No primeiro campo, selecione a variável dependente e no segundo campo selecione as independentes. Nossa equação será com base nos valores das variáveis ​​selecionadas:





Fig. 12. Janela para seleção de indicadores

Usando o botão "Variables", selecione os dados a serem usados ​​para a análise:





Fig. 13. Atribuição das variáveis ​​dependentes e independentes

Uma janela de aviso com o sinal "Some variables have no variance" será exibida para informar que algumas variáveis ​​independentes não pode ser alterada sem dados. Essas colunas devem ser excluídas. Através da eliminação devemos encontrar a coluna 49 "USD Federal Open Market Committee Rate Decision", remova ela e tenha uma tabela pronta para análise (consulte o arquivo "calendar_2010-2011_usd_out.zip" no anexo).

Clique em "OK". Na janela aberta marque as caixas de seleção na guia "Advanced":





Fig. 14. Escolha do método Forward Stepwise

Complete a seleção das opções pressionando o botão "ОK". Na janela seguinte, escolha o método "forward stepwise" para ativar a seleção automática de dados e, em seguida, pressione novamente "ОK":





Fig. 15. Escolha do método Forward Stepwise

Estamos na reta final. Quando você vê uma mensagem em uma nova janela informando que a análise de regressão foi bem sucedida, pressione o botão "Summary: Regression results".

A seleção automática de indicadores ordena aqueles que fazem a maior contribuição para a correlação multivariada entre as variáveis ​​independentes e a dependente. No nosso caso, é um conjunto de indicadores que tem o maior impacto sobre o preço. A seleção automática, na sua essência, tem um papel de um gerador de estratégia. A equação gerada irá incluir apenas os indicadores que descrevem o comportamento do preço na maneira mais confiável.

Devo mencionar que as regras de inclusão de indicadores para a análise utilizando o STATISTICA nem sempre são ótimas. Por exemplo, a equação de regressão pode incluir uma série de indicadores não-confiáveis ​​(fonte preta na tabela de resultado). Se a lista inclui os indicadores não confiáveis, então, retornar para a fase de seleção dos indicadores e retire os não-confiáveis ​​do lote, destinado à análise.

Para retornar pressione "Cancel" na janela de resultados da análise e repita a análise. Tente remover todos os indicadores não confiáveis ​​assim. Ao mesmo tempo, mantenha em mente que o valor obtido na correlação multivariável (R múltiplo) não deve ser significativamente menor do que a inicial. Você pode remover todos os indicadores não confiáveis ​​a partir da análise, um por um, ou fazr tudo de uma vez. No entanto, o primeiro método é preferível.

No final, apenas os indicadores confiáveis, ​​que afetam a flutuação no preço deverão permanecer na tabela. Nas tabelas, as variáveis ​​encontrados que influenciam os preços foram destacados em vermelho e as variáveis ​​que possuem zero efeito estão em preto.

Após a conclusão da análise, alguns indicadores foram descobertos que parecem ter um impacto sobre o preço da moeda após a sua publicação. Para cada período, o conjunto de indicadores foi diferente. Escolhendo "mudança de preço em um dia"(ou seja, vamos analisar o comportamento do preço em um dia apos o indicador ser publicado) como uma variável independente na janela do lado esquerdo, nós vamos receber a seguinte:





Fig. 16. Variável independente "mudança de preço em um dia"

Retorne ao clicar em "Cancel" e selecione "Variables" para voltar às listas das variáveis ​​para escolher. Aos poucos, remova as entradas em preto a partir da lista de variáveis ​​independentes e deixe apenas as de vermelho. As entradas restantes conterá as notícias que afetam os preços no dia seguinte.

Por favor, note que as entradas na tabela diferem na cor. As variáveis ​​independentes que têm um impacto significativo sobre a dependente está em vermelho. Na figura abaixo todas as entradas estão em vermelho, ou seja, os erros nos resultados da equação depois de introduzir os dados será menor do que no primeiro caso. O impacto pode ser avaliado pelo valor dos coeficientes do "p-value" na última coluna (quanto menor for o valor, melhor). As variáveis ​​que possuem impacto zero sobre o preço podem ser removidas a partir dos coeficientes.

Escolhendo "mudança de preço em 5 dias" e ordenando pela notícia significativa ao remover gradualmente as entradas irrelevantes, receberemos o seguinte resultado:





Fig. 17. Variável independente "Mudança de preço em 5 dias"

Quando nós, finalmente, selecionarmos "mudança de preço em 10 dias", como uma variável independente, teremos:





Fig. 18. Variável independente "Mudança de preço em 5 dias"

Quando selecionamos como variável independente a variação do preço em um dia depois que os números do indicador foram publicadas, podemos ver que no período de 2010 até meados de 2011, os preços foram afetados principalmente pelos dados sobre a esfera do desenvolvimento imobiliário e dos índices,que foram divulgados pelo Instituto Richmond.

No trecho de 5 dias após a publicação dos dados, os índices de produção e de não produção indústrias, os custos do trabalho e o desemprego são adicionados aos dados sobre a indústria de desenvolvimento.

Quando consideramos um período de 10 dias, os índices influentes mudam. Índices de produção e não produção indústrias, pedidos para o desenvolvimento de casas, o nível de desemprego e os preços de energia aparecem em primeiro plano.

Assim, os fatores que afetam o preço do par EURUSD, são muito semelhantes aos dados macroeconômicos da análise fundamentalista, tal importância é enfatizado em quase todos os livros didáticos. Como podemos ver, agora elas foram confirmadas por matemática e estatística.





Equação de Regressão e o Resultado da Previsão

Não é suficiente conhecer apenas os fatores que afetam o preço, é importante ser capaz de estimar o quanto os preços podem mudar a cada publicação dos índices. Para isso, devemos fazer uma equação de regressão como no exemplo do início deste artigo.

Vamos fazer uma equação de regressão com base nos dados coletados da tabela da fig. 17 "mudança de preço em 5 dias". Para isso, deve usar as variáveis ​​da coluna com o cabeçalho 'b'. A primeira linha é uma constante numérica, recebida no final da análise. Seu cálculo será considerado nos artigos seguintes.

Façamos uma equação de regressão com base nesses coeficientes:

R=-0.0761294138334434+0.355142961984956*[[variação de preço em 1 dia]+0.319936701020232*[variação de preço em 10 dias]+0.455193706894553*[USD Existing Home Sales (MoM)]-0.146961978306227*[USD MBA Mortgage Applications] + ...,

onde usamos os valores da coluna "b" como coeficientes e os dados macroeconômicos publicados como multiplicadores que estão no colchetes.

Introduzindo os valores dos índices macroeconômicos, publicado no site da fonte, nesta equação, vamos receber um número R, maior ou menor que zero. Se o resultado da introdução de novos dados for maior que zero, então, isso significa que os preços vão aumentar no período selecionado para análise. O valor de R mostrará o crescimento no preço. O valor de R negativo significará que os preços poderão cair. O valor de R, neste caso, irá mostrar a queda dos preços.

Coloque os valores na fórmula acima e considere o resultado com base no exemplo do par EURUSD. Usaremos os dados da entrada de 04.08.2010 como um exemplo para colocar os coeficientes na equação:



b valor [b]х[valor] Intercepto -0.0761 1.00000 -0.0761 mudança de preço em 1 dia 0.3551 -0.0070 -0.0025 mudança de preço em 10 dias 0.3199 0.0244 0.0078 USD Existing Home Sales (MoM) 0.4552 -0.022 -0.0100 USD MBA Mortgage Applications -0.1470 -0.044 0.0065 USD Employment Cost Index 144.0041 0.006 0.8640 USD NAPM-Milwaukee 0.0106 59 0.6278 USD Existing Home Sales 0.0000 5660000 -0.6596 USD Unemployment Rate -6.7866 0.099 -0.6719 USD ISM Manufacturing 0.0197 56.2 1.1052 USD Capital Goods Orders Non defense Excluding Air -2.8934 0.048 -0.1389 USD Durables Ex Transportation 4.9290 0.012 0.0591 USD House Price Purchase Index (QoQ) -5.9295 -0.018 0.1067 USD Chicago Purchasing Manager -0.0160 59.1 -0.9433 USD Personal Consumption Expenditure Core (YoY) -19.8579 0.015 -0.2979





-0.0230

R=-0,0230, portanto, há uma tendência contínua de baixa para os cinco dias seguintes a partir de 04.08.2010, sendo que o preço caiu para -230 pontos. Vamos dar uma olhada no gráfico do par EURUSD para este período:

Fig. 19. EURUSD agosto de 2010

Como podemos ver no gráfico, a previsão foi precisa e o preço caiu de 1,3154 para 1,2844 em cinco dias de negociação (fechamento no dia 11 de agosto), ou seja, -310 pontos. A previsão para a queda no preço com base no resultado da equação de regressão foi comprovada. Da mesma forma, podemos colocar outras datas.





Conclusão

A maneira, considerada neste artigo, de analisar os dados sobre os indicadores macroeconômicos, permitem simplificar e automatizar a análise fundamentalista para que até mesmo um novato possa lidar com grande quantidade de estatísticas econômicas.

Além disso, tal abordagem para a análise fundamentalista dá a oportunidade de reagir instantaneamente e ajustar as ofertas de acordo com a notícia.

Por favor, esteja ciente de que a previsão não deve ser considerada como uma garantia absoluta de que o preço da moeda irá mudar na direção prevista. O resultado da previsão é probabilístico e depende de uma série de fatores. Além disso, a equação de regressão deve ser recalculada quando surgir novos dados.

Boa sorte com suas previsões!