Discussão do artigo "Análise de Regressão da Influência dos Dados Macroeconômicos sobre a Flutuação nos Preços da Moeda"

 

Novo artigo Análise de Regressão da Influência dos Dados Macroeconômicos sobre a Flutuação nos Preços da Moeda foi publicado:

A análise fundamentalista é considerada incompreensível por muitos. Não está claro como se deve realizar tal análise, quais os parâmetros que devem ser levados em conta e quais devem ser descartados. Descobrir o impacto dos parâmetros contabilizadas e o período de tempo em que eles devem ser considerados não é simples.

Em 2011, eu me deparei com o artigo Análise de Regressão Múltipla. Gerador de Estratégia e Tester in One e achei interessante o método descrito nele. Eu tenho conduzido pesquisas sobre a aplicação deste método para a análise fundamental e irei descrever os resultados neste artigo.

Variável independente "Mudança de preço em 5 dias"

Autor: Salavat Bulyakarov

 

Não está claro em que base você acha que pode confiar nos resultados obtidos?

Afinal de contas, sabe-se que a análise de regressão tem limitações tão significativas que praticamente excluem a possibilidade de seu uso nos mercados financeiros.

Portanto, é necessário provar que os resultados obtidos são confiáveis.

 

O resultado de qualquer análise é a criação de um quadro probabilístico do desenvolvimento da situação. É claro que o resultado obtido da equação não é uma previsão 100% garantida nesse quadro, porque, por exemplo, falta um mecanismo para levar em conta a influência dos discursos dos políticos, força maior, resultados de reuniões etc. Mas acho que ela pode fornecer uma avaliação probabilística das mudanças no preço de uma moeda por um pequeno período.

Em segundo lugar, a equação de regressão é o mesmo indicador técnico que facilita a vida do trader, e acreditar ou não em suas leituras depende do próprio trader.

Em terceiro lugar, você tem razão em questionar o fato de que os resultados podem ser confiáveis, requerem provas, mas em meu artigo descrevi o algoritmo de ações em imagens, anexei um script para gerar tabelas para exportar o feed de notícias na forma de uma tabela para processamento, uso, verifique o artigo na prática, coletivamente e decida se isso é aplicável nos mercados financeiros ou requer revisão ou não é aplicável.

 
Salavat:

O resultado de qualquer análise é a criação de um quadro probabilístico do desenvolvimento da situação. É claro que o resultado obtido com a equação não é uma previsão 100% garantida nesse quadro, porque, por exemplo, falta um mecanismo para levar em conta a influência dos discursos dos políticos, força maior, resultados de reuniões etc. Mas ela pode fornecer uma avaliação probabilística da mudança no preço de uma moeda por um pequeno período, eu acho que pode.

Em segundo lugar, a equação de regressão é o mesmo indicador técnico que facilita a vida do trader, e acreditar ou não em suas leituras depende do próprio trader.

Em terceiro lugar, você tem razão em questionar o fato de que os resultados podem ser confiáveis, requerem provas, mas no meu artigo eu descrevi o algoritmo de ações em imagens, anexei um script para gerar tabelas para exportar o feed de notícias na forma de uma tabela para processamento, use-o, verifique o artigo na prática, coletivamente e decida se ele é aplicável nos mercados financeiros ou se requer revisão ou não é aplicável.

O problema que você levantou é a pedra angular da mineração de dados. Esse problema é mais elaborado no pacote CORELearn. Aqui está um link para a documentação. O mais comum, no sentido de estar em muitos pacotes, é o índice de Gini. O índice mais promissor é o Relief com suas muitas modificações.

Não abandone sua pesquisa, pois você levantou uma questão básica de negociação.

Boa sorte.

 
faa1947:

...

Obrigado.

 

Isso é engraçado.

Primeiro, você construiu um modelo com base na análise de um determinado período e, depois, provou que a reação do mercado a um evento do mesmo período demonstra o comportamento esperado. Bem, é compreensível, o modelo já leva em conta esse evento. É um ajuste clássico. O que é ainda mais engraçado é que a reação aos comunicados à imprensa raramente é medida nem mesmo em horas, quanto mais em dias.

Talvez se você fizer o mesmo para intervalos de curto prazo, o resultado será mais próximo da realidade e terá uma chance de passar nos testes futuros com sucesso

 
Vladix:

Isso é engraçado.

Primeiro, você construiu um modelo com base na análise de um determinado período e, depois, provou que a reação do mercado a um evento do mesmo período demonstra o comportamento esperado. Bem, é compreensível, o modelo já leva em conta esse evento. É um ajuste clássico. O que é ainda mais engraçado é que a reação aos comunicados à imprensa raramente é medida nem mesmo em horas, quanto mais em dias.

Talvez se você fizer o mesmo para intervalos de curto prazo, o resultado será mais realista e terá uma chance de sucesso nos testes futuros

O artigo é intitulado "Análise" e não fala sobre previsão, por isso o teste futuro.

Se falarmos sobre sua observação, então, sem fundamentar a aplicabilidade dos testes futuros, fazê-los é uma ocupação vazia e muito perigosa, porque você pode acidentalmente obter um resultado satisfatório de um teste futuro e acreditar em seu modelo, e ele perderá com segurança na negociação real.

 
faa1947:

O artigo é intitulado "Análise" e não fala sobre previsão, portanto, sobre teste avançado.

Se estivermos falando de sua observação, então, sem fundamentar a aplicabilidade dos testes avançados, fazê-los é uma ocupação vazia e muito perigosa, porque você pode acidentalmente obter um resultado satisfatório de um teste avançado e acreditar em seu modelo, e ele perderá com segurança na negociação real.

Não posso julgar o artigo apenas pelo título. O tópico é interessante para mim e eu o li na íntegra. E aqui está o que o autor escreve na conclusão:

No entanto, gostaria de chamar sua atenção para o fato de que a previsão não é uma garantia de 100% de que a moeda seguirá exatamente a direção prevista. O resultado da previsão é um evento probabilístico, cuja ocorrência depende de muitos fatores. Além disso, é recomendável verificar periodicamente a equação de regressão quando houver novos dados.

Boa sorte com suas previsões.

Fazer malabarismos com dados não é divertido. O autor constrói um modelo do mercado descrito por equações de regressão e, em seguida, prova que o modelo funciona, ao mesmo tempo em que usa a validação dos dados usados para construí-lo. Isso é exatamente o que eu apontei como um tipo de fraude.

 

Na minha época, tive muitos problemas com a análise fundamentalista e tentei automatizá-la por muito tempo. O método FA proposto facilita bastante esse processo. A análise das variáveis macroeconômicas ajuda a identificar aquelas que podem influenciar as mudanças de preço. Mas essa análise não dá 100% de garantia de que elas também serão relevantes no futuro. Lembre-se: os resultados de negociações passadas não podem ser uma garantia de que serão os mesmos no futuro.

A verificação da equação em dados futuros pode ser feita por meio do programa. Você também pode fazer isso sozinho. No processo de preparação dos dados, limite a data extrema usando o botão "Select Cases" (selecionar casos) (consulte a Fig. 13 do artigo), na janela aberta, ative a caixa de seleção "Enable Selection Conditions" (ativar condições de seleção), abaixo, selecione "Specific, selected by:" (específico, selecionado por:) e, na caixa, escreva o intervalo de linhas a ser considerado "v0>0 e v0<999". As linhas com mais de 999 não serão consideradas. Após a análise e a seleção das variáveis significativas, volte a essa janela e altere, mova o intervalo para frente a partir da linha 1000 e verifique os resultados novamente. A % de precisão será mostrada na matriz do programa.

Esse algoritmo de equação deve fazer parte de um robô de negociação, um Expert Advisor. Infelizmente, nem tudo é totalmente automatizado, é difícil coletar dados dos sites que publicam calendários, o mesmo indicador pode ser escrito de forma diferente, uma palavra pode cometer um erro, etc., porque os períodos não são de curto prazo. porque os períodos não são de curto prazo.

Não insisto que esse método seja um maná do céu, apenas ofereço uma ferramenta adicional que pode facilitar seu trabalho e economizar seu tempo.

 
Salavat:

Na minha época, tive muitos problemas com a análise fundamentalista e tentei automatizá-la por muito tempo. O método FA proposto facilita bastante esse processo. A análise das variáveis macroeconômicas ajuda a identificar aquelas que podem influenciar as mudanças de preço. Mas essa análise não dá 100% de garantia de que elas também serão relevantes no futuro. Lembre-se: os resultados de negociações passadas não podem ser uma garantia de que serão os mesmos no futuro.

A verificação da equação em dados futuros pode ser feita por meio do programa. Você também pode fazer isso sozinho. No processo de preparação dos dados, limite a data extrema usando o botão "Select Cases" (selecionar casos) (consulte a Fig. 13 do artigo), na janela aberta, ative a caixa de seleção "Enable Selection Conditions" (ativar condições de seleção), abaixo, selecione "Specific, selected by:" (específico, selecionado por:) e, na caixa, escreva o intervalo de linhas a ser considerado "v0>0 e v0<999". As linhas com mais de 999 não serão consideradas. Após a análise e a seleção das variáveis significativas, volte a essa janela e altere, mova o intervalo para frente a partir da linha 1000 e verifique os resultados novamente. A % de precisão será mostrada na matriz do programa.

Esse algoritmo de equação deve fazer parte de um robô de negociação, um Expert Advisor. Infelizmente, nem tudo é totalmente automatizado, é difícil coletar dados dos sites que publicam calendários, o mesmo indicador pode ser escrito de forma diferente, uma palavra pode cometer um erro, etc., porque os períodos não são de curto prazo. porque os períodos não são de curto prazo.

Não insisto que esse método seja um maná do céu, apenas ofereço uma ferramenta adicional que pode facilitar seu trabalho e economizar seu tempo.

Não posso concordar com você em princípio.

Seu modelo não fornece nenhuma informação, ele induz as pessoas ao erro. E aqui está o motivo.

1. Os modelos de regressão são aplicáveis a séries temporais estacionárias. É por isso que existem os modelos ARIMA, ARCH e muitos outros modelos que, antes de construir um modelo, tentam transformar a série temporal original em outra, mas que, de alguma forma, se assemelhe a uma série estacionária (mo e variância são iguais a uma constante).

2. Depois de converter a série original para que se assemelhe à estacionariedade, um modelo de regressão é construído com o único objetivo de observar a diferença entre o ajuste do modelo e os dados reais. Se essa diferença (residual - retornos) for estacionária, a próxima etapa poderá ser executada.

3. Se os resultados das duas primeiras etapas forem positivos, o que Vladix escreveu - testes avançados. Se os resultados obtidos no conjunto de dados de treinamento do modelo estiverem próximos dos resultados nos conjuntos de dados de teste e validação (são três partes diferentes da série temporal), só então poderemos começar a falar sobre a confiança nos resultados obtidos. No caso oposto, em nenhum caso, será um autoengano muito perigoso, uma fé cega nos números.

O problema com as duas primeiras etapas é que elas não podem ser cumpridas. O principal e mais desagradável obstáculo é a correlação entre as variáveis dependentes - multicolinearidade. Há outros problemas também. Isso explica que o problema que você levantou - determinar a influência das variáveis dependentes sobre a variável independente - deve ser resolvido com indicadores especiais, por exemplo, Gini, Relief.

Com seu artigo, você abordou o problema básico da criação de sistemas de negociação - seleção de dados iniciais para modelos. Em termos de intensidade de trabalho, é pelo menos metade do tempo, se não todos os 75%. Mesmo da forma como você o fez, é muito importante para entender os problemas básicos da negociação.

 
faa1947:

...Não posso concordar com você por princípio. ...

Tudo bem, não concordo. Até que outras abordagens sejam encontradas, proponho usar esta ))))