Discussão do artigo "Regressões Espúrias em Python"

 

Novo artigo Regressões Espúrias em Python foi publicado:

Regressões espúrias ocorrem quando duas séries temporais exibem um alto grau de correlação puramente por acaso, levando a resultados enganosos na análise de regressão. Em tais casos, embora as variáveis possam parecer relacionadas, a correlação é coincidencial e o modelo pode ser pouco confiável.

Antes de mergulhar no campo do trading algorítmico com aprendizado de máquina, é crucial verificar se existe uma relação significativa entre as entradas do modelo e a variável que desejamos prever. Este artigo ilustra a utilidade de empregar testes de raiz unitária nos resíduos do modelo para validar a presença de tal relação em nossos conjuntos de dados.

Infelizmente, é possível construir modelos usando conjuntos de dados que não têm nenhuma relação genuína. Lamentavelmente, esses modelos podem apresentar métricas de erro impressionantemente baixas, reforçando uma falsa sensação de controle e perspectivas excessivamente otimistas. Esses modelos falhos são comumente chamados de "regressões espúrias."

Este artigo começará primeiro cultivando uma compreensão intuitiva das regressões espúrias. Depois, vamos gerar dados sintéticos de séries temporais para simular uma regressão espúria e observar seus efeitos característicos. Subsequentemente, exploraremos métodos para identificar regressões espúrias, baseando-nos em nossos insights para validar um modelo de aprendizado de máquina desenvolvido em Python. Finalmente, se o nosso modelo for validado, exportaremos para ONNX e implementaremos uma estratégia de negociação em MQL5.

Autor: Gamuchirai Zororo Ndawana

 
Artigo muito interessante! Mas teria sido útil para os traders sem conhecimento estatístico aprofundado se os termos básicos, como resíduos (diferença em relação à previsão), estacionariedade (var. e média são constantes ou não) etc., fossem explicados brevemente.
 
Carl Schreiber #:
Artigo muito interessante! Mas teria sido útil para os operadores sem conhecimento estatístico aprofundado se os termos básicos, como resíduos (diferença em relação à previsão), estacionariedade (a variável e a média são constantes ou não) etc., fossem explicados brevemente.

Obrigado, Carl, de fato, você tem razão, vou me lembrar de ser breve e gentil da próxima vez para maximizar a utilidade.

 

Talvez seja uma dificuldade de tradução, mas gostaria de esclarecer. A estacionariedade no artigo é definida para os resíduos, ou seja, o delta entre os preços reais de fechamento da barra e sua previsão? Talvez eu não tenha lido bem, mas por que estamos tirando conclusões sobre os mesmos dados que foram treinados, não seria lógico aplicar o modelo em uma amostra defasada?

O artigo faz parecer que as séries temporais de cotações são estacionárias, mas todas as fontes nos dizem o contrário. Acho que isso é um erro na percepção do material.

Além disso, a questão da precisão do modelo não é abordada. Pelo que entendi, ele não é preciso de forma alguma e, se for, podemos aplicar testes diferentes com uma variação tão grande de erros nas respostas do modelo?

Idealmente, seria útil ver como os preditores foram excluídos, por uma técnica ou outra, e como isso afetou os resultados do modelo de regressão.

Acho que são necessários mais artigos sobre esse tópico que possam de fato ser aplicados às citações.

 
Aleksey Vyazmikin modelo de regressão.

Acho que são necessários mais artigos sobre esse tópico que possam de fato ser aplicados às citações.

Olá, Aleksey, como você provavelmente já sabe, há muitas maneiras diferentes de resolver qualquer problema. Eu prefiro medir os resíduos do modelo em dados de teste que ele não tenha visto antes. No entanto, a literatura acadêmica que eu estava lendo na época me sugeriu que mesmo os dados de treinamento que o modelo já viu antes ainda são bons.


E eu não estava ciente de que a forma como escrevi poderia ter sugerido que as séries temporais de cotações de mercado são estacionárias, todos sabemos que elas não são estacionárias, não foi minha intenção dizer isso, e eu provavelmente poderia ter formulado as coisas melhor.

A questão da precisão do modelo estava além do meu escopo, porque os modelos espúrios ainda podem obter métricas de precisão altas.

Você sabe disso, um dos primeiros artigos que escrevi para a comunidade. Aprendi desde então e continuarei acrescentando à série. Desta vez, manterei minha redação clara e demonstrarei especialmente como podemos aplicar isso a nosso favor ao negociar nos mercados financeiros.