English Русский 中文 Español Deutsch 日本語
preview
Ciência de dados e aprendizado de máquina (Parte 29): Como selecionar os melhores dados de Forex para treinar IA

Ciência de dados e aprendizado de máquina (Parte 29): Como selecionar os melhores dados de Forex para treinar IA

MetaTrader 5Estatística e análise |
166 1
Omega J Msigwa
Omega J Msigwa

Seções


Introdução

No trading, há uma enorme quantidade de dados e informações disponíveis: indicadores (o MetaTrader 5 possui mais de 36 indicadores embutidos), símbolos de negociação (mais de 100), que podem ser usados em estratégias de correlação, notícias financeiras e outras informações. Ou seja, os traders têm à disposição um grande volume de dados tanto para o trading manual quanto para a construção de modelos de inteligência artificial que auxiliam na tomada de decisões mais fundamentadas.

No entanto, entre todas as informações disponíveis, inevitavelmente há dados de baixa qualidade ou irrelevantes. Nem todos os indicadores, estratégias ou dados são aplicáveis a um determinado símbolo de negociação, estratégia ou situação de mercado. Como identificar os dados mais valiosos para o trading e para a construção de modelos de aprendizado de máquina, de modo a alcançar a máxima eficiência e lucratividade? É aqui que entra a seleção de características.


Seleção de características

A seleção de características é o processo de identificação e escolha de um subconjunto das mais significativas do conjunto de dados original para a construção do modelo. Esse processo permite identificar as informações mais úteis para o aprendizado de máquina e eliminar aquelas que são desnecessárias ou redundantes.

A seleção de características desempenha um papel essencial na criação de um modelo de aprendizado de máquina eficiente por diversos motivos.


Importância da seleção de características para modelos de IA

  • Redução de dimensionalidade

    Ao removemos características irrelevantes ou redundantes, simplificamos o modelo e reduzimos os custos computacionais.

  • Aumento do desempenho

    Focando nas características mais significativas, é possível melhorar a precisão e o poder preditivo do modelo.

  • Melhoria da interpretabilidade

    Modelos com menos características são mais fáceis de analisar e interpretar.

  • Filtragem de ruído

    Ao eliminarmos dados de baixa relevância, podemos evitar o sobreajuste, que frequentemente ocorre devido ao excesso de características irrelevantes.   

Agora que entendemos a importância da seleção de características, vamos analisar as diferentes metodologias que especialistas em dados e aprendizado de máquina utilizam para encontrar as melhores características para modelos de IA.

Neste artigo, trabalharemos com o mesmo conjunto de dados mencionado anteriormente (recomendo que você o leia, caso ainda não o tenha feito). Esse conjunto contém 28 variáveis.

Séries temporais de dados do Forex

Dessas 28 variáveis, precisamos destacar as mais relevantes para as colunas "TARGET_OPEN" (valores de preço de abertura da próxima vela) e "TARGET_CLOSE" (valores de preço de fechamento da próxima vela), descartando os dados menos significativos.

Os métodos de seleção de características podem ser divididos em três categorias principais: métodos de filtragem, métodos de invólucro e métodos embutidos. Vamos analisar cada um deles em detalhes.


Métodos de filtragem

Os métodos de filtragem avaliam as características independentemente do modelo de aprendizado de máquina utilizado. Entre eles, a matriz de correlação e os testes estatísticos são amplamente usados.


Matriz de correlação

A matriz de correlação é uma tabela que exibe os coeficientes de correlação entre diferentes variáveis.

O coeficiente de correlação é uma medida estatística que indica a força e a direção da relação entre duas variáveis. Ele varia de -1 a 1:

Um valor de 1 indica uma correlação positiva perfeita (o aumento de uma variável acompanha um aumento proporcional da outra).

Um valor de 0 indica ausência de correlação (as variáveis não estão relacionadas).

Um valor de -1 indica uma correlação negativa perfeita (o aumento de uma variável acompanha uma redução proporcional da outra).

Traduzido do Inglês pela MetaQuotes Ltd.
Artigo original: https://www.mql5.com/en/articles/15482

Arquivos anexados |
Timeseries_OHLC.csv (219.94 KB)
Últimos Comentários | Ir para discussão (1)
linfo2
linfo2 | 8 ago. 2024 em 00:11
Obrigado por seu artigo claro e bem escrito. É exatamente o que eu estava tentando entender e estava trabalhando para verificar as correlações por conta própria. Agradeço também pelo arquivo python, pois ele é um modelo fácil de adaptar para mim. Espero que, após algumas análises, eu possa dizer obrigado por abrir meus olhos para o que é possível
EA MQL5 integrado ao Telegram (Parte 1): Envio de mensagens do MQL5 para o Telegram EA MQL5 integrado ao Telegram (Parte 1): Envio de mensagens do MQL5 para o Telegram
Neste artigo, criaremos um EA na linguagem MQL5 que enviará mensagens para o Telegram por meio de um bot. Configuraremos os parâmetros necessários, incluindo o token de API do bot e o identificador do chat, e então realizaremos uma requisição HTTP POST para entregar as mensagens. Em seguida, processaremos a resposta para garantir a entrega bem-sucedida e lidaremos com possíveis erros.
Reconhecimento de Padrões Usando Dynamic Time Warping em MQL5 Reconhecimento de Padrões Usando Dynamic Time Warping em MQL5
Neste artigo, discutimos o conceito de dynamic time warping como uma forma de identificar padrões preditivos em séries temporais financeiras. Veremos como ele funciona e também apresentaremos sua implementação em MQL5 puro.
Técnicas do MQL5 Wizard que você deve conhecer (Parte 32): Regularização Técnicas do MQL5 Wizard que você deve conhecer (Parte 32): Regularização
A regularização é uma forma de penalizar a função de perda em proporção ao peso discreto aplicado ao longo das várias camadas de uma rede neural. Vamos observar a importância de algumas formas de regularização e o impacto que isso pode ter em testes realizados com um Expert Advisor montado por um assistente.
Integração MQL5: Python Integração MQL5: Python
Python é uma linguagem de programação bem conhecida e popular, com muitos recursos, especialmente nas áreas de finanças, ciência de dados, Inteligência Artificial e Aprendizado de Máquina. Python é uma ferramenta poderosa que também pode ser útil no trading. O MQL5 nos permite usar essa poderosa linguagem como uma integração para alcançar nossos objetivos de forma eficaz. Neste artigo, compartilharemos como podemos usar Python como uma integração no MQL5, depois de aprender algumas informações básicas sobre Python.