Discussão do artigo "Ciência de Dados e ML (Parte 33): Dataframe do Pandas em MQL5, Coleta de Dados para Uso em ML facilitada"

 

Novo artigo Ciência de Dados e ML (Parte 33): Dataframe do Pandas em MQL5, Coleta de Dados para Uso em ML facilitada foi publicado:

Ao trabalhar com modelos de aprendizado de máquina, é essencial garantir consistência nos dados usados para treinamento, validação e testes. Neste artigo, criaremos nossa própria versão da biblioteca Pandas em MQL5 para garantir uma abordagem unificada para o tratamento de dados de aprendizado de máquina, assegurando que os mesmos dados sejam aplicados dentro e fora do MQL5, onde ocorre a maior parte do treinamento.

Quando se trata de trabalhar com modelos de aprendizado de máquina, é essencial que tenhamos a mesma estrutura de dados, se não os mesmos valores, para todos os ambientes; treinamento, validação e testes. Com modelos Open Neural Network Exchange (ONNX) sendo suportados em MQL5 e MetaTrader 5, atualmente temos a oportunidade de importar modelos treinados externamente para a linguagem MQL5 e utilizá-los para fins de negociação.

Como a maioria dos usuários utiliza Python para treinar esses modelos de Inteligência Artificial (IA), que depois são implantados no MetaTrader 5 por meio de código MQL5, pode haver uma grande diferença na forma como os dados são organizados, e muitas vezes até mesmo os valores dentro da mesma estrutura de dados podem ser ligeiramente diferentes; isso ocorre devido à diferença entre as duas tecnologias.

  fonte da imagem: pexels.com

Neste artigo, vamos imitar a biblioteca Pandas disponível na linguagem Python. Ela é uma das bibliotecas mais populares, útil particularmente quando se trata de trabalhar com grandes volumes de dados.

Como essa biblioteca é usada por cientistas de dados para preparar e manipular dados utilizados no treinamento de modelos de ML, ao aproveitar sua capacidade, buscamos ter o mesmo ambiente de dados em MQL5 que em Python.


Autor: Omega J Msigwa