Discussão do artigo "Redes Neurais de Maneira Fácil (Parte 11): Uma visão sobre a GPT"

MetaQuotes 2021.05.04 14:01

Novo artigo Redes Neurais de Maneira Fácil (Parte 11): Uma visão sobre a GPT foi publicado:

Talvez um dos modelos mais avançados entre as redes neurais de linguagem atualmente existentes seja a GPT-3, cuja variante máxima contém 175 bilhões de parâmetros. Claro, nós não vamos criar tal monstro em nossos PCs domésticos. No entanto, nós podemos ver quais soluções arquitetônicas podem ser usadas em nosso trabalho e como nós podemos nos beneficiar delas.

A nova classe da rede neural foi testada no mesmo conjunto de dados, que foi usado nos testes anteriores: EURUSD com o intervalo de tempo H1, os dados históricos das últimas 20 velas são alimentadas na rede neural.

Os resultados do teste confirmaram a suposição de que mais parâmetros requerem um período de treinamento mais longo. Nas primeiras épocas de treinamento, um Expert Advisor com menos parâmetros mostra resultados mais estáveis. No entanto, conforme o período de treinamento é estendido, um Expert Advisor com muitos parâmetros mostram melhores valores. Em geral, após 33 épocas o erro do Fractal_OCL_AttentionMLMH_v2 diminuiu abaixo do nível de erro do EA Fractal_OCL_AttentionMLMH, e ainda permaneceu baixo.

Autor: Dmitriy Gizlyk

Aka Shaxrik 2021.02.10 11:07 #1

como podemos usar isso

Aleksey Mavrin 2021.02.10 12:30 #2

Poderoso! Ainda não houve desistência?

JuniorFurtado 2021.02.28 17:49 #3

Muito obrigado por seus artigos. Seus algoritmos são muito bons, para mim são os melhores algoritmos do mql5 para redes neurais, pois permitem atualizar a rede em tempo real, durante o mercado, linha por linha. Estou testando seus algoritmos no mercado futuro brasileiro e os resultados são animadores, a previsão atingiu uma eficiência de mais de 80% nas últimas 100 barras, o que levou a negociações positivas. Aguardo ansiosamente o próximo artigo.

Discussão do artigo "Análise Discussão do artigo "Florestas Aprendizado de máquina no

Anthony Eric Gillon Dawson 2021.04.02 13:44 #4

MetaQuotes:

Novo artigo Redes neurais facilitadas (Parte 11): A take on GPT foi publicado:

Autor: Dmitriy Gizlyk

Material interessante, mas o código está todo em uma enorme tigela de espaguete, muito difícil de entender. Uma classe por arquivo teria sido mais fácil.

Seria bom ter um diagrama mostrando como todas as classes são mantidas juntas.

No momento, estou no NeuronBase, que é derivado do Object, mas usa o NeuronProof, que é derivado do NeuronBase, e também o Layer, que usa praticamente todos os tipos de classe Neuron definidos.

É necessário fazer muitas declarações para colocar tudo em arquivos separados e começar a lidar com isso.

Talvez seja mais fácil começar do zero e usar os conceitos que você explicou nos vários capítulos.

Tentei executar o spaghetti bowl, que fez minha GPU fumegar e, infelizmente, não produziu nada muito útil.

De qualquer forma, obrigado pelo excelente material.

:-)

Grande EA no backtest! Discussão do artigo "Biblioteca Mais estratégias? Sem problemas!

Dmitriy Gizlyk 2021.04.02 14:55 #5

Anthony Eric Gillon Dawson:

O material é interessante, mas o código está todo em uma enorme tigela de espaguete, o que dificulta muito a compreensão. Uma classe por arquivo teria sido mais fácil.

Seria bom ter um diagrama mostrando como todas as classes são mantidas juntas.

No momento, estou no NeuronBase, que é derivado do Object, mas usa o NeuronProof, que é derivado do NeuronBase, e também o Layer, que usa praticamente todos os tipos de classe Neuron definidos.

É necessário fazer muitas declarações para colocar tudo em arquivos separados e começar a lidar com isso.

Talvez seja mais fácil começar do zero e usar os conceitos que você explicou nos vários capítulos.

Tentei executar o spaghetti bowl, que fez minha GPU soltar fumaça e, infelizmente, não produziu nada muito útil.

De qualquer forma, obrigado pelo excelente material.

:-)

Olá,
Verifique o arquivo NN.chm. Talvez ele possa lhe ajudar.

Anthony Eric Gillon Dawson 2021.04.06 07:52 #6

Dmitriy Gizlyk:

Olá,
Check NN.chm. Talvez ele o ajude.

Hi,

Sim, obrigado.

O código não está tão ruim agora e posso ver claramente como alterar a arquitetura da rede, se necessário.

Tenho tudo em arquivos de classe separados, além de uma tigela de espaguete muito menor, o que ainda é necessário porque o mt5 tem tanto a definição quanto as implementações nos mesmos arquivos.

Tentei fazer algum treinamento em GBPUSD usando o código como está, mas os resultados não parecem ser bons: o erro sobe de 50% para 70% e permanece lá, sem melhora nas épocas subsequentes.

Alguma sugestão de onde começar a fazer os ajustes?

A propósito, esta linha:

#define  FileName        Symb.Name()+"_"+EnumToString((ENUM_TIMEFRAMES)Period())+"_"+IntegerToString(HistoryBars,3)+StringSubstr(__FILE__,0,StringFind(__FILE__,".",0))

Precisa ser corrigida para:

#define  FileName        Symb.Name()+"_"+EnumToString((ENUM_TIMEFRAMES)Period())+"_"+IntegerToString(HistoryBars)+StringSubstr(__FILE__,0,StringFind(__FILE__,".",0))

Ou não funcionará corretamente. Pelo menos não funcionou na versão mais recente do MT5. Além disso, tenho certeza de que a intenção de ter espaço no nome do arquivo não era de ninguém.

Perguntas sobre OOP em Discussão do artigo "Técnicas Retrocesso/Optimização

Gergely Szabó 2022.12.31 13:07 #7

Hi :) Baixei o código-fonte e o compilei sem nenhum erro. No terminal, o expert gera uma mensagem de erro para mim e fecha. Você pode me ajudar, por favor, qual é o problema?

seu início de corrida, treinar um pouco e errar.

Gergely Szabó 2023.01.01 20:19 #8

Olá novamente :) Encontrei o problema. Na pasta include, a configuração do Opencl estava falhando, porque testei meu sistema e a GPU não suporta o código, apenas a CPU.

Enrique Enguix 2023.04.13 10:27 #9

No início, eu não estava entendendo o artigo, porque não estava entendendo a ideia principal.

Quando perguntei ao próprio ChatGPT sobre esse texto, ele esclareceu bastante as coisas e eu entendi a maior parte do que estava lendo:

"O algoritmo Transformer é um modelo usado para processar linguagem natural, ou seja, texto. Esse modelo divide o texto em uma sequência de palavras (ou "tokens") e, em seguida, executa uma série de operações em cada uma dessas palavras para entender melhor seu significado.

Uma das operações que o modelo executa é a autoatenção, que consiste em calcular a importância que cada palavra tem em relação às outras palavras da sequência. Para fazer isso, o modelo usa três vetores: o vetor de consulta, o vetor-chave e o vetor de valor, que são calculados para cada palavra.

Em seguida, o modelo calcula a atenção, que é a importância que cada palavra tem em relação às outras palavras da sequência. Ele usa uma função matemática chamada softmax para normalizar os coeficientes de atenção.

Por fim, o modelo combina todas as operações de autoatenção para produzir um resultado final, que é usado para prever o significado do texto.

Em resumo, o algoritmo Transformer usa operações matemáticas complexas para entender o significado do texto."

Discussão do artigo "Redes Aprendizado de máquina e Comparação da média móvel

1432189 2024.05.28 11:16 #10

Gergely Szabó #:
Olá novamente :) Encontrei o problema. Na pasta include, a configuração do Opencl falhou, porque testei meu sistema e a GPU não suporta o código, apenas a CPU.

Estou tendo o mesmo erro, você pode me explicar como resolveu o problema?

Novo comentário