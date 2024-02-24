Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 192

Yury Reshetov:

O mundo inteiro tem estado à espera deste momento com a respiração suspensa.

E agora finalmente aconteceu!

A versão 12 do jPrediction, que gera código de classificadores ternários treinados em MQL, foi liberada. Os usuários do MetaTrader não precisam mais portar códigos de classificadores ternários de Java para MQL. Todo o código para MQL é agora armazenado em arquivos com extensão mqh.

Mas isso não é tudo. jPrediction 12 é agora cerca de 12% mais rápido do que a versão anterior!

Muitos usuários do jPrediction podem baixar e usar a versão 12 gratuitamente, baixando-a do meu site (link no meu perfil, primeiro post na minha página inicial).

Parabéns são aceitos tanto verbalmente quanto por escrito, você também pode receber presentes e transferências de dinheiro via WebMoney.

Tenho vergonha de lhe perguntar qual versão do MKUL? 4 ou 5????
 
Mihail Marchukajtes:
Tenho vergonha de perguntar, para qual versão do MKUL? 4 ou 5????
Eu verifiquei na versão 5. Mas não há OOP e outras características típicas apenas para a versão 5. Então, parece que deve haver compatibilidade com os 4? IMHO, claro, porque eu não verifiquei o 4.
 
Yury Reshetov:
Eu verifiquei na 5ª versão. Mas não há OOP e outras características típicas apenas dos 5. Então parece que deve haver compatibilidade com a 4ª, certo? Claro, acho que não, já que não verifiquei no 4.

Ótimo, acabei de verificar o código que o Prediction gera com o código que eu escrevi, o resultado é o mesmo. Eu só estava preocupado se eu tivesse um erro, como você se lembra com 1d, agora que eu verifiquei, o resultado é idêntico. A partir de hoje a selecção do sinal de compra foi tão má que decidi sair do de ontem e não perdi, e optimizei os 12 lançamentos com melhores resultados mas tenho menos entradas... Tenho apenas três. Por isso, no geral, tudo bem, mas terá de ver mais detalhes amanhã. Por isso, amanhã vou relatar mais especificamente.... Seja como for, a pintura a óleo de hoje... julgue por si mesmo.....Grief para reclamar. E deixe-me explicar novamente, os sinais que a rede definiu como "Eu não sei" (pontos sem setas). Nós determinamos pelo facto. Pois hoje é verdade. Quando a rede diz "não sei", queremos dizer que é verdade...

 
Yury Reshetov: A versão 12 do jPrediction foi lançada...
Hoje é o mesmo dia de ontem, por isso decidi não voltar a treinar os modelos, mas sim a negociá-los. Então ainda não posso avaliar totalmente o trabalho do 12º lançamento. Mas quando chegar o momento, eu vou relatar :-)
 

encontrei um pacote que lhe permite aprofundar os algoritmos MoD, eu não o entendo de todo, mas algo me diz que o pacote é bom, talvez alguém esteja interessado...

partykit

 
A 14ª versão do jPrediction está fora.

A nova versão tem um algoritmo melhorado para identificar e remover preditores insignificantes dos modelos

Você pode baixaro jPrediction 14 gratuitamente e usá-lo para tarefas de classificação baixando-o do meu site (link no meu perfil, post mais alto na minha página inicial).

 

Exemplos (indicadores) são apenas para ilustração Não recomendo o uso de indicadores

Vamos por um momento imaginar a seguinte situação: temos 5 preditores e o preço, precisamos prever o movimento do preço com alta probabilidade( digamos, mais de 70%) e sabemos de antemão que existe apenas um padrão nesses preditores que pode ser usado para prever o mercado com tal precisão. É quandoo RSI e o stochastic fazem um mini ziguezague na área de ~50


A propósito, o padrão está, por assim dizer, em dois planos de visão, digital (padrão na área ~50 ) e figurativo (ziguezague - imagem), por isso quando se procura padrões faz sentido considerar tais planos...

É tudo, não há mais padrões de trabalho nesses preditores, tudo o resto é apenas ruído, esses três primeiros indicadores são originalmente ruído, e noRSI e stochastic há apenas um padrão, tudo o resto noRSI e stoch também é ruído total...

Agora vamos pensar em como podemos procurar tais padrões nos dados... Os MOs convencionais podem fazê-lo?

A resposta é não, porquê?

Porque o objectivo do MO é prever todos os movimentos, ou é um ziguezague ou uma cor de traço ou... velas ou direção ou... ou.. .todos os alvos forçam os MOs a prever todos os movimentos de preços , e isto é impossível em preditores de ruído abaixo de 99%...

Vou contar uma pequena história com moral, criei uma amostra sintética de 20 preditores, 4 preditores interagindo juntos, explicando completamente o alvo, os outros 16 preditores eram apenas ruído aleatório, após treinamento em novos dadosmodelo"OOS" adivinhou todos os novos valores, ele mostrou erro 0%.... A moral desta fábula é: se houver preditores nos dados que possam explicar completamente o alvo, tanto o IM será treinado e oOOS se comportará normalmente... Nossos resultados mostram o contrário, naquelas amostras que alimentamos no IM há mais de 5% de informação útil que pode explicar 5% do alvo, e nós queremos 100% disso, você sabe Utopia de abordagem? É por isso que os MOs supertreinam, nós mesmos os fazemos supertreinar-se querendo prever tudo a 100%.

Então voltando ao ponto principal, como procuramos estes padrões de trabalho? Como encontramos essa "agulha" de robustez na "pilha " de dados?

Sugiro que, em princípio, nos livremos do MO, tudo o que precisamos é apenas quebrar cada preditor em pequenos pedaços de situações semelhantes (padrões) e , tentando todas as combinações possíveis e comparando com o alvo, encontraremos o que procuramos... Agora, como quebrar os preditores? Com o quê?

A resposta é simples, mesmo que eu não tenha percebido logo, só precisamos estupidamente agrupar cada preditor em, digamos, 30 agrupamentos.

Nós apenas dividimos cada preditor para esses clusters e tentamos combinações diferentes entre eles podemos encontrar alguns padrões que funcionam, como na figura - quando o estocástico tem cluster 1 e o RSI tem cluster 2, haverá crescimento...

Agora a essência de como procurar por padrões de trabalho

Esta é a nossa amostra hipotética,alvo.O rótulo é o alvo, o que significa crescimento/declínio.

dat cluster1 cluster2 cluster3 cluster4 cluster5 alvo.
                                                
                                                  
                                                   
                                                
                                                
                                                 
                                                 
                                                 
                                                  
                                                 
                                                 
                                                 
                                                  
                                                
                                                 
                                                
                                               
                                                 
                                                 
                                                
                                                 rótulo1        24        5       18       21       16            1
2         2       15       12        7       22            1
3        13       13       16       29       24            0
4        23       28       22       10        4            1
5         6       12       20       25       11            0xml-ph-00
Tabela 1

Exemplo de como procurar o crescimento

procuramos linhas que são repetidas pelo menos 10 vezes em toda a amostragem e em cada um dos grupos encontrados idênticos que foram repetidos, o número de "1" no target.label deve ser mais de 70% a partir de "0".


cluster1 cluster2 cluster3 cluster4 cluster5 target.label                   
                                                 
                                                 
                                                 
                                                 
                                                1        24        5       18       21       16            1
2        24        5       18       21       16            1
3        24        5       18       21       16            0
4        24        5       18       21       21 16            1
5        24        5       18       21xml-ph-0032@dee
 Talb. 2
aqui estão as linhas idênticas encontradas com mais umas do que zeros...


Foi essencialmente assim que encontramos a combinação de clusters que é um padrão de trabalho...


Também é necessário não só tentar todas as combinações possíveis de números de clusters em cada preditor, mas também combinações de clusters propriamente ditos que levam apenas 1 e 4 clusters ou 1, 3, 5 clusters, etc...


Vantagens do método sobre o MO habitual, ou melhor, nem sequer vantagens, é o que está ausente no MO, mas o senso comum diz que deve ser...
1)O método explica apenas a parte do alvo que pode realmente explicar e não tenta explicar todos os 100% do alvo como todos os PMs fazem, incluindo Reshetova
2)O método é profundo - não apenas seleciona os melhores preditores, ele seleciona as melhores situações dentro dos próprios preditores, ele é uma forma de análise muito mais profunda do que outros IRs.
3) Devido aos itens 1) e 2), o método encontra automaticamente os indicadores que
separar perfeitamente o plano de características 
4) existe alguma barreira estatística justa quando encontramos um grupo de situações idênticas (ver tabela 2) deve haver um mínimo de 10 (é possível regular), este mínimo dá esperança de que o resultado estatístico sobre o alvo seja fiável, nos MOs convencionais só podem existir duas situações semelhantes que no alvo terminaram, digamos, em queda e todas! MO já o considerará como um padrão curto, com apenas duas observações, compreenderá o arrepio da situação ?
5) Existe uma barreira de probabilidade justa , quando encontramos um grupo de situações idênticas, ver Tabela 2, o número de situações neste grupo (por um longo período) deve ser superior em 70% do que zeros, o que também dá esperança de que a probabilidade seja forte e não aleatória... Mais uma vez não o temos em MO normal onde 1% dos zeros seria um padrão de saudade, também é assustador, não é?
6) Algoritmo funciona com correlações em preditores e nem todos os IRs o fazem.
7) É fácil visualizar ou programar o padrão encontrado, basta colocar que você pode simplesmente entender
 interpretar o padrão, nem todos os IRs o podem fazer
Os exemplos (indicadores) são apenas para ilustração, recomendo fortemente contra o uso de indicadores
 
mytarmailS:

Não tenho bem a certeza do que quer dizer com "aglomeração". Normalmente você não agrupa um preditor em particular, mas pega uma dúzia deles, e encontra áreas no espaço onde esses pontos se agrupam. Por exemplo, na figura abaixo, tendo dois preditores, o agrupamento em 2 clusters nos dará clusters azuis e vermelhos.

Talvez estejas a falar de padrões? Padrão verde - o preço desce e depois sobe. Amarelo: o preço sobe. Vermelho: acima-> abaixo. Conseguiste?

