Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 77

 
Um resultado muito bom para o R, uma vez que todos os outros idiomas são usados para muitos fins diferentes, e o R é apenas para o tratamento de dados.
 
Dr. Trader:
Muito bom resultado para R, considerando que todas as outras línguas são usadas para muitos fins diferentes e R apenas para o tratamento de dados.

Já tentou treinar os meus dados?

Fiz uma experiência de 5 dias. Estou apenas a torturar o EURUSD!

Fiz 99 amostras de treino do tamanho que eu afixei aqui. Todas elas são únicas, pois contêm observações com tempo limitado. Estou treinando modelos sobre eles e farei um comitê de florestas de GBM. Já tenho alguns resultados interessantes na validação, embora só tenha passado por 18 amostras em 24 horas. Dito isto, eu fiz 2,5 vezes a validação e depois mostro porquê!

Como você pode ver, na primeira amostra de treinamento o modelo treinado de modo que para 400 K observações em validação eu consegui MO de 2,7 pontos (incluindo spread).

Bem, ainda há 1, 1,5 pontos de resultados, normal. Tudo isso será empilhado em comitê mais tarde e vamos ver o que a imagem estará finalmente em validação! Eu prevejo uma nota de 4 ou 4+ para os trabalhos de casa.

Força, cavalheiros.

PS: dados de treinamento - 99 amostras para diversificação e comitê: https://drive.google.com/open?id=0B_Au3ANgcG7CNG5JT3R2UzI0UzQ

 

Sim, eu tentei, não funcionou da primeira vez. Para estimar o modelo eu tomei a precisão do resultado da regressão (resultado requerido escalado em [0;0.5;1] menos o resultado obtido, modulo). A genética encontrou um máximo global com um par de preditores, quando o neurônio não tem dados suficientes para o treinamento, então ele retorna 0,5 em quase todos os dados (combinando com a classe "não negociar"). Em geral essa função de adequação não é de todo adequada, a rede simplesmente não negocia como resultado.

Agora a segunda experiência ainda está em curso. Eu ainda uso 3 classes mas imediatamente arredondo o resultado da regressão para os níveis [0;0.5;1]. A estimativa é a precisão de classificação ([número de respostas corretas] / [número total]). Pelo gráfico dos melhores valores de fitness em genética posso julgar que o resultado será próximo de 33%, essencialmente o mesmo que o aleatório. Talvez um pouco mais alto, se tiveres sorte. Tenho de esperar mais um ou dois dias até que a genética esteja no máximo, depois posso fazer a frente.

Nos meus preditores costumo obter melhores resultados, acho que é preciso acrescentar mais indicadores a estes dados. Se o seu algoritmo puder avaliar e descartar preditores, quanto mais indicadores você adicionar inicialmente, melhor.

 
Dr. Trader:

Sim, eu tentei, não funcionou da primeira vez. Para estimar o modelo eu tomei a precisão do resultado da regressão (resultado requerido escalado em [0;0.5;1] menos o resultado obtido, modulo). A genética encontrou um máximo global com um par de preditores, quando o neurônio não tem dados suficientes para o treinamento, então ele retorna 0,5 em quase todos os dados (combinando com a classe "não negociar"). Em geral essa função de adequação não é de todo adequada, a rede simplesmente não negocia como resultado.

Agora a segunda experiência ainda está em curso. Eu ainda uso 3 classes mas imediatamente arredondo o resultado da regressão para os níveis [0;0.5;1]. A estimativa é a precisão de classificação ([número de respostas corretas] / [número total]). Pelo gráfico dos melhores valores de fitness em genética posso julgar que o resultado será próximo de 33%, essencialmente o mesmo que o aleatório. Talvez um pouco mais alto, se tiveres sorte. Tenho de esperar mais um ou dois dias até que a genética esteja no seu máximo, depois poderei fazer a frente.

Nos meus preditores costumo obter melhores resultados, acho que é preciso acrescentar mais indicadores a estes dados. Se o seu algoritmo puder avaliar e descartar preditores, quanto mais indicadores você adicionar inicialmente, melhor.

Obrigado. Informe sobre os resultados.

Sobre o teu e o nosso. Há aqui bastantes preditores. O suficiente para o meu gosto. Eu só tenho cinco pares e 10 anos para cada um. É compreensível que um modelo leve mais tempo e mais lentamente do que um par e dois anos para aprender. Mas não quer dizer pior.
 
Ainda a tentar construir um grail???? Vá lá......
 
Mihail Marchukajtes:
Ainda a tentar construir o grail Vá lá......
alguém prometido no fim-de-semana para explicar o seu graal
 
Mihail Marchukajtes:
Ainda a tentar construir um grail???? Vá lá......
Troll, saia daqui.
 
Não, não, pessoal, o sistema vazou, não vale a pena mostrá-lo. Desculpas..... Sobre o tratado de classificação, sim... Eu posso... mas ainda não tenho tempo, assim que estiver livre e a minha criatividade vier por cima de mim, vou escrever de volta ..... Caso contrário.....
 
Mihail Marchukajtes:
Não, não rapazes, o sistema desapareceu, nem vale a pena mostrá-lo. Desculpas..... Em relação ao tratado de classificação, sim... pode... mas ainda não há tempo, assim que eu estiver livre e a minha criatividade vier sobre mim, vou escrever sobre isso..... Caso contrário.....

Eu me pergunto... Não escreveste que tens usado o teu algoritmo com sucesso durante um ano? Algumas horas atrás você escreveu " Ainda tentando construir um grail Vá lá......". o que implica que o algoritmo estava a funcionar há algumas horas atrás e depois desapareceu???????????????????? Isso não faz qualquer sentido na sua história....

Ouve, se tens alguma coisa para me dizer, então PM-me, porque eu fiz o mesmo que escreveste, estou interessado no tema.

 

Tem havido posts no tópico sobre o RNeat, que é um neurônio com topologia adaptativa, onde os pesos e conexões dos neurônios são formados usando a genética.
A julgar pela descrição e pelos testes simples, o modelo é bastante bom. Mas não é tão bom para forex. Durante uma semana tive treino a correr, prevendo comprar/vender no bar seguinte com 400 preditores.
O modelo de aprendizagem é demasiado lento, numa semana a aptidão física do modelo quase aumentou para apenas 2%. A precisão da previsão, mesmo nos dados de treinamento, é de apenas 55%, o modelo não teve tempo de evoluir para uma boa lógica para começar a gerar lucros.

A precisão nos dados de validação (barras aleatórias retiradas dos dados de treinamento) é um pouco melhor, mas é mais por acaso do que o mérito do modelo.
A precisão de fronttest varia entre 50% e 53% e a julgar pelo gráfico também é acidental e não devido ao modelo.
Nenhum milagre aconteceu, acho que o modelo vai evoluir para a lógica certa depois de meses de trabalho, mas ele vai se retrair com maus resultados na validação e por essa altura estará desatualizado e eu terei que começar tudo de novo.
Estou a parar a experiência; não vejo a utilidade de continuar.

Razão: