Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 48

 
Dr. Trader:

Há algum tempo que experimento com o RNeat, e concluí que ele não pode ser tratado da mesma forma que as redes neurais convencionais.

Obrigado por partilharem as vossas descobertas, é muito interessante...

Tomei o seu exemplo com íris e o reescrevi para caber nos meus dados e recebi um erro, o que está errado, não entendo. Eu quero saber se você tentou usar seus dados assim como a íris, qual foi o resultado em comparação com a grade normal?

 
Artigo interessante sobre a avaliação de modelos de classificação.
 
Dr. Trader:

Eu experimentei um pouco mais com o RNeat e cheguei à conclusão de que ele não pode ser tratado da mesma maneira que as redes neurais convencionais.

1) Ao contrário dos modelos convencionais, o treinamento RNeat não utiliza dados brutos. O modelo é uma espécie de gerado aleatoriamente, melhorado e só no final é testado em dados brutos. Tipicamente, os modelos usam dados brutos, constroem sua lógica sobre eles e depois usam a amostragem de validação para ver se a lógica do modelo está correta, ou se ele simplesmente aprendeu os exemplos brutos. Ao contrário dos outros, o RNeat não é capaz de memorizar os dados em bruto, pois não sabe nada sobre eles, tudo o que o modelo sabe são os resultados necessários e o quão próximo está deles.

2) A validação cruzada não vai ajudar a melhorar os resultados da frente. Todos nós parecemos concordar que é possível treinar um modelo normal, executar algumas validações cruzadas e, de alguma forma, lidar com os erros em todas as amostras para a pontuação final de aptidão física do modelo. Como o RNeat não conhece os dados brutos, não se importa se os dados estão em um treinamento ou em uma amostra de teste, ele ajustará sua lógica para o resultado desejado em qualquer caso. Teoricamente, ele "aprenderá" (mais precisamente, mude :) ) com todas as amostras que são usadas na função de fitness. Tudo o que você pode fazer é treinar o modelo com a precisão certa e esperar que ele não treine demais, uma abordagem bastante arriscada para forex. A validação cruzada só pode ser utilizada após o treino como uma estimativa final de um possível resultado no teste inicial, e de forma alguma utilizar esta amostra de validação dentro da função de aptidão.

Na validação cruzada, os parâmetros de treinamento são captados. Há algum parâmetro neste NS? Devia haver.
 
mytarmailS:

Por favor me diga exatamente que você tentou substituir seus próprios dados além da íris, quais foram os resultados comparados com a rede usual?

Tenho usado dados do forex (eurusd d1 há um ano), o modelo já vem aprendendo há um dia, ele mostra sua melhor estimativa = 0,017 (quanto mais melhor, para a íris foi 0,7). Até agora nenhum resultado real, o modelo mostra 50% de erro mesmo nos dados do treinamento e eu tenho que deixá-lo aprender por mais alguns dias.

Alexey Burnakov:
No treinamento de validação cruzada, os parâmetros são captados. Há algum parâmetro neste NS? Tem de haver.

O modelo está ficando cada vez mais complicado e está adicionando mais e mais neurônios. Há um parâmetro que define o número máximo de neurónios para limitar o seu crescimento. E um segundo parâmetro que define o número de indivíduos na genética. Normalmente, quanto mais, melhor, um limite é introduzido para poupar memória e tempo, é melhor usar o valor máximo permitido para si em vez de pegar.

O modelo, a julgar pelas descrições, tem um preço para cada neurônio e conexões entre eles, por isso procura usar o menor número possível de neurônios. Se o treinamento for bem sucedido, o modelo alcançará a precisão necessária antes de atingir o número máximo de neurônios.

 
Dr. Trader:

Adicionei dados de forex (eurusd d1 para um ano), o modelo já está aprendendo por um dia e mostra sua melhor estimativa = 0,017 (quanto mais melhor, para Iris foi 0,7). O modelo mostra 50% de erro mesmo nos dados do treinamento e eu tenho que deixá-lo aprender por mais alguns dias.

Há muitos palpiteiros?
 
SanSanych Fomenko:
Artigo interessante sobre a estimativa de modelos de classificação.

Eu tentei 3 métricas diferentes para estimar modelo no subconjunto de preditores: Precisão como neste artigo; modelo R^2; e apenas a média de erro do modelo média(abs(y-x)/(max(y)-min(y)), onde X é vetor de resultados de predição e Y é resultado requerido).

A precisão das funções de fitness era boa, mas eu tive um problema com poucos exemplos na amostra, a precisão sai muito escalonada. Dois modelos, semelhantes em qualidade, acabaram de dar o mesmo resultado. Mas se há muitas amostras de treinamento e validação, seria uma boa métrica. Eu não posso dizer nada sobre as demais métricas descritas no artigo.

R^2 em geral se comportou de forma estranha, poderia até ser negativo, enquanto mais de 50% dos resultados foram corretos, em geral eu não gostei.

O erro médio me assentava melhor. Passo a passo como em precisão não está presente, porque substituo na fórmula o resultado da regressão, mesmo antes de arredondar para as classes 0 ou 1. Mesmo que dois modelos dêem o mesmo resultado para as aulas, ainda posso determinar o melhor, em termos de quanto o resultado da regressão está "mais próximo" dos resultados desejados.

mytarmailS:
Há muitos palpiteiros?

Cerca de 400

 
Algum de vocês sabe alguma coisa sobre a análise espectral de Fourier? Preciso de ajuda.
 
mytarmailS:
Tipos aqui que sabem pelo menos um pouco sobre a análise espectral de Fourier. Preciso de ajuda.
O que não está tão claro? Decomponha uma função periódica em harmónicos e obtenha um espectro.
 
Yury Reshetov:
Porque é que não está claro? Nós decompomos uma função periódica em harmónicos e obtemos um espectro.

Isso é verdade, mas a minha tarefa é diferente...

Preciso encontrar semelhanças na PA aquelas áreas que estão próximas umas das outras, a proximidade pode ser medida por correlação, métrica euclidiana, etc... De acordo com as minhas experiências compreendi que tais métricas não são adequadas para a minha tarefa penso que se adequam muito bem à procura de proximidade através da amplitude, fase, frequência... Mas como tal não se faz ideia, por isso pergunto quem sabe como e o quê, o que é correcto, o que não é, como deve ser em geral.

P.S. você pode em particular, não para fora, em princípio, a conversa não é sobre o assunto deste ramo e é pouco provável que alguém interessante

 
Yury Reshetov:
O que não está claro aí? Nós decompomos uma função periódica em harmónicos e obtemos um espectro.
Porquê periódico?
Também podemos decompor um único pulso, que não é periódico de todo)