Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1806

 

Olá, pessoal.

Estou usando o Deep Reinforcement Learning (usando Python) e o aprendizado já está acontecendo (como mostrado):

Trabalho de aprendizado por reforço profundo


Hoje eu só uso médias móveis como observação do mercado para aprender.

Este modelo realiza diversas ações (comprar, vender e esperar). Assim, após o treinamento, o modelo converge em muitas ações para "esperar" apenas com as melhores ações.

No entanto, neste modelo o treino é muito lento porque utiliza todas as carraças.

O que você sugere como dados de observação do mercado para melhorar a precisão e reduzir as perdas?

Peço desculpa pelos meus erros de tradução.

 
ipsec:

O que você propõe como dados de observação do mercado para melhorar a precisão e reduzir as perdas?


1) Criar um modelo de mercado e treinar um agente nele, isso vai reduzir a dimensionalidade e acelerar o treinamento, mesmo aqui foi feito

2) Escolha de características, é como dizem uma tarefa criativa, se há muitas delas então também ajudará a reduzir a dimensionalidade, há muitas delas do clustering ao pca, ump etc.

Se tomarmos níveis de suporte e resistência e decidirmos comprar ou vender apenas se o preço estiver nesse nível, podemos diminuir a amostra de treinamento por ordens de magnitude.

Você poderia combinar todos os pontos juntos .

 
ipsec:

Olá, pessoal.

Estou usando o Deep Reinforcement Learning (usando Python) e o aprendizado já está acontecendo (como mostrado):


Hoje eu só uso médias móveis como observação do mercado para aprender.

Este modelo realiza diversas ações (comprar, vender e esperar). Assim, após o treinamento, o modelo converge em muitas ações para "esperar" apenas com as melhores ações.

No entanto, neste modelo o treino é muito lento porque utiliza todas as carraças.

O que você sugere como dados de observação do mercado para melhorar a precisão e reduzir as perdas?

Perdoe os meus erros de tradução

Afaste as carraças para um erro aceitável.

Identificar as áreas onde o erro excede o erro aceitável quando todas as carraças são removidas.

Treine o modelo para encontrar tais áreas, se ele puder, é claro))))

 
Maxim Dmitrievsky:

Bem, estes são modelos espaciais estatais, eles também funcionam de vez em quando.

E você pode amarrar o alvo a uma mudança na tendência. A tarefa não é lucrar, mas reconhecer e prever. É evidente que são tarefas completamente diferentes, NS não é capaz de reconhecer e prever ao mesmo tempo)))) O lucro alvo, o saldo reconhece pontos de viragem indirectamente, sem reconhecimento directo.

Se fizermos inversões diárias, de 4 horas, de hora em hora (ou qualquer outra) e olharmos, por exemplo, para cada (todos) os 120 compassos e 120 ticks antes e depois do ponto de viragem. O relógio diário e de 4h só até à próxima e anterior inversão ou não sabem como fazê-lo melhor. Alguma coisa deve ser escrita manualmente então, é claro, para preparar os dados.

Ou há algo semelhante.

 
Valeriy Yastremskiy:

Ou você pode amarrar o alvo a uma mudança de tendência. A tarefa não é lucrar, mas reconhecer e prever. É claro que são tarefas completamente diferentes, NS não pode reconhecer e prever ao mesmo tempo)))) O lucro alvo, o saldo reconhece pontos de viragem indirectamente, sem reconhecimento directo.

Se fizermos inversões diárias, de 4 horas, de hora em hora (ou qualquer outra) e olharmos, por exemplo, para cada (todos) os 120 compassos e 120 ticks antes e depois do ponto de viragem. O relógio diário e de 4h só até à próxima e anterior inversão ou não sabem como fazê-lo melhor. Alguma coisa deve ser escrita manualmente então, é claro, para preparar os dados.

Ou há algo semelhante?

É muito facilmente verificado pela presença de regularidade entre as quebras em ziguezague, ou seja, a redução da entropia. Se houver uma diferença em relação a alguém, então você pode olhar. Mas eu ainda não encontrei tais coisas. Existem embalagens especiais, usadas na medicina para analisar o ADN e derivar as fórmulas dos medicamentos. Entropia de reordenamento, por exemplo, ou casos mais complicados com aproximadores, otimizadores como o q-learning
 
ipsec:

Olá, pessoal.

Estou usando o Deep Reinforcement Learning (usando Python) e o aprendizado já está acontecendo (como mostrado):


Hoje eu só uso médias móveis como observação do mercado para aprender.

Este modelo realiza diversas ações (comprar, vender e esperar). Assim, após o treinamento, o modelo converge em muitas ações para "esperar" apenas com as melhores ações.

No entanto, neste modelo o treino é muito lento porque utiliza todas as carraças.

O que você sugere como dados de observação do mercado para melhorar a precisão e reduzir as perdas?

Desculpe pelos meus erros de tradução.

Penso que o reforço profundo é apenas usado para tarefas multivariadas, não para 1-5 dimensões, como nos mercados financeiros. Assim você pode tentar métodos mais simples e rápidos como o REINFORCE com rede neural ou aproximador linear.

 
Maxim Dmitrievsky:
Isto é muito facilmente verificado pela presença de regularidade entre as quebras em ziguezague, ou seja, a redução da entropia. Se houver uma diferença de alguém, então você pode olhar. Mas eu ainda não encontrei tais coisas. Existem embalagens especiais, usadas na medicina para analisar o ADN e derivar as fórmulas dos medicamentos. Por exemplo, entropia de permutação ou casos mais complicados com aproximadores, otimizadores como o q-learning.

Nah, a regularidade da fractura não funciona)))) Algo antes de uma fratura precisa ser capturado sem considerar a regularidade) Em geral, há uma chance de capturar as fraturas que têm as mesmas diferenças da SB antes da fratura. Não se pode fazer isso com pacotes normais. E acho que não há nada de significativo para uma pausa no meio da tendência, a não ser a tendência ser muito longa))))

 
Valeriy Yastremskiy:

Nah, a regularidade da fractura não funciona)))) Algo antes de uma fratura precisa ser capturado, sem considerar a regularidade) Em geral, há uma chance de capturar as fraturas que têm as mesmas diferenças em relação à OP antes da fratura. Não se pode fazer isso com pacotes normais. E acho que não há nada de significativo para uma pausa no meio da tendência, a não ser a tendência ser muito longa))))

Bem, eu vejo, por analogia com a correlação TF. Pode tentar

 
Maxim Dmitrievsky:

Acho que o reforço profundo é usado apenas para tarefas multivariadas, não para 1-5 dimensões, como nos mercados financeiros. Assim você pode tentar métodos mais simples e rápidos como o REINFORCE com rede neural ou aproximador linear.

Se você olhar para TFs diferentes, você terá mais dimensões))))

 
Maxim Dmitrievsky:

Estou a ver, por analogia com a correlação TF. Podemos tentar.

Sim. Apenas as TFs devem ser examinadas, as que são necessárias de uma só vez não podem ser determinadas. Talvez um ou dois TF seria melhor, ou talvez todos eles sejam necessários)))). É difícil pensar bem nisso)).

Razão: