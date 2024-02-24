Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1806
Olá, pessoal.
Estou usando o Deep Reinforcement Learning (usando Python) e o aprendizado já está acontecendo (como mostrado):
Hoje eu só uso médias móveis como observação do mercado para aprender.
Este modelo realiza diversas ações (comprar, vender e esperar). Assim, após o treinamento, o modelo converge em muitas ações para "esperar" apenas com as melhores ações.
No entanto, neste modelo o treino é muito lento porque utiliza todas as carraças.
O que você sugere como dados de observação do mercado para melhorar a precisão e reduzir as perdas?
Peço desculpa pelos meus erros de tradução.
O que você propõe como dados de observação do mercado para melhorar a precisão e reduzir as perdas?
1) Criar um modelo de mercado e treinar um agente nele, isso vai reduzir a dimensionalidade e acelerar o treinamento, mesmo aqui foi feito
2) Escolha de características, é como dizem uma tarefa criativa, se há muitas delas então também ajudará a reduzir a dimensionalidade, há muitas delas do clustering ao pca, ump etc.
Se tomarmos níveis de suporte e resistência e decidirmos comprar ou vender apenas se o preço estiver nesse nível, podemos diminuir a amostra de treinamento por ordens de magnitude.
Você poderia combinar todos os pontos juntos .
Afaste as carraças para um erro aceitável.
Identificar as áreas onde o erro excede o erro aceitável quando todas as carraças são removidas.
Treine o modelo para encontrar tais áreas, se ele puder, é claro))))
Bem, estes são modelos espaciais estatais, eles também funcionam de vez em quando.
E você pode amarrar o alvo a uma mudança na tendência. A tarefa não é lucrar, mas reconhecer e prever. É evidente que são tarefas completamente diferentes, NS não é capaz de reconhecer e prever ao mesmo tempo)))) O lucro alvo, o saldo reconhece pontos de viragem indirectamente, sem reconhecimento directo.
Se fizermos inversões diárias, de 4 horas, de hora em hora (ou qualquer outra) e olharmos, por exemplo, para cada (todos) os 120 compassos e 120 ticks antes e depois do ponto de viragem. O relógio diário e de 4h só até à próxima e anterior inversão ou não sabem como fazê-lo melhor. Alguma coisa deve ser escrita manualmente então, é claro, para preparar os dados.
Ou há algo semelhante.
Ou você pode amarrar o alvo a uma mudança de tendência. A tarefa não é lucrar, mas reconhecer e prever. É claro que são tarefas completamente diferentes, NS não pode reconhecer e prever ao mesmo tempo)))) O lucro alvo, o saldo reconhece pontos de viragem indirectamente, sem reconhecimento directo.
Se fizermos inversões diárias, de 4 horas, de hora em hora (ou qualquer outra) e olharmos, por exemplo, para cada (todos) os 120 compassos e 120 ticks antes e depois do ponto de viragem. O relógio diário e de 4h só até à próxima e anterior inversão ou não sabem como fazê-lo melhor. Alguma coisa deve ser escrita manualmente então, é claro, para preparar os dados.
Ou há algo semelhante?
Penso que o reforço profundo é apenas usado para tarefas multivariadas, não para 1-5 dimensões, como nos mercados financeiros. Assim você pode tentar métodos mais simples e rápidos como o REINFORCE com rede neural ou aproximador linear.
Isto é muito facilmente verificado pela presença de regularidade entre as quebras em ziguezague, ou seja, a redução da entropia. Se houver uma diferença de alguém, então você pode olhar. Mas eu ainda não encontrei tais coisas. Existem embalagens especiais, usadas na medicina para analisar o ADN e derivar as fórmulas dos medicamentos. Por exemplo, entropia de permutação ou casos mais complicados com aproximadores, otimizadores como o q-learning.
Nah, a regularidade da fractura não funciona)))) Algo antes de uma fratura precisa ser capturado sem considerar a regularidade) Em geral, há uma chance de capturar as fraturas que têm as mesmas diferenças da SB antes da fratura. Não se pode fazer isso com pacotes normais. E acho que não há nada de significativo para uma pausa no meio da tendência, a não ser a tendência ser muito longa))))
Nah, a regularidade da fractura não funciona)))) Algo antes de uma fratura precisa ser capturado, sem considerar a regularidade) Em geral, há uma chance de capturar as fraturas que têm as mesmas diferenças em relação à OP antes da fratura. Não se pode fazer isso com pacotes normais. E acho que não há nada de significativo para uma pausa no meio da tendência, a não ser a tendência ser muito longa))))
Bem, eu vejo, por analogia com a correlação TF. Pode tentar
Se você olhar para TFs diferentes, você terá mais dimensões))))
Estou a ver, por analogia com a correlação TF. Podemos tentar.
Sim. Apenas as TFs devem ser examinadas, as que são necessárias de uma só vez não podem ser determinadas. Talvez um ou dois TF seria melhor, ou talvez todos eles sejam necessários)))). É difícil pensar bem nisso)).