Discussão do artigo "Floresta de Decisão Aleatória na Aprendizagem por Reforço" - página 2
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Esqueci de acrescentar. A solução, em jogos estratégicos, é a combinatória (busca de combinações repetidas), análise probabilística, determinação do psicótipo do oponente e criação de um modelo comportamental.
Saudações, sobre o psicótipo - certamente não se aplica ao mercado. Por outro lado, a RL é, em grande parte, um legado da teoria dos jogos. Por exemplo, você pode pensar em vários agentes de RL como jogadores concorrentes, cada um tentando vencer os outros. Como alternativa, faça com que eles se reforcem mutuamente.
Essencialmente, é elaborada uma matriz de pagamento entre o mercado e o agente. E se a estratégia do mercado não mudar, o agente começa a vencê-la, quando possível.Eu estava apenas sugerindo que talvez a máquina certa devesse ter algo não certo adicionado a ela, semelhante às ações humanas. Por exemplo, primeiro movimento e2 - e4, depois segundo movimento e4 - e2, terceiro movimento novamente e2 - e4. Basicamente, algo assim.
A tarefa não é fazer com que a negociação seja semelhante à negociação humana (e como você sabe disso, o bot tem que passar no teste de Turing?) e o que faz você pensar que um ser humano é capaz de negociar bem ou melhor do que um Expert Advisor, tudo depende da estratégia. O objetivo é que a própria máquina procure alguns padrões e os negocie.
Eu estava apenas sugerindo que talvez a máquina certa devesse ter algo não certo adicionado a ela, semelhante às ações humanas. Por exemplo, primeiro movimento e2 - e4, depois segundo movimento e4 - e2, terceiro movimento novamente e2 - e4. Você sabe, algo assim.
Esse é o Random Forest, seu ponto principal: ele forma o livro de abertura por si só.
Maxim, há algum efeito de tentar gerar novas árvores aleatórias? Por exemplo, na primeira vez que geramos uma árvore, na segunda vez geramos outras árvores, que são treinadas com mais eficiência. Ou isso não afeta em nada o resultado final do treinamento?
Obrigado por compartilhar esse artigo muito útil.
Eu estava tentando implementar indicadores adicionais no código, mas não sou um programador especialista e não tenho boa experiência no uso de funções de associação e, portanto, não consegui entender como adicionar mais indicadores para serem usados junto com as regras dentro da função OnInit(). O código contém apenas o indicador RSI e cria as regras de COMPRA e VENDA a partir dele. Você poderia fornecer mais alguns códigos de exemplo de indicadores, como média móvel, MACD, estocástico ou SAR, para serem usados no código?
Em especial, gostaria de saber como criar regras e adicionar condições de entrada ao compará-las com o preço atual. O principal problema com o código atual é que, às vezes, ele mantém as negociações perdidas por muito tempo enquanto fecha as lucrativas rapidamente. Acho que é preciso fazer mais filtros na lógica de saída.
Além disso, tenho uma pergunta que você pode responder, por favor:
O arquivo OPT é atualizado continuamente para melhorar as entradas e saídas ao longo do tempo, ajustando a própria política?
Ou o EA apenas usa o testador de estratégia para otimizar os valores do EA e usa os mesmos valores de entrada e saída que foram lucrativos recentemente, como um EA otimizado regular?
Quero dizer, como outros EAs de rede neural, ele faz o ajuste fino de sua política geral de entrada e saída de negociações durante o curso da negociação?