Discussão do artigo "Floresta de Decisão Aleatória na Aprendizagem por Reforço"

Vasily Belozerov 2018.06.03 16:27 #11

Desculpe, Maxim, eu estava distraído e escrevi seu nome errado.

Vasily Belozerov 2018.06.03 16:40 #12

Esqueci de acrescentar. A solução, em jogos de estratégia, é a combinatória (busca de combinações repetidas), análise probabilística, determinação do psicótipo do oponente e criação de um modelo comportamental.

[Excluído] 2018.06.05 02:21 #13

Vasily Belozerov:
Esqueci de acrescentar. A solução, em jogos estratégicos, é a combinatória (busca de combinações repetidas), análise probabilística, determinação do psicótipo do oponente e criação de um modelo comportamental.

Saudações, sobre o psicótipo - certamente não se aplica ao mercado. Por outro lado, a RL é, em grande parte, um legado da teoria dos jogos. Por exemplo, você pode pensar em vários agentes de RL como jogadores concorrentes, cada um tentando vencer os outros. Como alternativa, faça com que eles se reforcem mutuamente.

Essencialmente, é elaborada uma matriz de pagamento entre o mercado e o agente. E se a estratégia do mercado não mudar, o agente começa a vencê-la, quando possível.

Aprendizado de máquina no Não o Graal, apenas Negociando contra a multidão

Vasily Belozerov 2018.06.06 11:09 #14

Eu estava apenas sugerindo que talvez a máquina certa devesse ter algo não certo adicionado a ela, semelhante às ações humanas. Por exemplo, primeiro movimento e2 - e4, depois segundo movimento e4 - e2, terceiro movimento novamente e2 - e4. Basicamente, algo assim.

Mandarina: pedido e idéias [SHUTTER FECHADO!] Vou implementar [AVISO FECHADO!] Qualquer pergunta

[Excluído] 2018.06.06 11:24 #15

Vasily Belozerov:
Eu estava apenas sugerindo que talvez a máquina certa devesse ter algo não certo adicionado a ela, semelhante às ações humanas. Por exemplo, primeiro movimento e2 - e4, depois segundo movimento e4 - e2, terceiro movimento novamente e2 - e4. Basicamente, algo assim.

A tarefa não é fazer com que a negociação seja semelhante à negociação humana (e como você sabe disso, o bot tem que passar no teste de Turing?) e o que faz você pensar que um ser humano é capaz de negociar bem ou melhor do que um Expert Advisor, tudo depende da estratégia. O objetivo é que a própria máquina procure alguns padrões e os negocie.

Teoria do mercado Indicadores de elite :) Vantagens e desvantagens de

Ivan Gurov 2018.06.29 22:23 #16

Vasily Belozerov:
Eu estava apenas sugerindo que talvez a máquina certa devesse ter algo não certo adicionado a ela, semelhante às ações humanas. Por exemplo, primeiro movimento e2 - e4, depois segundo movimento e4 - e2, terceiro movimento novamente e2 - e4. Você sabe, algo assim.

Esse é o Random Forest, seu ponto principal: ele forma o livro de abertura por si só.

Ivan Gurov 2018.06.29 22:36 #17

Maxim, há algum efeito de tentar gerar novas árvores aleatórias? Por exemplo, na primeira vez que geramos uma árvore, na segunda vez geramos outras árvores, que são treinadas com mais eficiência. Ou isso não tem efeito algum sobre o resultado final do treinamento?

Aprendizado de máquina no Existe um padrão para Discussão do artigo "Medindo

[Excluído] 2018.06.30 04:46 #18

Ivan Gurov:
Maxim, há algum efeito de tentar gerar novas árvores aleatórias? Por exemplo, na primeira vez que geramos uma árvore, na segunda vez geramos outras árvores, que são treinadas com mais eficiência. Ou isso não afeta em nada o resultado final do treinamento?

Não são as árvores, mas o treinamento de várias florestas com os mesmos dados, sim. Porque o processo de construção é aleatório e os resultados podem variar. Fiquei surpreso com o fato de um conjunto de florestas proporcionar uma melhoria notável, ou seja, treinar várias florestas com os mesmos dados e calcular a média do resultado. (5-15 peças) Você também pode fazer configurações diferentes. Os resultados devem ser ainda melhores no caso de bousting, mas ainda não cheguei lá.

Aprendizado de máquina no Existe um padrão para Uma biblioteca rápida e

forexman77 2018.07.06 19:43 #19

Gostei do artigo. Gostaria que alguém redesenhasse a floresta no alglib para que você possa ajustar a profundidade das árvores.

FxTrader562 2018.07.19 01:43 #20

Obrigado por compartilhar esse artigo muito útil.

Eu estava tentando implementar indicadores adicionais no código, mas não sou um programador especialista e não tenho boa experiência no uso de funções de associação e, portanto, não consegui entender como adicionar mais indicadores para serem usados junto com as regras dentro da função OnInit(). O código contém apenas o indicador RSI e cria as regras de COMPRA e VENDA a partir dele. Você poderia fornecer mais alguns códigos de exemplo de indicadores, como média móvel, MACD, estocástico ou SAR, para serem usados no código?

Em especial, gostaria de saber como criar regras e adicionar condições de entrada ao compará-las com o preço atual. O principal problema com o código atual é que, às vezes, ele mantém as negociações perdidas por muito tempo enquanto fecha as lucrativas rapidamente. Acho que é preciso fazer mais filtros na lógica de saída.

Além disso, tenho uma pergunta que você pode responder, por favor:

O arquivo OPT é atualizado continuamente para melhorar as entradas e saídas ao longo do tempo, ajustando a própria política?

Ou o EA apenas usa o testador de estratégia para otimizar os valores do EA e usa os mesmos valores de entrada e saída que foram lucrativos recentemente, como um EA otimizado regular?

Quero dizer, como outros EAs de rede neural, ele faz o ajuste fino de sua política geral de entrada e saída de negociações durante o curso da negociação?

Há pessoas que enriqueceram Discussão do artigo "Guia A TROCA DE IDÉIAS

Discussão do artigo "Floresta de Decisão Aleatória na Aprendizagem por Reforço" - página 2