Discussão do artigo "Aplicando o método de Monte Carlo no aprendizado por reforço"

 

Novo artigo Aplicando o método de Monte Carlo no aprendizado por reforço foi publicado:

O uso de aprendizado por reforço para desenvolver EAs de autoaprendizagem. No artigo anterior, vimos o algoritmo Random Decision Forest e escrevemos um EA simples de autoaprendizagem baseado no aprendizado por reforço. Observamos que a principal vantagem desta abordagem era a fácil escrita do algoritmo de negociação e a alta velocidade de aprendizagem. O aprendizado por reforço (doravante simplesmente AR) é facilmente incorporado a qualquer EA e acelera sua otimização.

Após parar a otimização, basta ativar o modo de teste único (já que o melhor modelo é gravado no arquivo e somente ele será carregado):


Voltemos atrás no histórico dois meses e vejamos como o modelo funciona durante quatro meses:


Pode ser visto que o modelo resultante dura mais um mês (quase todo o mês de setembro), mas em agosto ele quebra.

Autor: Maxim Dmitrievsky