文章 "深度神经网络 (第七部分)。 神经网络的融合: 堆叠" - 页 2

 
Vladimir Perervenko:

我计划在不久的将来将强化学习与神经网络结合起来进行训练。

最有意思的是,您对 RL 在交易任务中的应用,以及 DQN、DDPG、A3C、TRPO 的实现,都会让我们大开眼界。

 

Обсуждение и вопросы по коду можно сделать в ветке

Удачи

 

Обсуждение и вопросы по коду можно сделать вветке

Удачи