文章 "您应当知道的 MQL5 向导技术(第 41 部分):深度-Q-网络"

 

新文章 您应当知道的 MQL5 向导技术(第 41 部分):深度-Q-网络已发布:

“深度-Q-网络” 是一种强化学习算法,在机器学习模块的训练过程中,神经网络参与预测下一个 Q 值和理想动作。我们曾研究过另一种强化学习算法 “Q-学习”。本文因此出示了另一个如何配以强化学习训练 MLP 的示例,可于自定义信号类中所用。

深度-Q-网络(DQN)是另一种强化学习算法,除了我们在本文中看到的 Q-学习 之外,但它们与 “Q-学习” 不同,使用神经网络来预测 q-值和代理人下一步欲采取的动作。它与 “Q-学习” 类似/相关,因为仍然涉及 “Q-表”,其中累积自先前“局次”得来的动作和状态的知识。事实上,它与 “Q-学习” 共享同样的维基百科页面,如从链接中可见,其中它基本上被定义为 “Q-学习” 的变体。

信号类、尾随止损类、和资金管理类一起,是向导汇编智能系统时需要定义的三个主要构建模块。通过 MQL5 向导将它们放到一起,可按 这里这里 为新读者提供的指南来完成。本文底部附带的源代码,意在遵照这些链接中分享的向导汇编指南使用。我们再次寻求定义一个自定义信号类,以便能在向导汇编的智能系统中使用。

不过,这并非我们验证 DQN 的唯一途径,正如自定义尾随类、或自定义资金管理类的实现,也可以制作和测试。不过,我们专注于信号类,因为判定这些智能系统的做多和做空条件至关重要,在许多情况下,更好地展示交易设置的潜力。本文以本系列中的前几篇文章为基础,其中我们详细讲述了开发自定义向导汇编智能系统时可用的技术、或不同设置,故此对于新读者来说,回顾过去的文章将是一个好主意,尤其若他们正在寻求多样化的实现方式。这些文章不仅涵盖各种自定义信号,还涵盖了自定义尾随类、及资金管理类的实现。 

作者:Stephen Njuki