文章 "您应当知道的 MQL5 向导技术(第 36 部分):依据马尔可夫(Markov)链的 Q-学习" 新评论 MetaQuotes 2025.05.26 11:36 新文章 您应当知道的 MQL5 向导技术(第 36 部分):依据马尔可夫(Markov)链的 Q-学习已发布: 强化学习是机器学习的三大信条之一,并肩两个是监督学习和无监督学习。因此,它在意的是最优控制,或学习最适合目标函数的最佳长期政策。正是在这种背衬下,我们探索其向一款由向导组装的智能系统中 MLP 中通知学习过程的可能作用。 由向导组装的智能系统的自定义信号类,能够承担各种值得探索的角色,我们继续寻求当 Q-学习算法与马尔可夫(Markov)链配对时,如何帮助改进多层感知器网络的学习过程。Q-学习是强化学习的若干种(大约 12 种)算法之一,故本质上,这也是对如何将该主题实现为自定义信号,并在向导组装的智能系统中进行测试的考察。 故此,本文的结构将从强化学习作为源头,详述 Q-学习算法及其轮转阶段,研究如何将马尔可夫链集成到 Q-学习之中,然后一如既往地以策略测试报告终结。强化学习能当作独立的信号生成器,因为它的周期(“局次”)本质上是一种学习形式,即把结果量化为“参与者”所参与的每个“环境”的“奖励”。下面讲述引号中的这些术语。然而,我们并没有将强化学习当作原生信号,而是通过补充多层感知器,依靠它的能力来推进学习过程。 作者:Stephen Njuki 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
新文章 您应当知道的 MQL5 向导技术(第 36 部分):依据马尔可夫(Markov)链的 Q-学习已发布:
由向导组装的智能系统的自定义信号类,能够承担各种值得探索的角色,我们继续寻求当 Q-学习算法与马尔可夫(Markov)链配对时,如何帮助改进多层感知器网络的学习过程。Q-学习是强化学习的若干种(大约 12 种)算法之一,故本质上,这也是对如何将该主题实现为自定义信号,并在向导组装的智能系统中进行测试的考察。
故此,本文的结构将从强化学习作为源头,详述 Q-学习算法及其轮转阶段,研究如何将马尔可夫链集成到 Q-学习之中,然后一如既往地以策略测试报告终结。强化学习能当作独立的信号生成器,因为它的周期(“局次”)本质上是一种学习形式,即把结果量化为“参与者”所参与的每个“环境”的“奖励”。下面讲述引号中的这些术语。然而,我们并没有将强化学习当作原生信号,而是通过补充多层感知器,依靠它的能力来推进学习过程。
作者:Stephen Njuki