文章 "神经网络变得简单(第 62 部分):在层次化模型中运用决策转换器" 新评论 MetaQuotes 2024.06.07 17:37 新文章 神经网络变得简单(第 62 部分):在层次化模型中运用决策转换器已发布: 在最近的文章中,我们已看到了运用决策转换器方法的若干选项。该方法不仅可以分析当前状态,还可以分析先前状态的轨迹,以及在其中执行的动作。在本文中,我们将专注于在层次化模型中运用该方法。 事实证明,收集 2023 年前 7 个月历史区间的训练样本是相当劳累的。我遇到了一个问题,即便智能体动作采样的界限很小,大多数验算也无法满足余额正增长需求。 为了在优化模式下选择最优计划界限,将每次验算的迭代次数调整为优化参数。 在收集训练集,并训练局部政策模型后,我并行运行了调度器和成本函数模型训练。这种方式令我能够显著减少训练模型所花费的时间。 作者:Dmitriy Gizlyk Fahad Raza 2024.03.13 07:32 #1 它旨在加深对分层架构中决策转换器的理解,尤其是对机器人和自主系统使用案例感兴趣的人。 附加的文件: gfhf.png 137 kb 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
新文章 神经网络变得简单(第 62 部分):在层次化模型中运用决策转换器已发布:
在最近的文章中,我们已看到了运用决策转换器方法的若干选项。该方法不仅可以分析当前状态,还可以分析先前状态的轨迹,以及在其中执行的动作。在本文中,我们将专注于在层次化模型中运用该方法。
事实证明,收集 2023 年前 7 个月历史区间的训练样本是相当劳累的。我遇到了一个问题,即便智能体动作采样的界限很小,大多数验算也无法满足余额正增长需求。
为了在优化模式下选择最优计划界限,将每次验算的迭代次数调整为优化参数。
在收集训练集,并训练局部政策模型后,我并行运行了调度器和成本函数模型训练。这种方式令我能够显著减少训练模型所花费的时间。
作者:Dmitriy Gizlyk