文章 "神经网络变得简单(第 62 部分):在层次化模型中运用决策转换器"

 

新文章 神经网络变得简单(第 62 部分):在层次化模型中运用决策转换器已发布:

在最近的文章中,我们已看到了运用决策转换器方法的若干选项。该方法不仅可以分析当前状态,还可以分析先前状态的轨迹,以及在其中执行的动作。在本文中,我们将专注于在层次化模型中运用该方法。

事实证明,收集 2023 年前 7 个月历史区间的训练样本是相当劳累的。我遇到了一个问题,即便智能体动作采样的界限很小,大多数验算也无法满足余额正增长需求。

 

为了在优化模式下选择最优计划界限,将每次验算的迭代次数调整为优化参数。

在收集训练集,并训练局部政策模型后,我并行运行了调度器和成本函数模型训练。这种方式令我能够显著减少训练模型所花费的时间。

作者:Dmitriy Gizlyk

 
它旨在加深对分层架构中决策转换器的理解,尤其是对机器人和自主系统使用案例感兴趣的人。
附加的文件:
gfhf.png  137 kb