文章 "神经网络在交易中的应用:用于智能体自适应行为的分层技能发现(HiSSD)"

 

新文章 神经网络在交易中的应用:用于智能体自适应行为的分层技能发现(HiSSD)已发布:

本文将介绍 HiSSD 框架,该框架结合分层学习与多智能体技术构建自适应系统。我们将详细分析这套创新方法如何挖掘金融市场中的隐藏模式,并在去中心化场景下优化交易策略。

传统做法是先针对单一任务训练智能体,再针对新任务做微调。但该方式存在不少缺陷。首先,智能体需要重新与新环境交互,成本高昂。其次,针对固定数量智能体训练的模型,扩展性较差。一旦智能体组成结构或任务参数发生变动,模型性能就会下降。

为解决上述问题,研究人员开始采用基于 Transformer 的网络架构。这类架构灵活性更强,模型不再受限于固定数量的智能体,能够适配新环境。这一研究成果为学习通用协作行为模式奠定了基础,这类行为技能可跨任务迁移,并在不同场景中复用。

目前业界已提出多种方案来实现这类通用技能。部分方案采用两阶段训练:先提取通用行为模式,再基于模式学习决策策略。还有方案融合离线学习与在线学习,以此加快模型对新环境的适配速度。

上述方法取得了明显成效,尤其有效降低了模型向同类任务迁移的成本。但这些方法同样存在短板。通用技能固然实用,却往往忽略了特定任务目标所需的专属特征。而任务能否达成,往往取决于这些细节。此外,多数方案忽略了交互行为的时序特征。协作行为并非一蹴而就,而是随时间逐步形成的。行为的先后顺序、协作的稳定性都至关重要。

为解决上述问题,论文《基于离线多任务数据学习可泛化技能以实现多智能体协作》提出了 HiSSD 框架,即分层可分离技能挖掘框架。该全新架构可同步学习通用技能与任务专属技能,无需对两类技能进行人为分离,也不受僵化约束限制。在该分层结构中,两类知识在层次结构中并行演化。


作者:Dmitriy Gizlyk