文章 "神经网络变得简单(第 76 部分):配合多未来变换器探索不同的交互形态"

 

新文章 神经网络变得简单(第 76 部分):配合多未来变换器探索不同的交互形态已发布:

本文继续探讨预测即将到来的价格走势的主题。我邀请您领略多未来变换器架构。其主要思路是把未来的多模态分布分解为若干个单模态分布,这样就可以有效地模拟场景中个体之间互动的各种模态。

MFT 模型的核心是一个并行互动模块,它由并行结构中的多个互动模块组成,研究每种模式下个体走势的未来特征。这三个预测头部包括:

  • 运动解码器,
  • 个体分数解码器,
  • 场景分数解码器。

它们负责解码每名个体的未来轨迹,并估算每个预测轨迹和每个场景模式的置信度分数。在该架构中,每个模式的前馈和反向传播信号沿途经过的路径彼此独立,并且每个路径都包含一个唯一的互动模块,即在相同模式的信号之间提供信息互动。因此,互动单元可以同时捕获模式不同形态的相应互动。不过,编码器和预测头部对于每种模式都是通用的,而互动模块则因对象不同而参数相异。因此,理论上具有不同参数的每个单模态分布都能按效率更高的参数进行建模。该方法的原始可视化如下所示。

作者:Dmitriy Gizlyk