記事「取引におけるニューラルネットワーク:統合軌道生成モデル(UniTraj)」についてのディスカッション

 

新しい記事「取引におけるニューラルネットワーク:統合軌道生成モデル(UniTraj)」はパブリッシュされました:

エージェントの行動を理解することはさまざまな分野で重要ですが、ほとんどの手法は特定のタスク(理解、ノイズ除去、予測)に焦点を当てており、そのため実際のシナリオでは効果的に活用できないことが多いです。この記事では、さまざまな問題を解決するために適応可能なモデルについて説明します。

マルチエージェントの動作分析は、金融、自動運転、監視システムなど、さまざまな分野で重要な役割を果たします。エージェントの行動を理解するには、オブジェクトの追跡、識別、軌跡のモデリング、アクションの認識といったいくつかの重要なタスクを解決する必要があります。その中でも、エージェントの動きを分析する際に軌道モデリングは特に重要です。環境ダイナミクスや微妙なエージェント同士の相互作用が複雑であるにもかかわらず、この問題の解決に関しては最近大きな進展が見られました。主な成果は、軌道予測、欠損データの回復、そして時空間モデリングの3つの主要な領域に集中しています。

しかし、ほとんどのアプローチは特定のタスクに特化しているため、他の問題に一般化することが難しいという課題があります。中には、前方と後方の両方の時空間的依存関係が必要なタスクもありますが、これらは予測中心のモデルでは見落とされがちです。また、いくつかのアルゴリズムはマルチエージェントの軌道の条件付き計算に成功していますが、将来の軌道に関しては十分に考慮していないことがよくあります。この制限により、過去の軌道を単に再構築するだけではなく、将来の軌道を予測することが次の行動計画にとって不可欠であるため、動きの完全な理解における実用性が低くなります。

論文「Deciphering Movement:マルチエージェントのための統合軌道生成モデル「では、さまざまな軌道関連のタスクを統一されたスキームに統合する汎用フレームワークである、UnifiedTrajectoryGeneration(UniTraj)モデルを紹介します。具体的には、著者はさまざまな種類の入力データを、各タイムステップにおける各エージェントの可視性を示すマスクを持った不完全な軌跡という単一の形式に統合しています。このモデルは、不完全な軌跡に基づいて完全な軌跡を生成することを目的として、すべてのタスク入力をマスクされた軌跡として一貫して処理します。

異なる軌跡表現における時空間依存性をモデル化するために、著者らは、Transformerベースのエンコーダに組み込まれたGhostSpatialMasking(GSM)モジュールを導入しています。著者らは、最近の人気の状態空間モデル(SSM)、特にMambaモデルの機能を活用して、長期的なマルチエージェント軌道生成のための双方向時間エンコーダMambaに適応および強化しました。さらに、彼らは、シーケンス内の時間的な関係を維持しながら軌跡を包括的にスキャンする、シンプルでありながら効果的な双方向時間スケール(BTS)モジュールを提案しています。実験結果は、提案された方法の堅牢さと優れたパフォーマンスを確認しています。

統一軌道生成モデル(UniTraj)


作者: Dmitriy Gizlyk