記事「独自のLLMをEAに総合する(第5部): LLMを使った取引戦略の開発とテスト(I) - 微調整」についてのディスカッション

 

新しい記事「独自のLLMをEAに総合する(第5部): LLMを使った取引戦略の開発とテスト(I) - 微調整」はパブリッシュされました:

今日の人工知能の急速な発展に伴い、言語モデル(LLM)は人工知能の重要な部分となっています。私たちは、強力なLLMをアルゴリズム取引に統合する方法を考える必要があります。ほとんどの人にとって、これらの強力なモデルをニーズに応じて微調整(ファインチューニング)し、ローカルに展開して、アルゴリズム取引に適用することは困難です。本連載では、この目標を達成するために段階的なアプローチをとっていきます。

前回の記事では、GPUアクセラレーションを活用して大規模言語モデルを学習する方法を紹介しましたが、取引戦略の策定やバックテストの実行には触れませんでした。しかし、最終的な目標は、学習させたモデルを効果的に活用し、実際の取引に役立てることです。そこで今回の記事からは、訓練済みの言語モデルを活用し、取引戦略を立て、外国為替の通貨ペアでその戦略をテストするプロセスに入ります。もちろん、これは単純な作業ではなく、適切な技術的手段を導入する必要があります。では、順を追って実行していきましょう。

この全プロセスが完了するまでに、いくつかの記事を要するかもしれません。

  • 最初のステップは、取引戦略を立てることです。 
  • 次に、第2のステップとして、戦略に基づいたデータセットを作成し、そのデータが大規模言語モデルの入力および出力として適合するよう、モデルを微調整(または再訓練)します。これを実現するためには、さまざまなアプローチが存在しますので、可能な限り多くの例を紹介します。
  • 第3のステップは、モデルによる推論と、その結果を取引戦略に統合することです。そして、この戦略に基づいてEA(エキスパートアドバイザー)を作成します。もちろん、この推論段階では、適切な推論フレームワークの選定や最適化手法(フラッシュアテンション、モデルの量子化、速度向上など)など、解決すべき技術的課題も残っています。 
  • 第4のステップは、ヒストリカルバックテストを用いて、クライアント側でEAをテストすることです。


    作者: Yuqiang Pan

     
    こんにちは
    言語モデルの学習プロセスと微調整プロセスの主な違いは何ですか?
     
    Christian Benjamin #:
    こんにちは
    言語モデルの学習プロセスと微調整プロセスの主な違いは何ですか?

    この記事の例から、こんにちは:

    1.この例で使っている学習済みのGPT2モデルの重みは、我々のデータに関連する内容を持っておらず、微調整なしでは入力された時系列は認識されませんが、微調整後は我々のニーズに応じて正しい内容を出力することができます。

    2.我々の記事で述べたように、言語モデルをゼロから訓練して収束させるのは非常に時間がかかるが、微調整を行うことで事前に訓練されたモデルを素早く収束させることができ、多くの時間と計算能力を節約することができる。この例で使うモデルは比較的小さいので、このプロセスはあまり目立たない。

    3.データ量が十分でない場合、同じデータ量でモデルを微調整する方が、モデルを直接トレーニングするよりもはるかに優れています。

     

    こんにちは、素晴らしい記事をありがとう。


    微調整されたモデルをMT5にどのように統合するか、楽しみにしています。