記事「名義変数の順序符号化」についてのディスカッション

 

新しい記事「名義変数の順序符号化」はパブリッシュされました:

この記事では、PythonとMQL5の両方を使用して、名義予測値を機械学習アルゴリズムに適した数値フォーマットに変換する方法について議論し、実演します。

名義変数は、カテゴリ間に固有の順序や順位が存在しないカテゴリデータを表します。金融時系列データセットに特化した例としては、以下のようなものがあります。

  • 価格バーの種類(ピンバー、スピニングトップ、ハンマーなど)
  • 曜日(例:月曜日、火曜日、水曜日)

これらの変数は純粋に定性的なもので、カテゴリ間の階層や順序は暗示されていません。例えば、ピンバーフォーメーションがスピニングトップより本質的に優れているわけではなく、強気バーが弱気バーより優れているわけでもありません。

数値計算では、任意の整数を異なるカテゴリに割り当てるのが一般的です。しかし、これらの整数を機械学習アルゴリズムの入力として使用する場合、割り当てられた値が元のデータによって伝えられた情報を歪めてしまう危険性があります。アルゴリズムは、たとえ意図していなくても、より大きな値が特定の関係や順位を意味すると誤って推論するかもしれません。

作者: Francis Dube