新しい記事「機械学習の限界を克服する（第6回）：効果的なメモリクロスバリデーション」はパブリッシュされました:
前回のクロスバリデーションに関する記事では、古典的な手法の概要と、それが時系列データに対してどのように使われ、モデルの最適化や過学習の抑制に役立っているかを説明しました。参考として、その記事へのリンクを掲載しています。また、従来の解釈以上のパフォーマンスが得られる可能性があることにも触れました。本記事では、そうした従来手法の見落とされがちなポイントを掘り下げ、ドメイン特化型の検証によってどのように改善できるのかを見ていきます。
話を分かりやすくするために、ひとつの思考実験をしてみましょう。仮に、あなたが400年後の未来へタイムトラベルできたとします。到着すると、部屋の中にあなたが不在だった期間の毎日分の新聞が山のように積まれています。数世紀分の世界の出来事が詰まった新聞の山です。その横には、起動したままのMetaTrader 5ターミナルがあります。取引を始める前に、あなたはまずこの新聞から世界の状況を学ばなければなりません。
さて、あなたならどの順番で新聞を読みますか。すべてを最初から読む必要があるでしょうか。それとも、直近の情報だけを把握すれば、十分にうまく取引できるでしょうか。どこまで過去に遡れば、その情報はすでに価格に織り込まれており、もはや役に立たなくなるのでしょうか。
これらは、まさにクロスバリデーションによって答えるべき問いです。しかし、従来のクロスバリデーションは、「過去の情報はすべて等しく重要である」という前提のもとで設計されています。私たちは、この前提が本当に正しいのかを検証する、新しい形のクロスバリデーションを提案したいと考えています。
MetaTrader 5を使った検証結果に入る前に、まずはこの問題を整理し、なぜこのアプローチが必要なのかを直感的に理解してもらいましょう。一般的に考えても、部屋にある一番古い新聞から順に読み始めるのは、あまり効率的とは言えません。
作者: Gamuchirai Zororo Ndawana