記事「ニューラルネットワークが簡単に(第54回):ランダムエンコーダを使った効率的な研究(RE3)」についてのディスカッション

 

新しい記事「ニューラルネットワークが簡単に(第54回):ランダムエンコーダを使った効率的な研究(RE3)」はパブリッシュされました:

強化学習手法を検討するときは常に、環境を効率的に探索するという問題に直面します。この問題を解決すると、多くの場合、アルゴリズムが複雑になり、追加モデルの訓練が必要になります。この記事では、この問題を解決するための別のアプローチを見ていきます。

ランダムエンコーダによる効率的な探索(RE3)メソッドの主な目的は、訓練されたモデルの数を最小限に抑えることです。RE3メソッドの著者らは、研究の中で、画像処理の分野では畳み込みネットワークのみが個々のオブジェクトの特徴や特性を識別できるという事実に注目しています。畳み込みネットワークは、多次元空間の次元を削減し、特徴的な特徴を強調し、元のオブジェクトのスケーリングに対処するのに役立ちます。

ここでの極めて当然の疑問は、畳み込みネットワークにさらに目を向けた場合、訓練済みモデルのどのような最小化について話しているのかということです。

この面でのキーワードは「訓練」です。この方法の著者らは、ランダムなパラメータで初期化された畳み込みエンコーダでも2つの状態の近接性に関する情報を効果的に取得できるという事実に注目しました。以下は、ランダムに初期化されたエンコーダ(ランダムエンコーダ)の表現空間と、記事の真の状態の空間での距離を測定することによって見つかったk近傍状態の視覚化です。

k近傍状態の可視化

作者: Dmitriy Gizlyk