記事「ニューラルネットワークが簡単に(第23部):転移学習用ツールの構築」についてのディスカッション

 

新しい記事「ニューラルネットワークが簡単に(第23部):転移学習用ツールの構築」はパブリッシュされました:

転移学習については当連載ですでに何度も言及していますが、これはただの言及でした。この記事では、このギャップを埋めて、転移学習の詳しい調査を提案します。

3つの透明なブロックが見えます。最初のブロックでは、ドナーモデルを扱います。ここでは、訓練済みモデルを含むファイルを選択する機能が必要です。ファイルからモデルを読み込んだ後、ツールは読み込んだモデルのアーキテクチャの説明を提供する必要があります。どのモデルが読み込まれ、どのニューラル層がコピーされるかをユーザーが理解する必要があるためです。また、コピーされた層の数についてツールに通知します。前述のように、ソースデータ層から順にニューラル層をコピーします。

2番目のブロックでは、ニューラル層が追加されます。ここでは、作成中のニューラル層に関する情報を入力するためのフィールドを作成します。プログラムコードでは、各ニューラル層を1つずつ順番に記述し、新しいモデルのアーキテクチャに追加します。

3番目のブロックには、作成されたモデルの全体的なアーキテクチャが表示され、ファイルを指定して保存することができます。ツールの設計例を以下に示します。

ツール設計

ツールの設計とその実装は、デモンストレーションのみを目的として提示されており、ニーズに合わせていつでも変更できます。

作者: Dmitriy Gizlyk

理由: