記事"自己組織化特徴マップ(Kohonenマップ) - サブジェクトリビジッティング"についてのディスカッション - ページ 2

 
Nikolay Demko:

トレーニングしたグリッドを保存し、グリッドとトレーニングデータを投稿してください。分析すると、どうすれば可能なのか答えが見つかると思います。あるいは、何がバグなのかがわかるでしょう。

一般的には、再現可能な例が必要です。



リソースファイル、somnet、リソースファイルのレコードを取った画面があります。たぶん役に立つだろう ;)
ファイル:
Desktop.zip  756 kb
 
一般的に似ているアイテムのグループを検索することについて、いくつかアイディアがあります。つまり、クラスタリングの話です。ネットでk-meanという方法を見つけました。説明を読み、例を見ました。データをグループにクラスタリングするために何を使いますか?
 
Viktor Vasilyuk:
結果を表示する実装にはいくつか欠点がある......。 統計をテストしてみたら、こんな結果が出た:


左の1行目の2マス目の状況にちょっと驚いた。2番と3番の値だ。どうしてこのような色の変化が起こるのだろうか?例えば、左の1列目の1マス目。#14と#18の間にはスムーズな色の遷移がある。

それから、絵の下のカラーパレットに描かれているように、左から右へ、あるいは右から左へ、どこでも一貫した色の遷移がある。そして、ここでは色を飛び越えながら。

トレーニングのためのデータが非常に少ないことが原因だと思います。

ノードの数は解像度の4分の1です。

そして、たまたま値の大きな広がり(2列目)で、スケールの反対側の端のノードが隣り合っていた。

全体として、このような配置があり、明確な境界線が引かれていた。

しかし、その境界をはっきりとした六角形の形で再現することはできなかった。保存されたネットワークには境界線があるが、それは六角形ではない。

 
Viktor Vasilyuk:


一般的に似ているアイテムのグループを検索することについて、いくつかアイディアがあります。つまり、クラスタリングの話です。ネットでk-meanという方法を見つけました。説明を読み、例を見ました。データをグループ分けするために何を使いますか?

それはタスクによって異なる。クラスタリングの方法はたくさんある。Kohonenは普遍的なクラスタリングツールであり、普遍的なものすべてが特定のタスクに完璧であるわけではありません。

例えば、一変量データをクラスタリングする必要があり、最も速くて簡単な方法で行うのであれば、K-meansでもいいのですが、私は平均ではなくモードによるクラスタリングを好みます。

 
Nikolay Demko:

その理由は、トレーニング用のデータが少ないからだと思う。

ノードの数が解像度の4倍以下であることが2つ目です。

そして、たまたま大きな値の範囲(2列目)で、スケールの反対側の端のノードが隣り合っていた。

全体として、このような配置があり、明確な境界線が引かれていた。

しかし、その境界をはっきりとした六角形の形で再現することはできなかった。保存されたネットワークには境界線があるが、それは六角形ではない。

間違ったグラフをお渡ししてしまいました。これがアーカイブにあるsomnetのオリジナルだ。



2) 4という数字はどこから来たのでしょうか?画像のサイズをノードの数で割ったのでしょうか? どうしても関係が理解できません。

3) 849950-142695=707255 このような違いは、他の列の小さな違いに影響するのでしょうか?

4) 数字を横に描くのではなく、絵の中に表示することは可能でしょうか? 数字が見えないものもあります。はい、写真はファイルに保存されますが、写真上の数字の形でキャプションは望んでいません。これは実装されていないのでしょうか?
 
やばい、わからない。もう妄想というか被害妄想というか。

メタトレーダー取引プラットフォームのスクリーンショット

ポンドポンド、H1、2017.02.25

アルパリ・インターナショナル・リミテッド、メタトレーダー5、デモ

GBPUSD, H1, 2017.02.25, アルパリ・インターナショナル・リミテッド, MetaTrader 5, デモ




1) サンプル数を 10 に減らす

2) 2,3,4 行目の値について、2 列目の変更を手動で行う

このナンセンスは何ですか?

以下のことがわかりました:

1) 2 列目の最大値が誤ってカウントされているか、誤って表示されている。すなわち、すべての値を下方向にソートすると、プログラムは最大値が3行目の値であることを示すが、2行目の値ではない。

2) 2番目の列の最大値と最小値の間の「差」を少し小さくした。この列の3つの最大値が互いに1~1.8%異なるようにした。これは大したことではないだろう?つまり、"目で見て "みれば、この列の他のすべての値とほとんど同じである。



私のファイルを再度添付する。
ファイル:
SOM.zip  90 kb
 
Viktor Vasilyuk:
くそっ、わからない。これはもう妄想か被害妄想だ。




1) サンプル数を10に減らす。

2) 2列目の2,3,4行目の値を手動で変更する。

このナンセンスは何だ?

以下のことを発見した。

1) 2列目の最大値が誤ってカウントされているか、誤って表示されている。すなわち、すべての値を下方向にソートすると、プログラムは最大値が3行目の値であることを示すが、2行目の値ではない。

2) 2番目の列の最大値と最小値の間の「差」を少し小さくした。この列の3つの最大値が互いに1~1.8%異なるようにした。これは大したことではないだろう?つまり、"目で見て "推定すると、この列の他のすべての値では、ほとんど同じなのである。



私のファイルをもう一度添付する。

他の列のすべての地図で、この場所に何らかのクラスターがあることに注目してほしい。

つまり、この結果は規則的に繰り返されているのである

ただ、2番目の列では、最小値を持つこのクラスターが、最大値を持つクラスターに囲まれているか隣接している。だから境界が鋭くなる。

しかしSOMは最大値の近傍にある別のクラスターにデータを置く。なぜならマップは相互に連結しており、このクラスターにはこの場所が最適だからだ。

もしそれらを2番目のマップの別のコーナーに移動させようとすると、他のマップからこれらの位置にノードを移動させなければならない。

マップ1,4,6,8-12では、これら2つのクラスターの値は非常に近い。つまり、12枚のマップのうち8枚で、SOMはこれらを隣り合わせに配置している。当然、残りの4枚は神が送ったものとして区別できる。

あるいは、私はあなたの問題を理解していない。

 
Nikolay Demko:

他の列のすべてのマップにおいて、この位置に何らかのクラスターがあることに注意してほしい。

つまり、この結果は規則的に繰り返されるということだ。

ただ、2番目の列では、最小値を持つこのクラスターは、最大値を持つクラスターに囲まれているか隣接している。だから境界が鋭くなる。

しかしSOMは最大値の近傍にある別のクラスターにデータを置く。なぜならマップは相互に連結しており、このクラスターにはこの場所が最適だからだ。

もしそれらを2番目のマップの別のコーナーに移動させようとすると、他のマップからこれらの位置にノードを移動させなければなりません。

マップ1,4,6,8-12では、これら2つのクラスターの値は非常に近い。つまり、12枚のマップのうち8枚で、SOMはこれらを隣り合わせに配置している。当然、残りの4枚は神が送ったものとして区別できる。

それとも、私があなたの問題の本質を見逃しているのかもしれない。

そう、ひとつ問題がある。データファイルの2列目の最大値は559000である。写真では(横棒、グラデーションのところ)この最大値が552000であることを示している。559000が552000より小さいことはありえない。
 
Viktor Vasilyuk:
ひとつ問題がある。データファイルでは、2列目の最大値は559000となっている。写真では(横棒、グラデーションのところ)、この最大値は552000となっている。559000が552000より小さいことはありえない。

552000

559000

これはノードデータですか、それともパターンデータですか?

ノードは学習パターンと1対1である必要はありません。

 
Nikolay Demko:

552000

559000

これはノードデータかパターンデータか?

ノードはトレーニング・パターンと1対1である必要はない。

ハイライト