記事: ニューラルネットワークによる価格予測

Andrey Khatimlianskii 2008.04.13 20:43 #121

Ulterior:

翻訳が 必要です。

RIP 2008.04.14 08:59 #122

Neutron:

よし、でも理論が欲しいな。

ここで、その理由を声高に主張します。入力数Nの単層NSでは、非線形方程式の一般的な場合、その重みがシステムNを一意に決定するN個のシナプスがある。このようなシステムを解くには、それぞれがN個の要素からなるN個のベクトルの学習サンプルが必要であることは明らかである。この場合、それ以外の方法は使えません。2層のNSでは、入力の数は学習ベクトルの総数N×nより小さくなければならない。nは第2層のシナプスの数であるから、学習ベクトルの長さはN-nとなる。

3層のNSの場合も、推論の順序は同じである。

このように

1.必要な没入感の深さから進めていき、NSの入力の次元を決定する。

2.そして、NSのアーキテクチャ（層数）を考慮し、シナプスの数を数え、最適な学習サンプルの大きさを求める。

理屈はいいのですが、経験則です・・・。つまり、入力データの種類と表現にのみ依存するアルゴリズムをそれらに構築することは困難である。

RIP 2008.04.14 09:09 #123

Sergey_Murzinov:

最も重要なことの一つは（私の意見では）データの準備で、これを行うには

1.入力の相関を減らすようにする。言い換えれば、入力はできるだけ統計的に独立したものであるべきである。

2.入力ベクトルの正規化において、エントロピーを増大させる必要があり、それによって、同じ量の入力データを保持しながら、NSに提出される情報量を増大させる。

例えば、Kolmogorov-Smirnov法やHurst指数を用いたデータの品質チェックが義務付けられています。

ネットワークアーキテクチャを選択することで、誤差を減らすことができます。

私はそうは思いません。データの変換は、最初のサンプルの情報性を変化させるものだからです。データ変更の評価基準はどこにあるのか？次のNSブームの時に起きた昔の冗談は、NSに関わる人なら誰でも知っていると思います。米軍が地対地射撃システムにNSを使おうとしたとき。コンポーネントの1つにパターン認識ネットワークがあり、学習などには非常に成功していたのですが、なぜか雨天時の戦車を認識してしまい、違う景観構造のデータを提示すると、ひどい間違いを犯してしまいました。その理由は、ネットワークが風景をよく認識するようになったが、戦車は認識できないからである。

データを変えても問題は同じで、ネットワークは正規化された系列に属するシーケンス（モード）だけを選択することになる。原理的には、正規化のプロセス自体を時系列の揺らぎの構成要素とみなすことができるからだ。

Neutron 2008.04.14 09:11 #124

今回、2層非線形NSを作成し、その予測能力が1層非線形と比較して若干高くなっていることを確認しました。しかし、予測のばらつきが明らかに小さくなっているのはいいことです。また、NSは入力数を増やすと、顕著な平滑化特性を示すことも注目される。しかし、私の場合、学習ベクトル数が比例して増えるので、学習サンプルが増えたことが原因かもしれません。これらの効果を何らかの形で分離する必要があるのです...。

Neutron 2008.04.14 10:46 #125

これは、2つのNSの予測能力をテストした結果を示している。

図は、赤が元の時系列（RT）、青が線形1層ネットワークによる1小節前方の予測、緑が非線形2層ネットワークによる予測を示している。ディップの深さはどちらも同じです。この人工的なケースでは、BPトレンドプロット上に予測データの顕著な残差があることがわかる。私の経験豊富な同僚はこの効果を観察しているのだろうか、もしそうなら、何と関係があるのだろうか。

Сергей Мурзинов 2008.04.14 10:52 #126

rip писал (а):

私はそうは思いません。データの変換は、元のサンプルの情報性を変化させるものだからです。データの変化に対する評価基準はどこにあるのか？次のNSブームの時に起こった古いジョークを、NS関係者は皆知っていると思う。米軍が地対地射撃システムにNSを使おうとしたとき。コンポーネントの1つにパターン認識ネットワークがあり、学習などには非常に成功していたのですが、なぜか雨天時の戦車を認識してしまい、違う景観構造のデータを提示すると、ひどい間違いを犯してしまいました。その理由は、ネットワークが風景をよく認識するようになったが、戦車は認識できないからである。

データを変えても問題は同じで、ネットワークは正規化された系列に属するシーケンス（モード）しか選ばない。原理的には、正規化のプロセス自体を時系列の揺らぎの構成要素と見なすことができるからだ。

嬉しいとは言っていない。これが大多数の意見である。うれしいです。

RIP 2008.04.14 12:08 #127

Sergey_Murzinov:

ripは(a)を書きました。

データの変換は、元のサンプルの情報量を変化させることになるのです。データの変化に対する評価基準はどこにあるのか？次のNSブームの時に起きた古いジョークを、NS関係者は皆知っていると思う。米軍が地対地射撃システムにNSを使おうとしたとき。コンポーネントの1つにパターン認識ネットワークがあり、学習などには非常に成功していたのですが、なぜか雨天時の戦車を認識してしまい、違う景観構造のデータを提示すると、ひどい間違いを犯してしまいました。その理由は、ネットワークが風景をよく認識するようになったが、戦車は認識できないからである。

データを変えても問題は同じで、ネットワークは正規化された系列に属するシーケンス（モード）しか選ばない。原理的には、正規化のプロセス自体を時系列の揺らぎの構成要素と見なすことができるからだ。

嬉しいとは言っていない。これが大多数の意見である。うれしいです。

意見は意見でも、実際は違う。遺伝的アルゴリズムを使ってネットワークアーキテクチャを最適化しようとしたところ、面白い結果が出ました。

Neutron 2008.04.14 12:33 #128

こちらもネットワークの予測力を比較したものです。

これは、単層非線形NS（青線）と2層非線形NSの予測作業を一歩進めたものである。ここでは、1層が望ましいと思われます。

このテスト結果を他のNSアーキテクチャと比較するのは興味深いことです。どなたか比較のために結果を投稿していただけませんか？

Сергей Мурзинов 2008.04.14 12:45 #129

rip писал (а):

意見は意見でも、実際には違う。遺伝的アルゴリズムを使ってネットワークアーキテクチャを最適化しようとしたところ、結果は面白いのですが、計算に非常に時間がかかってしまいます。

24時間程度が多いのであれば、そうですね。ただ、ネットワークを扱う（操作する）場合は、一回で終わることに注意してください。

Евгений 2008.04.14 21:33 #130

to中性子

今のところ結果は出ていません。少しずつコツを掴んでいます。

最初の投稿について（最初の写真付き）あなたが何を言いたいのか理解しようとしている。個人的には目立ったラグを感じることはありませんでした。逆に、何らかのパターンがある分野では、それ（ネットワーク）はそれを特定するのに非常に優れており、誤差はトレンドの切れ目（ここではランダムであるか、その出現に何らかのパターンを確立するにはサンプルサイズが十分でない）にあるだけである。

記事: ニューラルネットワークによる価格予測 - ページ 13