記事「最適化アルゴリズムの効率における乱数生成器の品質の役割」についてのディスカッション - ページ 5

 

最適化の過程で発見された解の安定性を評価する問題を解決するには、理論的なアプローチと実践的なアプローチの2つがある。

理論的なものは、数学的な計算に没頭することを意味し、通常、安定性や最適化という言葉がタイトルに含まれる。

実践的なものは、さまざまな方法で実施することができるが、最初の点から論文の著者による研究作業に 帰結する。例えば、各移動点の近傍で冗長なN回のFFコールを犠牲にして局所微分を推定し、それに応じて何らかのペナルティ基準で性能を調整する。あるいは、最適化処理中に座標値やFF値にノイズを入れることもできます。これが最も安価な方法です(最適化アルゴリズム自体の基礎は何も変更する必要がありません)。また、最適化結果を クラスタリングし、条件式(Index-FF)/(spread-indicator-FF)*(minimum-dispersion-by-parameters)の最大値を持つポイントを特定するアイデアもあります。一つの良い結果が落下するポイントは、スプレッドがゼロとなり、不満足なものとして扱われるはずである。

 
Stanislav Korotky 結果を クラスタリングし、条件式(Index-FF)/(spread-indicator-FF)*(minimum-dispersion-by-parameters)の最大値を持つ点を特定するアイデアもあります。一つの良い結果が落下するポイントは、スプレッドがゼロとなり、不満足なものとして扱われるはずである。

あなたの投稿は少し先走り過ぎている。それは悪いことではないが、ここでの議論で生じたいくつかの疑問に対する答えにはなっていない。

セイバーはすでに私の質問に対して答えを出しているので、スタニスラフさんはもっと答えてください。質問を思い出してください:

アンドレイ・ディク #:

システムパラメーターの完全な列挙を行う機会があったとしましょう。原理的に可能なすべてのパラメーターを用いてシステムの履歴を実行します。では、次の質問に答えてください:「可能なすべてのパラメータから1セット(または複数)を選択する方法はありますか?

そうすれば、これらの質問で問題となる箇所を最も完全に明らかにすることができるでしょう。

注意:この質問の形式では、最適化アルゴリズムについての話はありません。

 
Andrey Dik #:

セイバーはすでに私の質問に答えてくれたので、スタニスラフに答えてください。質問を思い出してほしい:

IMHO、私は今この質問に答えました - ざっと見て3つのオプション(誰かがもっと考えることができます):カウント微分(*/**)、クラスタリング(**)、ノイズ(*) - (1つのアスタリスク - 最適化プロセス中、2つのアスタリスク - 最適化の結果)。どちらのオプションを選んでも、FFポイントのスコアが調整される。次に、通常通りベストセットを選択するが、それはもはや単なる最大FFではなく、安定性補正を加えたものになる。

 
Andrey Dik #:

しかし、まずはここから話を始めよう。そこでもう一度、システムパラメーターの完全な検索にアクセスできると仮定しよう。原則的に可能なすべてのパラメーターでシステムの履歴を実行します。では、次の質問に答えてください:「可能なすべてのパラメーターの中から、新しいデータに対してシステムを実行するために使用する1セット(または数セット)を選択する方法はありますか?これはあなただけでなく、この質問に答えてくれるすべての人に向けた質問です。見てわかるように、今は最適化アルゴリズムについて話しているのではなく、未知のデータに対してシステムを実行するためのパラメータセットの選択について話しているだけです。

丘の頂上としよう。しかし、私はすぐに「"最良 "の定義は別の興味深い問題である」と規定した。

最終的な結果は、ある半径内のパスの結果を考慮に入れる必要がある。

3Dチャートで言えば、他より高い丘の頂上、あるいは少し低いが傾斜が緩やかな丘の頂上ということになる。

TCの観点からは、TCの各パラメータの値のある範囲におけるTCの集計結果となる。

 
課題は--完全な捜索なしにこの地域を見つけることだ。
 
Stanislav Korotky #:

IMHO、私はちょうどこの質問に答えました - 推測で3つのオプション(誰かがもっと考えることができます):カウント微分(*/**)、クラスタリング(**)、ノイズ(*) - (1つのアスタリスク - 最適化プロセス中、2つのアスタリスク - 最適化の結果)。どちらのオプションを選んでも、FFポイントのスコアが調整される。次に、通常通りベストセットを選択するが、それはもはや単なる最大FFではなく、安定性補正を加えたものになる。

あなたの投稿の1行目

Stanislav Korotky#:

私は、最適化 中に見つかった解の安定性を評価する問題を解決するための2つのアプローチを考えています。

今のところ、私たちは最適化を行わず、パラメーターの完全な列挙を行っています。

 
Andrey Khatimlianskii #:

丘の頂上のひとつにしよう。しかし、私はすぐに「"ベター "の定義は興味深い別問題だ」と規定した。

最終的な結果は、ある半径内のパスの結果を考慮に入れるべきだ。

3Dグラフで言えば、他の丘より高いか、少し低いが傾斜が緩やかな丘の頂上ということになる。

TCの観点からは、各パラメータの値のある範囲におけるTC操作の集計結果となる。

Andrey Khatimlianskii#:
課題は、完全な探索なしにこの領域を見つけることです。

では、完全探索の結果のすべての可能なパラメータから、不慣れなデータで使用するセットを選択する方法はあるのでしょうか?我々は完全な探索を行ったのであり、ここでは最適化は行っていない。

さて、この質問に答えることは非常に重要である。

 
Andrey Khatimlianskii #:
問題は、完全な探索なしにこの領域を見つけることである。

このような問題はよく出題され、そのためいくつかの解答が発表されていることは確かだ。

ところで、何兆点ものFF値がすでに計算されている場合(完全探索)、その中から多次元ヒルを見つけることは最適化の問題である。

つまり、いずれにしても最適化ということになる。


私は反復アプローチを提案した。各反復の前に、(前の反復で)見つかった頂点の領域を別のGA実行として突き出す。

 
Fxsaber、Stanislav、Andrey、コメントありがとう。あなた方の開発その他の分野における豊富な経験を尊重し、「最適化」という概念に関連する側面について私の見解を述べさせてください。決して「教える」ことが目的ではありませんが、何百もの他人の最適化アルゴリズムを分解し、自分自身のアルゴリズムをいくつか設計してきた者として、私のビジョンを伝えたいと思います。

私の考えを伝えることができれば、少し違った角度から最適化を見ることができるようになり、すでに膨大な経験や知識を豊かにしてくれることは間違いないし、議論の過程で私の経験も増えるだろう。

"もし"-この記事の議論スレッドには、これを妨げる外部からの影響があるからだ。今のところ、これらの影響はうまく買収されているが、常にそうであるという保証はない。
 
Andrey Dik #:

あなたの投稿の最初の行:

私たちはまだ最適化を行っていません。

これは何かの用語遊びですか?最良のセットを選択する3つの方法を提案しました。これらは、可能なすべての組み合わせで履歴をフルに実行する場合にも適しています。

例えば、このようなよく知られた問題があります。NSがあり(例えば、価格の増分で取引する)、このネットワークの重みを見つけるために最適化が使われます。あなたのアルゴリズムをそのまま適用すると、過剰に訓練されたNSができあがり、新しいデータに対応できなくなる。したがって、元のデータセットを2つに分け、片方のデータセットで最適化を行いながら、もう片方のデータセットの品質をコントロールすることが重要である。