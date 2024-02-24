トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 3049

Aleksey Nikolayev #:

RLという概念はトレーディング・タスクには冗長ではないか？環境がエージェントに与える影響はあるが、エージェントが環境に与える影響はあるのだろうか？この第2の影響を人為的に導入することは可能であるが、それは意味があるのだろうか？

それは、損失 関数は我々が必要とするものを正確に反映し、滑らか（かつ単調）でなければならないということである。私たちの場合、損失関数は利益であるべきで、モデル・パラメータに滑らかかつ単調に依存すべきである。

利潤の類似物の滑らかさは、おそらく何らかの方法で達成できるだろう（例えば、カーネル・スムージングなど）。しかし、単調性については大いに疑問です。

トレーディングの経済的結果の基礎は価格の動きであり、非定常ランダム過程である。

この非定常ランダム過程を、何らかのトリックによって滑らかで単調なものに変えようとしているのだろうか？もしかしたら、私たちは幅を利かせているのかもしれない。特に、訓練セット以外での分類誤差が20％（！）未満であることを考慮に入れると、それを達成するのは極めて困難である。分類誤差を減らすことから始めるべきだろうか？

 

記事を読む

この記事が何の役に立つのか？

まったく疑わしい。

その理由は次のようなものだ。

未来を予測するAI（MO）に関する出版物は記憶にない。手書きの文字を書くようにモデルを教える。そして、その手書き文字を認識しようとする。しかし、そのモデルは、次にどのような文字が書かれるかを予測するようには教えられていない。

それが私たちの抱えている問題です。

私たちはMO（ローソク足の組み合わせで行ったのと同じ作業）を使って、正しい予測を与える予測因子のパターンを見つけようとしている。しかし、見つかったパターンが将来も正しい予測をするという保証はない。「正しい」パターンはエラーを出し、「間違った」パターンは正しいことを予測する。その理由は分類アルゴリズム自体にあり、分類アルゴリズムはクラスの値ではなく、クラスの有効性を与える。我々は、クラス分けに0.5という最も原始的な正則化を用いている。そして、訓練中に「正しい」パターンの確率が0.5000001であったとして、なぜこの確率をクラスの値とするのでしょうか？

このことから逃れるために、我々は家庭菜園を始めるが、パターンを探す予測変数の値は、定常的でないか、擬似定常的であり、価格とはかけ離れた関係にある！

 
Aleksey Nikolayev #:

環境がエージェントに与える影響はあるが、エージェントが環境に与える影響はあるのだろうか？おそらく、この第二の影響を人為的に導入することは可能であろうが、それは意味があるのだろうか？

全ては目の前のタスクによる。

圧倒的多数がそうであるように、出来上がったターゲットを予測するのであれば、環境に影響を与えることはなく、RLは必要ない。

しかし、例えば、ポジション管理、ストップ、テイクアウト...といったタスクがあるとする。

資産管理は、我々（エージェント）が管理する環境である。


エージェントは、注文を出すか出さないかを決める。

どの価格で、

いつ手仕舞いするか、いつ動かすか、

現在のポジションの損失がnピップを超えたらどうするか、

そして、5回連続で損失を出したらどうするのか。


これは、 原始的な 分類の上下ではなく、多くの状態（出力）を持つ、まったく異なるレベルのタスクであることがお分かりいただけるでしょう。


もっと単純に言えば、市場を管理することはできないが、ポジションとリスクを管理することはできる！


アレクシー・ニコライエフ

利益の類似物の平滑性は、おそらく何らかの方法で達成できるだろう（例えば、カーネル・スムージングのようなものによって）。しかし、単調性については非常に疑問です。

滑らかさ」が何を意味するのか、なぜ「滑らかさ」が必要なのか、よく理解できないのですが......。

多分、多基準最適化を使って最適解を見つけることができると思います。

 
mytarmailS #:

すべては目の前の仕事次第だ。

もし、大多数の人々がそうであるように、出来上がったターゲットを予想するならば、私たちは環境に何の影響も及ぼさないし、RL自体も必要ない......。

しかし、例えば、ポジション管理、ストップ、テイクアウト......といったタスクがある場合。

資産管理は環境であり、我々（エージェント）が管理する...


エージェントは、注文を出すか出さないかを決定する。

どの価格で

いつ出すか、いつ動かすかを決める、

現在のポジションの損失がnポイントを超えたらどうするか、

そして5連敗したらどうするのか...。


このタスクは、 原始的な 分類の上下ではなく、多くの状態（出力）を持つ、まったく別のレベルのタスクなのだ。


もっと簡単に言えば、市場を管理することはできないが、ポジションとリスクを管理することはできる、ということだ！


何が「スムーズさ」なのか、なぜそれが必要なのか、よく理解できないのですが......。

検索に多基準最適化を適用できるかもしれない。

エージェントを平均化すればいい。
Valeriy Yastremskiy #:
エージェントが平均化することは可能である。
https://www.mql5.com/ru/code/22915
 
СанСаныч Фоменко #:

取引結果の基本は価格の動きであり、これは非定常ランダム過程である。

非定常ランダム・プロセスを、何らかのトリックによって滑らかで単調な ものに変えようとしているのだろうか？もしかしたら、私たちは幅を利かせているのかもしれない。特に、訓練セット以外での分類誤差が20％（！）未満であることを考慮に入れると、それを達成するのは極めて困難である。分類誤差を減らすことから始めるべきだろうか？

私が話していたのは、モデルの訓練によって最小化される損失関数の特性についてです。より正確には、その理想形についてです。

 
mytarmailS #:

何が滑らかさなのか、なぜ滑らかさが必要なのかがよくわからない。

それは最適化の基本だ。滑らかさがあれば、勾配を利用した最適化が可能になる。そうでなければ、ブルートフォース・アルゴリズムしか残らない。

 
Aleksey Nikolayev #:

最適化の基本

はい、それは知っていますが、最近は資本曲線そのものの滑らかさについて議論されていたので、私はこのような議論にはあまり踏み込んでいませんでした。

 

