トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2110

 
elibrarius:
ユニークなら曲がる。例えば、100個の文字列があり、そのうち10個がユニークで、そのうち2個が45文字列、8個が1文字である。5個のクアンタで割ると、1個ずつ5個だけが選ばれ、代表的な2個(各45個)はスキップされる可能性があります。

予測因子によって効果的なアプローチが異なるので、より良い選択方法を理解するために、さまざまなアルゴリズムを持っていたいわけです。MT5へのコード翻訳が可能であれば、私の研究を共有します。

 
Aleksey Vyazmikin:

一様分布ならわかりますが、まずユニークな値の配列を作り、それを使ってカットします。

しかし、グリッドを分割する方法は他にもあります。

均一 - 単純に値の範囲を 分割し、例えば0から100までの列の値、ステップ量子= 100/255 = 0.39だけ行ではなく、値で。すなわち、0,0.39,0.78 ...........................。99.61

そして、これらの値を使って、実際にカラムに存在するものを探し、重複を削除することができます。


UniformAndQuantiles - 方法1で半分の255/2=127の量子を、方法2で128の量子を探し、1つの配列にまとめるだけです。

残りの3つの方法は複雑で、私は見ていません。

 
Aleksey Vyazmikin:

これらはCatBoostのサンプリング量子化法であり、この境界線によって列挙・学習が進められる。

私の実験では、グリッドは各予測子に対して個別に選択されるべきで、そうすれば品質向上が見られるのですが、CatBoostでは それができず、グリッドを構築してcsvにアップロードし、それを繰り返してその中のターゲット動作を評価しなければならないのです。これは非常に有望なチップだと思いますが、コードをMQLに翻訳する必要があります。

1)こんな感じです。別カラムで ソートされたものを、量子に分割するのです。

2)まさに その通りです。

 

均一 -値の範囲を 単純に分割、例えば列の値を0から100まで、ステップ量子=100/255=0.39だけ行ではなく、値で分割します。すなわち、0,0.39,0.78 ...........................。99.61

そうすれば、実際にカラムに存在する値を見つけ、重複を削除することができます。


UniformAndQuantiles - 方法1で半分の255/2=127の量子を、方法2で128の量子を探し、1つの配列にまとめるだけです。

他の3つの方法は複雑で、私は調べませんでした。

これらは、私たちが興味を持っている複雑なものです :)

また、UniformAndQuantilesについては理論はわかっているのですが、実際にどうやるのか、つまり、so quantumとso quantilesがある領域をどう定義 するのかがわかりません。ここで私は理解していない - または1つのメソッドによって、真ん中までと、別の方法で後 - しかし、それはクレイジーです。

 
Aleksey Vyazmikin:

適切なブレイクダウンの選択が結果に大きく影響する。

これはリコールに関する例ですが、最大で50%のスプレッドがあり、私にとっては重要なことです。

境界を8から512まで512刻みで増やすと-ヒストグラム上では順不同ですが-名前が少し邪魔になりますね。


メッシュの選択についてはまだ実験中ですが、単にフィットするだけでなく、ロジックに従うために異なるメッシュが必要な予測変数があることは既に明らかです。

65535クアンタで、悩まないでください。可能な限り正確な計算を行います。

 
Aleksey Vyazmikin:

これらは、私が興味を持っている複雑なものです :)

また、UniformAndQuantilesについては理論はわかっているのですが、実際にどうやるのか、つまり量子化する領域と量子化する場所をどう定義 するのかがわかりません。ここで私は理解していない -または1つのメソッドによって中央まで、そして別の後に- しかし、それはクレイジーだ。

はい

 
elibrarius:

1)こんな感じです。別の列をとって ソートし、量子に分割するのです。

2)まさに その通りなのですが、なぜそう思われるのでしょうか?

定量化する際に、ターゲットと値の集合の関係をどう評価すればいいのかがわからない。これは、可能であればすべての予測因子について、グリッドを所定の数のセグメントに分割するもので、それは必ずしも必要ではありません。しかし、CatBoostは、私が使っているような、(別途用意した)量子化グリッドを使った作業方法を知っています。

 
elibrarius:

65535クアンタを取って、汗をかかないでください。可能な限り正確な計算を行います。

いや、フィッティングであって、意味のあるモデルではないだろう!

 
elibrarius:

はい

かなり異様な感じです。

 
Aleksey Vyazmikin:

定量化する際に、ターゲットと値の集合の関係をどのように推定すればよいのかがわからない。 グリッドは、可能であればすべての予測因子について、所定の数のセクションに分割されるが、これは必ずしも必要ではない。しかし、CatBoostは、私が使っている、提出された(別途用意された)量子化のグリッドとの連携方法を知っているのです。

そして、どうするか?