記事についてのディスカッション - ページ 13

削除済み  
Evgeni Gavrilovi:

そうだ。

こう書いてある

<MT4Orders.mqh> をインクルードする。

<TradeAccountInfo.mqh> と書かれています。

#include <cat_model.mqh>.

そして最も重要なことは、jupyter notebookから直接mqhをロードすると、すべてがうまくいくことです。

なるほど...まあ、colabへの転送がおかしいのでしょう...まだ見ていません、別の記事で忙しいので )
 
Maxim Dmitrievsky:
なるほど...まあ、colabへの転送がおかしいんだろうね...まだ見てないんだ、別の記事で忙しいから )

画面を録画しておいたので、colabでcat_model.mqhを読み込む。


削除済み  
Evgeni Gavrilovi:

colabでcat_model.mqhをロードする。


そのファイルをコンピュータに保存するときと、colabでlook_backの設定とマスクのリストの設定は一致していますか?そうでないと、誤った数のフィーチャーがモデルに保存され、あなたのような配列 オーバーランエラーが発生します。
 
Maxim Dmitrievsky:
パソコンとラボでファイルを保存する際、look_backの設定とMAのリストは一致していますか?そうでないと、間違った数のフィーチャーがモデルに保存され、あなたのように配列の 外に出るというエラーが発生します。

はい、完全に一致しています。

問題は、get_prices関数がないとエラーになることです。

テストファイルは過去6ヶ月分、トレイニングファイルは過去3ヶ月分しかありません。

削除済み  
Evgeni Gavrilovi:

ああ、完璧にマッチしている。

問題は、get_prices関数がないとレコードが失敗することです。

日数はテストファイルより2倍多く、テストファイルには過去6ヶ月分ありますが、トレイニングには過去3ヶ月分しかありません。

いいえ、パーサーの問題だと思います。モデルが保存されるときに、形質の数が間違って設定されているのです。つまり、モデルはある数を学習するが、パーサーは別の数を保存する。後で解決しよう。調べる時間がないんだ。
 
Maxim Dmitrievsky:
いいえ、パーサーが原因だと思います。モデルを保存する際に、特徴数の設定が間違っているのです。つまり、ある数を学習しているのに、パーサーが別の数を保存しているのだ。後で解決しよう。まだ時間がないんだ。

OK)

 

全バリアントを検索してcolabにデータをロードする問題を解決しました。

get_prices関数の中でpr = pd.read_csv('file.csv', sep=';') と直接書いて、この値を返す必要があります。

 

ランダムフォレストにねじ込んだ。10000サンプル、100ツリーで安定動作し始める。

削除済み  
welimorn:

ランダムフォレストにねじ込んだ。10000サンプル、100ツリーで安定動作し始める。

不思議なアプローチだ。クラスのバランスをとるためにね。我々の目的には合っているかもしれない。ちょっと目を引いた。

https://towardsdatascience.com/augmenting-categorical-datasets-with-synthetic-data-for-machine-learning-a25095d6d7c8

Augmenting categorical datasets with synthetic data for machine learning.
Augmenting categorical datasets with synthetic data for machine learning.
  • Egor Korneev
  • towardsdatascience.com
Consider a hypothetical but common scenario. You need to build a classifier to assign a sample to a opulation group. You have a sizable training dataset of one million samples. It has been cleaned, prepared and labeled. The few continuous variables are already normalized, and categorical variables, representing the majority of features, are...
 
Maxim Dmitrievsky:

カロッホ......よくわからないんだ。)でも、それがあるのとないのとでは違いがないと思うんだ。僕の考えでは、すべてはターゲットで決まるのであって、それ以外の何物でもないんだけど...。


私は60kのデータを持っている。

最初の1万点からランダムに500点を選びます。

すぐにモデルを訓練するか、gmmを訓練してからモデルを訓練する。

残りの5万点でテストする

そして通常の方法でも、 gmmと 同じようなモデルを見つけることができる。

例えば

gmm なしの モデルは500点で訓練され、50k点でテストされる。


=================================================================================================

考えてみると面白いものを見てしまった......。

マーケットを状態に分けて、その戦略の各状態でトレードするべきだというような視点があるが、私の知る限り、すべての試みは失敗している。状態が見えないか、「一種の」状態でもモデルのトレードは不調だ。

しかし、この方法では、モデルがどの市場を「好き」なのかがはっきりわかる。どの市場が好きで、どの市場が嫌いなのか。

おそらく、マシュカからのリターンがサインとなるため、モデルは平坦な状態の方がうまく機能するのだろう。