記事"ランダムフォレストの予測トレンド"についてのディスカッション - ページ 13

 
MetaQuotes Software Corp.:

新しい記事 Predicting Trends with Random Forests が掲載されました:

ByСанСаныч Фоменко


このモデルは予測は非常に簡単ですが、実際には多くの問題があります。

1.ジグザグ信号がターゲットとして選択されているため、最も単純な変数の1つは、例えば、過去20サイクルのPRICEの並べ替え、ターゲット設計から明らかに、ジグザグの信号は、moverank_price_20 =1のときに上向きであり、moverank_price_20 >1のときに、彼の中から予測することができます。ジグザグのシグナルが下向きである確率は90%以上であり、このような変数は数多く構築できるので、モデル予測は成功しやすい。しかし、ここで1つのアプリオリな条件は、このポイントがジグザグのポイントであることを知らなければならないということである。ジグザグのポイントでなく、他のポイントであれば、上記の変数は予測能力に存在しない。

2.そのため、ジグザグの起点がわからないので、すべてのデータを計算する必要があり、この時、moverank_price_20 =1は、ジグザグの起点であるとは思わないので、トレンドが上昇した後、ポイントを変更することを予測することができないので、適用するときに大きな問題が発生します。

3.ジグザグの目標設定方法は難しい。

 
Windowsで何を置けばいいのか教えてください。できればロシア語で。https://rattle.togaware.com/rattle-install-mswindows.html。
 

記事に表があります



01平均減少精度 平均減少ジニ
MA_eur.5.dif142.9741.8554.86 321.86
EUR.dif337.2146.3851.80177.34
RSI_eur.1437.7040.1150.75254.61
EUR.dif2 24.6631.6438.24110.83
MA_eur.10.dif122.9425.3931.48193.08
CHF.dif3 22.9123.4230.1573.36
MA_chf.5.dif1 21.8123.2429.56135.34


しかし、その数値がそれ自体何を意味するのかについては何も語られていない。他の数値との関係は理解できる - より良い - より良いが、その値自体はどうあるべきで、何に依存しているのだろうか?この論文では,MeanDecreaseGiniの最大値は321.86であり,私は1876を持っています - それは予測変数の数に依存するのですか?そして、MeanDecreaseAccuracyは140.22です。たぶん、すべての値を最大値のパーセンテージに変換すべきでしょうか?

 
Aleksey Vyazmikin:

記事の中に表がある。



01平均減少精度 平均減少ジニ
MA_eur.5.dif142.9741.8554.86 321.86
EUR.dif337.2146.3851.80177.34
RSI_eur.1437.7040.1150.75254.61
EUR.dif2 24.6631.6438.24110.83
MA_eur.10.dif122.9425.3931.48193.08
CHF.dif3 22.9123.4230.1573.36
MA_chf.5.dif1 21.8123.2429.56135.34


しかし、その数値がそれ自体何を意味するかについては何も述べられていない。他の数値との関係は理解できる - より良いことはより良いが、その値自体は何であるべきで、何に依存しているのだろうか?ここでは,MeanDecreaseGiniの最大値は321.86であり,私は1876を持っている - それは予測変数の数に依存するのか,それとも何なのか?そして、MeanDecreaseAccuracyは140.22です。すべての値を最高値のパーセンテージに変換すればよいのでしょうか?

これは、randoForestと呼ばれるツリーの束を構築しながら予測子を使用した場合の内部統計です。異なるモデルを比較することは全く意味がありません。同じモデル内でさえ比較できていません。予測因子を選択したければ、他のツールを使う必要がある。私は機械学習のスレッドで何度も書いてきた。

 
СанСаныч Фоменко:

これは、randoForestと呼ばれる複数の木をまとめて構築する際に予測子を使用する内部統計である。異なるモデルを比較しても全く意味がない。同じモデル内でさえ比較できていません。予測因子を選択したければ、他のツールを使う必要がある。私は機械学習のスレッドに何度も書いてきた。

なるほど、モデル内の推定量であって、絶対的なものではないのですね。

たぶん、もちろん、フォーラムに書いたが、そのボリュームに対処するために....- 私はリーダーを通してフォーラムの半分を読んだ。もし正しい方向を示していただけるなら、ありがたいです。

 
Aleksey Vyazmikin:

なるほど、モデル内の推定値ではあるが、絶対的な推定値ではない......。

たぶん、もちろん、フォーラムに書いたが、そのボリュームに対処する...- 私は私のリーダーを介してフォーラムの半分を読んだ。あなたが鼻を突く場合、私は感謝したいと思います。

1.それはモデリングに匹敵するデータマイニングと呼ばれる、業界全体であるため、私は、短い答えを持っていない

2.データマイニング分類モデルの標準的なスキームは以下の通りである:

  • ターゲット変数を定義する
  • このターゲット変数の予測変数を探します。
  • 予測変数の予測力を決定する,すなわち,予測変数の一部は1つのクラスを予測し,他の一部は別のクラスを予測する,重なりが小さいほど予測変数がよい.
  • 予測変数の重要性を決定するためにパッケージを使用します。多くのパッケージがあるので,概要とともにファイルをチェーンする

3.できればクロスバリデーションで、ファイルの前半にモデルを適合させる。

4.ファイルの後半でチェックする。結果は一致しなければならない


これには多くのDONEツールが必要だ。最高なのはcaretだ。必要なものはすべて揃っている。しかし十分ではない。


PS.

これはRだ。その外では、言葉にならない赤ん坊のおしゃべり以上のことはできない。

ファイル:
 
СанСаныч Фоменко:

1.それはデータマイニングと呼ばれる業界全体であり、モデリングに匹敵するものなので、簡単な答えはありません。

2.データマイニングの分類モデルの標準的なスキームは以下の通りである:

  • ターゲット変数を定義する
  • このターゲット変数の予測変数を見つける
  • 予測変数の予測力を決定する,つまり,予測変数の一部は1つのクラスを予測し,他の一部は別のクラスを予測する,重なりが小さいほど予測変数がよい.
  • 予測変数の重要性を決定するためにパッケージを使用します。多くのパッケージがありますが、概要のファイルを添付します。

3.ファイルの前半でモデルをフィッティングする。

4.ファイルの後半をチェックする。結果は一致するはずである。


これには多くのDONEツールが必要である。一番いいのはcaretだ。必要なものはすべて揃っている。しかし、十分ではない。


追記

それがRだ。その外では、言葉にならない赤ん坊のおしゃべり以上のことはできない。

ありがとう!

 
RStudioをインストールし、Boruta パッケージをダウンロードしました。
 
Aleksey Vyazmikin:
RStudioをインストールし、Boruta パッケージをダウンロードした。

すべてのパッケージについて、必ずドキュメントを読んでください。RStudioのパッケージタブを開き、検索でパッケージ名を入力し、出てきたパッケージ名をクリックすると、ヘルプが開きます。あるいは、パッケージ名で検索すると、関連資料へのリンクがあるかもしれません。

イデオロギーに興味があれば、パッケージに含まれる関数の中に理論的な記事へのリンクがあります。

CRAN Packages By Name
  • cran.r-project.org
The package will formally test two curves represented by discrete data sets to be statistically equal or not when the errors of the two curves were assumed either equal or not using the tube formula to calculate the tail probabilities
 
СанСаныч Фоменко:

すべてのパッケージについて、必ずドキュメントを読んでください。RStudioのPackagesタブを開き、検索にパッケージ名を入力し、出てきたパッケージ名をクリックするとヘルプが開きます。あるいは、パッケージ名のここを クリックすると、関連資料へのリンクがあるかもしれません。

イデオロギーが興味深いものであれば、パッケージに含まれる機能の中に理論的な記事へのリンクがあります。

ありがとう!

というわけで、説明の書かれたpdfを開いてみたのだが、ここで設定がダブってしまった。あまりにも多くのことが要求されていて、その半分の意味がわからない。

もっとシンプルで、信頼性が低くても、できればGUIでできるものはないでしょうか?

一般的に、このトピックについて、どこで、どのように、という詳細を記事にしていただけると非常に助かります!