トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Vyazmikin 2018.04.05 02:18 #8181

マキシム・ドミトリエフスキー

1: サンプルサイズを決めてください、あなたのサンプルは非常に小さいです。

2. 単純な(線形)分類/回帰モデルを調べてみてください。おそらくうまくいくでしょうし、もしエラーが大きいようなら、ターミナルのalglibライブラリにあるより複雑な(非線形)モデルに切り替えてみてください(決定木や森林もあります)

3) 特にRの使い方のアドバイスは絶対に受けない :)) このフォーラムから追放する時期が来たのです。

4.機械学習がなくても解決できる問題であれば、使わない方が良い

1.はい、これはあくまで例であり、現実にはもちろんサンプルは大きいです。

2.ありがとうございます。もちろん、簡単なものから始めたほうがいいのですが、これはデータマイニングという問題において、私の開発の新しいステージだと思います。

3.MQLの代替品について知ることができてよかったです。

4.今のところ、貿易に与える影響の度合いによって、特徴（パターン）を分類していきたいと考えています。自分のTSがフィットする方向に展開し始めたのが怖いですが、その妄想を否定するために、市場行動の兆候という形でアイデアを蓄積していきたいと思っています。

削除済み 2018.04.05 02:24 #8182

アレクセイ・ヴャジミキン

1.はい、これはあくまで例であり、現実にはもちろんサンプルは大きいです。

2.もちろん、簡単なことから始めたほうがいいのですが、これはデータマイニングの問題で私が成長する新しい段階だと思います。

3.だから、MQLの代替品について知ることは良いことだと思うのですが・・・。

4.今のところ、貿易に与える影響の度合いによって、特徴（パターン）を分類していきたいと考えています。というのも、私は自分のTSをフィッティングの方向に展開し始め、そして自分の幻覚を否定するために、市場行動の兆候という形でアイデアを蓄積していきたいのです。

http://alglib.sources.ru/dataanalysis/

これらはすべて mql で利用可能です (ライブラリはターミナルに標準装備されています)

クラスタリングには、単純なk-meansを使用することができます。

また、ロジスティック回帰（youtubeには、ロジスティック回帰とは何か、どのように使うのかのクリップがたくさんあります）（多重ロジット回帰）を試してみるとよいでしょう。次に多層ペルセプトロンだが、これもクラス分けはするが、より複雑な（非線形）方法である。

通常の決定木ではうまくいかないので、森を使うとよいでしょう。森は、異なるパーティションで区切られた複数の木で構成されており（たとえば、1番目のパーティションは1番目の変数ではなく、3番目の変数が使われます）、すべての木の結果を平均して、より正確で堅牢な推定値を得られます。しかし、問題が本質的に線形であることが判明した場合、scaffoldingは適切ではなく、ロジスティック回帰や隠れ層1層のペルセプトロンを使う方がよいでしょう。ですから、まずは最も単純な線形モデルから始めて、その結果に満足するのであれば、悩む必要はないでしょう。

Dr. Trader 2018.04.05 02:26 #8183

アレクセイ・ヴャジミキン

曜日による影響を見る場合、曜日を示す別の入力パラメータを作るべきでしょうか、それとも1～5を示す1つのパラメータで十分でしょうか?）

Forestは、値の比較に「more」または「less」演算を使用するルールを作成します。

値1,2,3,4,5の場合 - たとえば、水曜日だけ働くルールを作る必要がある場合、「木曜日より小さい」と「火曜日より大きい」の2つのブランチを取ります。
マーキングのある異なるパラメータであれば、1回の比較で十分である（マーキングが0より大きい）。
ルールを作るために必要な分岐が少なければ少ないほど、モデルはシンプルになり、より良いものになります。

一般的に両方一緒にやってください。値1,2,3,4,5を持つ1列の列。そして、さらに5列のラベル付き。

Dr. Trader 2018.04.05 02:53 #8184

アレクセイ・ヴャジミキン

私の例のように答えが分かっている場合はともかく、より複雑なタスクの効率性について、異なるアルゴリズムの比較を行ったことのある人はいるのでしょうか？

このようなデータを予測することを分類といいますが、その際に必要な答えは、単に値の組であったり、数字ではなく用語（「exit trade」、「roll over」など）であったりします。
ニューロニックとブースティングは相性がよく、そのようなデータで学習させ、新しいデータでの予測に使うことができるのです。

あなたの目標は、データから最も価値のある情報を抽出し、読みやすいルールのセットを得ることだと理解しています。そうすると、ニューロニクスは機能しません。ニューロニクスからルールや知識を抽出するのは、そう簡単ではありません。

森は多くの選択肢、多くの木（式）を与え、最終的な答えは投票によって決められ、それぞれの式が異なる答えを与え、最終的に最も人気のあるものが選ばれる。しかし、このようなルールの乱立は解釈が複雑すぎて、上に書き加えたような絵がたくさん出てきて、それぞれが違う答えを出し、その結果が最もよくヒットするものになるのでしょう。

1本の木から、上のような絵が描かれ、複雑な場合は何十、何百もの枝がグラフになります。しかし、絵の中の枝をたどっていけば、簡単に解釈し、繰り返すことができるのです。

多くのモデルがあり、用途に応じて最適なものを選ぶことができます。

MQLのAlglibは、これらもすべて行うことができます。しかし、わずかな変更のたびにスクリプトをコンパイルし、実行し、結果を待たなければならないのは不便です。

RやPythonでは、エラーが発生した場合、前の行のコードを単純に再実行し、変更することができます。スクリプトの実行中に作成されたすべてのオブジェクトはメモリに残り、新しい行を予測したり実行したりしながら作業を続けることができます。mqlのように、わずかな変更でスクリプト全体を起動し直す必要がない。

Alexander_K2 2018.04.05 13:59 #8185

一服している間に、ここに文章を投稿して、興味のある人がいるかどうか確認します。

Алёша 2018.04.05 17:19 #8186

ユーリイ・アサウレンコ

また、信頼度70％の区間で予測しても、ほとんど意味がありません。あまり難しいことではありませんが、やはり無駄です。

70％の精度は、50％の精度は本当に大したことはなく、70％の精度は、おとぎ話か、混合ターゲットを使用している人のミスであることを70％の精度で、SharpRatio >30、それは超HFTのためにさえ素晴らしいことです。

Алёша 2018.04.05 17:38 #8187

サンサニッチ・フォメンコ

100回目です。

1.データマイニングは必須である。ターゲット変数に影響を与える予測変数のみを選択することから始めることが必須である。そして、すべてのデータマイニング。

2.2モデルあります。

自動的にパターンを見つけるべき「分類
時系列の統計的特性を考慮する必要があるGARCH

3. 可能であれば、クロスバリデーションによるモデルの学習

4.学習ファイル以外のモデルの評価

5.テスターでテスト実行。

何度も言いますが、すべてのステップは必須です。

これらをすべて行った上で、「デポはすぐに売り切れることはない」という前提で考えてみてください

行くぞ、男たちよ!フォーラムをぶらぶらし、静かな喜びを持って、Rの概略計画を実行することを終了する。

スリー・チアーズ!

冗談です、私もあなたと同じで、ZZをGoalとして使うことを教えようとしているのです、私は甘く、あなたの邪悪な計画を理解していませんでした :)

СанСаныч Фоменко 2018.04.05 17:54 #8188

アリョーシャ

大丈夫です、冗談です、私もあなたのようにZZを目標に煽ってるんです、ただ私が甘く、あなたの陰湿な計画を理解していなかっただけなんです :)

ここでもう一度はっきりさせておきたいのは、私はZZを煽っているわけではなく、トレンド・トレーディング・システムのために非常に明確にしているということです。

そして、ターゲットやターゲットに対する予測因子も、すべて極めて複雑で、非常にコストがかかる。そして、このモデルはかなり手に取りやすくなっています。あるモデルがターゲットとその予測因子に対して決定的に不適当で、別のモデルが適している場合もある。一般的には、常に1ダースまたは2ダースのモデルを試すべきである。

Yuriy Asaulenko 2018.04.05 18:18 #8189

アリョーシャ

50%の精度は本当に大したことがなく、70%の精度はおとぎ話か、混合ターゲットを使う人の間違いであることを70%の確度で、SharpRatio >30、これは超HFTでも素晴らしいことだ

もう一度、わからない人のために。7割が現実です。70%の時間間隔であれば、容易に正当な予測を立てることができる。

このような予測の有用性の問題は別である。この70％の正当な予測のうち、取引に参加するのに現実的なのは約4分の1以下、つまり間隔の17％だけである。しかし、予測が正当化される場所を先験的に知ることができず、残りの30%は失敗した取引と「正しい」取引の見逃しの両方をかなりの部分与えてしまうことを考えると、信頼できる予測の70%を実行することは不可能です。

Vizard_ 2018.04.05 18:46 #8190

アリョーシャ

大丈夫です、冗談です、ZZを目標に宣伝しているのはあなたと同じです、私が甘かっただけです、あなたの邪悪な計画を理解していなかっただけです :)

陰湿なウィルス性の計画「ZZ-01」は、数年前にある
秘密の研究所でFaは、そのキャリアとしての役割を果たすだけだった。え、アリョーシャ...。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 819