トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2474

 
mytarmailS#: 新しいデータでモデルが機能しない理由、トレーダーがいつも負けている理由、市場の仕組みそのものが明らかになることに、誰も興味を示さない...いや、興味がない?

https://www.mql5.com/ru/forum/231011

https://squeezemetrics.com/download/The_Implied_Order_Book.pdf

Кукл :)
Кукл :)
  • 2018.03.07
  • www.mql5.com
Провел миниисследование на тему Кукла :) Если кто не верит в хождение за стопами, то вот вам с вертушки :) Конкретно на рисунке, пытался представит...
 
Evgeniy Ilin#:

ここには真実があるのですが、自分のモデルを確認したところ、そこでのメインは、どんなフォワードを頼りにしているのか...ということです。

よくわからないのですが、それは私の問題で、よく勉強していないのです。トレーディングのためのアルゴリズムとは少し違っていて、もっと非社会的なルールや遺伝的探索ルールや記号的回帰などの数式に注目しています。でももし、新しいデータで簡単なモデルをうまく動かすことができたら、とても面白い話ですね...。

お読みいただきありがとうございます...

私もMaitreidが大好きで、彼のビデオを8回ほど見ましたが、余計な言葉は一つもありませんでした...。

ダミーについては、私はそれがはるかに単純だと思う:交換は手数料で生き、ほとんどの人が 購入 したい場合は、 現在の 価格以下、この 買い要求、交換はそれらの多くがあるので、買い手を満足させるために有益であるので、手数料(お金)は、より稼ぐことができるので、価格が下がり、売り手と逆も同様です...

どうやっているかというと、値段を刷るだけなのか、タンブラーを操作しているのか、その他は分かりませんが、要は同じだと思います...。

そのため、参加者のポジションに逆行するような価格になってしまうのです。

 
mytarmailS#:

よくわからないのですが、勉強不足の私の問題で、トレーディングアルゴリズムには少し違った見方をしていて、非社会的ルールや遺伝的探索ルール、あるいは記号回帰などの計算式のほうを見ています。 でも、もし新しいデータで通常のモデルをうまく動かすことができたのなら、その話を聞くのはとても面白いことです。

はい、私はそれを持っている、品質はトレーニングプロットのようではありませんが、常にその品質の一部が保持され、歴史の10年から前方私の研究では、最大1年、平均2〜3ヶ月にすることができますそれはかなり良い品質のために動作し、トレーニングプロットに相対パーセント60から70平均的に、おそらくです。ニューラルネットワークはより良い結果をもたらしますが、再トレーニングの基準を追加する必要があります。結合されたデータを重みのように入力し、データ量に一定の重みを与え、期待値や利益率のような最終バックセストの品質、そしてもちろん最終アルゴリズムの複雑さ(例えばすべてのパーセプトロンの重みの量)が判明しました。ニューラルネットワークでそれを実現するには、ニューロンの種類をできるだけ変え、層の数や構成は任意であるべきで、その場合は可能である。基本的に誰もが固定されたアーキテクチャのニューラルネットワークを使っていますが、なぜかアーキテクチャは柔軟でなければならず、この柔軟性を破壊することで再トレーニングを最小化する可能性を破壊することを理解していないのです。一般的に、同じ基準はもちろん、単純なモデルに適用することができ、必要であっても、あなたは良いフォワードを得るでしょう、私のモデルは、先に数ヶ月の利益を与え、設定は一日で更新されることがあります。主なトリックの一つは、できるだけ多くのデータ(10年以上の歴史)を取ることであり、この場合、グローバルなパターンの検索があり、それらは市場の物理学に基づいており、ほとんどの場合、まだ非常に長い時間動作しています。

 
Evgeniy Ilin#:

やっちゃった、クオリティが......。

強い鉄が必要だ、鉄の天井がある、でも、この問題を解決する方法があるんだ。

まだ読んでいない方は、きっと気に入ると思います。モデルの質の基準について、興味深い考え方が書かれています。

 
mytarmailS#:

強い鉄が欲しい、私もハード面で問題を抱えていますが、解決策はあります。

本当にサーバーが必要です)しかし、私はそれらを持っていない(私はちょうど死んだネットブックでこれらすべてを作った)、私は読むのに長い、痛い時間が必要です。しかし、それ以外の方法がない、あるいは、どこからか電力を取ってきて、一生懸命に負荷をかける、この場合、少なくとも20〜30の構成をチェックしなければならない、より良い百近く、それぞれの信号のハングとモニター、最も安定したものは自然淘汰を通過して残す、次に電力を追加しようとしている。それ以外の道はない、そうでなければ、すでにここで多くの人が書いているように、どこにも行けない道でしかない...。本当に、どこを掘ったらいいのか分からないまま、何年も経ってしまうこともあるんです。代替案は、フォーラムサイエンスの学位と、プロコペンコのショーの精神で月の満ち欠けと市場への影響についてのおしゃべりです ))) 。秘密でなければ、何を解決する のか?

 
Evgeniy Ilin#:

秘密でないとすれば、その解決 策は?

リンク先の本では、もっと分かりやすく解決策が書かれているのですが...。 本当に一読をお勧めします...。

簡単に言うと、問題を分割して、例えばデータをクラスタリングして、それぞれのクラスタに対して異なるモデルを学習させる必要があるのです。

例えば、1週間に5回取引日があるので、月曜日は1つのモデル、火曜日は2つ目のモデルを毎日学習させる、など。

 
mytarmailS#:

リンク先の本には、この解決策がもっと分かりやすく書かれているのですが...。 本当に一読をお勧めします...。

簡単に言うと、問題を分割して、例えばデータをクラスタリングして、クラスタごとに異なるモデルを学習させるというのが基本的な解決策になります。

またはさらに単純な例:5取引日の週に、我々は厳密に月曜日、火曜日のための第二、等の1つのモデルを訓練するそれは5回とすでに10年、および訓練の2年間の訓練サンプルを減らすことが判明し、その上に想像力である...。

読んでないけど、全部実装されてるんですね、私も同じ理由で、サンプル数を減らしても歴史の深いところまで分析できるようにする必要があってやったんですが、自分のパソコンの力不足でもっとうまくできる))))、さらにマルチスレッドとかを理解して実験的にやったんですが......。を最大限に活用するために、すべての

 
Evgeniy Ilin#:

読んでませんが、うちではすでに実装済みです。 私も同じ理由で、なんとかサンプリングを減らして、でも歴史の深いところまで分析できるようにしなければと思いやってみたのですが、私のパソコンの性能が足りず、もっとうまくできるはず ))))、しかもマルチスレッドとか...と思って実験的にやってきました。を最大限に活用するために、すべての

一丁

)))


=====

真面目な話、画質を落とさずに効率よくダウンロードする方法が書かれていますが、節約にはなりそうもないですね・・・。そろそろユーリスティックアルゴリズムに切り替えてもいいのでは...。

というのも、イベントや記号のバリエーションは何十ギガバイトにもなり、2000万個の記号を持つモデルを訓練することはできないからです...)) したがって、知識ベースは私にとって「次元の呪い」から抜け出す方法のように見えます。

 
mytarmailS#:

とか、知識ベースのようなもので、それが一番小さなつぶやきで、私の考えや思いはその方向です。イベントのバリエーションや記号は何十ギガバイトもあるでしょうし、2000万個の記号のモデルは学習できませんから・・・))

看板のことは忘れてください。私の考えでは、スカラー量(言い換えれば数式、たとえ論理的であっても数学的に還元できる、精度が落ちるだけで)である。これらのスカラー値や論理値はすべて価格から導かれるもので、他にデータがないため、追加のデータを使おうとしても、単に予測を悪化させるだけかもしれません。データはそれぞれ異なり、異なるソースからの場合もあり、その場合、どのデータを優先させるかは明らかではありません。どのような数値系列であっても、その系列を変換するすべての可能な方法を用いれば、その中に他のすべての数値系列を含むことができる...これを理解しようとする。この場合、アルゴリズムにこの特徴空間を与えず、自分でこれらの特徴を見つけさせる......。ベースはいらない、パワーがあればいい。システムがあり、それが部分的にでも機能するならば、次のステップは計算の分散化です。ワーカーはネットワーク化される必要があり、データベースは助けになりますが、共通の結果を得るためのリポジトリとして機能する必要があります。これはもう、マイニングのようなものですね。

 
Evgeniy Ilin#:

属性は忘れてください。私の理解では、スカラー量(言い換えれば数式、論理的であっても数学的に還元できる、精度が落ちるだけで)だと思います。これらのスカラー値や論理値はすべて価格から導かれます。なぜなら、他にデータがなく、追加データを使おうとしても単に予測を悪化させるだけかもしれないからです。データはさまざまで、異なるソースからの場合もあり、その場合、どのデータを優先させるかは明らかではありません。どのような数値系列であっても、その系列を変換するすべての可能な方法を用いれば、その中に他のすべての数値系列を含むことができる...これを理解しようとする。この場合、アルゴリズムにこの特徴空間を与える必要はなく、アルゴリズム自身にこの特徴を見つけさせる必要があるのですが......。ベースはいらない、パワーがあればいい。システムがあり、それが部分的にでも機能するならば、次のステップは計算の分散化です。ワーカーはネットワーク化される必要があり、データベースはその助けとなりますが、共通の結果を得るためのリポジトリとして機能する必要があります。これはもう、マイニングのようなものですね。

私はあなたのビジョンをよく理解していないので、反論はしませんが......。

私は、自分のアルゴリズムを一連のイベントとして捉えています。イベントはログルールで、シーケンスは時間指定されておらず、あるかないかのどちらかです。

(トレーダーがレベルを設定すると、価格は5分で到達するかもしれないし、1日で到達するかもしれないが、状況は同じである)。

そのため、このようなワーキングシーケンスのアンサンブルはTSになります。

しかし、このような「無次元」の配列を見つけるには、何兆ものバリエーションを調べる必要があります。私が考える解決策は、ハードディスクに知識ベースを作ることです。


移動窓を使ったアルゴリズムの「典型的な」トレーニングは、市場が安定していないため、バリエーションが機能しないと思います。 出力は、過去の記憶を持った移動平均になりますが、非定常性のため、将来も繰り返されることはありません......。

理由: