トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Доктор 2021.12.18 21:30 #25251

Aleksey Nikolayev#:

例えば、1<=t1<=t2<nであれば、ACF(t1,t2)=sqrt(t1/t2)となります。

もうひとつ質問があります。ここでは、無限大の標本における隣接する値のACFを考える。例えば、t1=1, t2=2 のように。ACF =sqrt(0.5) ~ 0.707 となる。ここで、t1=10000, t2=10001のように近傍の値をとってみると、 ACF=1（ほぼ）。近接した値同士は相関が異なることがわかった。正常なのでしょうか？

JeeyCi 2021.12.19 06:34 #25252

LenaTrap#:

正直なところ、まったく理解できない。

p.s. 誰か頭のいい数学者が私に同情して、何が起こっているのか説明してくれるかもしれませんね。

貿易に「超頭の良い数学者」は必要ないのでは・・・・。

DLは、内部（隠し）ハンドルt瞬間、外部t-1、t+1...の3層からなる。- ということは、自己相関がある可能性がある...。イミフ私はこのように考えています。

ただ、なぜか、特徴の時間的変化のデルタではなく、何らかの指標をとれば、時間空間で交差する値の自己相関の影響は、ある程度平準化されるような気がするのですが...。論外close(t)/close(t-1)にも交点があるため、自己相関があるため...。TF>15minでは自己相関がなくなるようですが（観測されていません） - 私自身は確認していませんが・・・。そして、これはまだ私が必要とするインデックスではありません...。

適切なTFの値動きのモデリングに自己相関を求めるのは無駄である...また、ティック毎にモデルを使用するのは意味がない（規則性の導出、しかも長期的なもの）...。イミフ

しかし、リカレントニューラルネットワークは、情報を前方に渡すだけである（ボルツマンマシンの出現により、多層確率学習で使われ始めた）...。すでに鳴りを潜めているが

リカレントネットワークとベイズ法は、それ自体、金融時系列から「記憶」を引き出す能力も、新しいデータに対して最も頑健なモデルについての結論を得る能力も実証していない。

そのため、誤差の逆伝播とそのdy/dxの最小化を行う再帰的ネットワークが実際の問題で使用されています（dy/dxの最小化という理由だけで積分を行うことができるため）。

追伸

一般に、私としては、同じモンテカルロ法でも、機械によるものだけですが......。バックプロパゲーションを使った前方探索では、まだ何も新しいことは見えてきません...純粋に用語的に...。

ピーピーエス

ただし、Theanoを使えば、PCのリソースをあまり使わずに何かを試すことができる（TensorFlowがもてはやされているが）...。

で、YとXは開発者の裁量（アプリオリに、あるいは統計解析の結果として）である...。Pythonが得意なら -- sklearnでは2in1の特徴でもすでにいくつかのメソッドで実装されている？例！ -- そして特徴の重要性は自分でやって、MLも自分でやる -- 数行で（corrcoefを 2行で見つけたように）。

JeeyCi 2021.12.19 06:41 #25253

LenaTrap#:

リアルマーケットで？個人的には、こんな哲学のようなものがあります。

*しかし、根拠がなければ仮定を議論しても意味がないので、あまり議論したくはありません。

実際の取引では - 意味を捻じ曲げないでください...

そうですね、確かに哲学は人それぞれですからね...。統計学の目的は、分散を説明することです。

と独立したテストからの依存関係を形式化する

Aleksey Nikolayev 2021.12.19 06:48 #25254

医師番号:

もうひとつ質問があります。無限大の標本における近傍値のACFを考える。例えば、t1=1, t2=2 のように。ACF =sqrt(0.5) ~ 0.707となる。ここで、t1=10000, t2=10001のように近傍の値をとってみると、 ACF=1（ほぼ）。近接した値同士は相関が異なることがわかった。正常なのでしょうか？

そうなんです、そうなんです。これが、SBの非定常性を語る2つ目の理由である（1つ目は時間による分散の増大）。ACFが時間差ACF(t1,t2)=ACF(t1-t2)にのみ依存するのは（その定義から）定常過程のみである。このため、定常系列では、ACFは通常、1つの引数t1-t2の関数として書かれる。

Aleksey Nikolayev 2021.12.19 06:57 #25255

Doc#:

もちろん、この質問はアレクセイにするべきだ。でも、私なら「何でもいい」と答えますね。問題は、SBがsqrt(t)に比例した経路を移動することだと思います。

何が言いたかったかというと、有名な「プレイヤーの破滅」問題である。例えば、価格がある水準まで「上昇」した場合の効果の統計的な有意性を検証するために使用することができる。

mytarmailS 2021.12.19 07:56 #25256

Aleksey Nikolayev#:

有名な「プレーヤー潰し」問題を意味していた。例えば、価格がある水準に「向上」することの効果の統計的な有意性を検証するために使用することができる。

その方がずっと面白い。

相場は時系列であるという視点を捨て、いよいよ相場分析にブレークスルーを起こすべきかもしれません。

Доктор 2021.12.19 11:57 #25257

Aleksey Nikolayev#:

そうなんです、そうなんです。これが、SBの非定常性を語る2つ目の理由である（1つ目は、時間と共に分散が大きくなること）。ACFが時間差ACF(t1,t2)=ACF(t1-t2)にのみ依存するのは（その定義から）定常過程のみである。そのため、静止系列ではACFは通常1引数t1-t2の関数として書かれます。

OKです。質問を変えます。以下の2つの状況は、それぞれ異なるのでしょうか？

1) 無限の大きさのサンプルがある。2つの時間モーメントnと(n-t)を考える。1 <= (n-t) <= nと考える。ACF((n-t),n)=sqrt((n-t)/n) を計算する。

2) 長さnの標本がある。ラグtのサンプルACFを計算する：ACF(t) =sqrt((n-t)/n).

LenaTrap 2021.12.19 12:21 #25258

JeeyCi#:

ただ、なぜか、特徴の時間的変化のデルタをとらずに、何らかの指標を契約すれば、時間空間での重複する値の自己相関の影響がなんとか平準化されるような気がするのですが......。論外close(t)/close(t-1)にも交点があるため、自己相関があるため...。TF>15minでは自己相関がなくなるようですが（観測されていません） - 私自身は確認していませんが・・・。と、まだ必要なインデックスではないのですが......。

しかし、トレンドがあると、時系列データは自己相関を示し始め、時には非常に高くなり、理論的には多くの分析モデルやニューラルネットワークに干渉するはずです。

なぜなら、トレンドは順位によって変化し、カオスは秩序によって変化し、ランダムにさまよう時系列は突然まったくさまよわなくなり、その逆もまたしかりで、このような推定ではプロセス構造を理解することができないからです。

しかし、ニューラルネットワークが自己相関にどのように反応するかを確認し、もし自己相関が存在し干渉するようであれば除去してみる価値はあるのかもしれません。隣接する要素は全く重なってはいけない(そう思っているのなら?)、そんなデータを使っていたら、モデルが機能したらすごい奇跡です。

JeeyCi 2021.12.19 13:02 #25259

LenaTrap#:

本当に必要ないのでしょうが、どんなトレンドでも、時系列データ

をねじ曲げないでください。私と議論しようとすると、あなたはまだあなたのことを話している...ちょうど時系列で...(サンプリング方法も誰もキャンセルしていない）...。

価格長期は時間の関数ではない、私は何度も主張した(重複しない)...DLで自己相関が取れる場所...XとYに何を使うか、どんな依存関係をモデリングするか...私も10回目に書きましたが、開発者の判断で...です。

私はあなたのモデルの開発者ではないので、価格の時間的な振る舞いを証明する必要はないのですが...。(DLに落書きしたのがいけなかったのかもしれませんが......ここの皆さんは何かを考えて反論したり、誰かに何かを証明したり、あらゆる学問の中から一文字ずつ抜き出しています)......。ここにいない）MOをやっているエンジニアは、トレンドでもティックでも、自分のノミ（自己相関）が出てくる地平線よりもずっと広い側面、広い学習セットの地平線でモデルを構築すれば、自己相関の議論の狭さを（オタク的な話として）まだ理解できるのですが......。そのためのディープラーニングです。

...私にとっては、トレードの問題は問題ではありません。

Aleksey Nikolayev#:

有名な「プレイヤーの破滅」問題。

......だから私は長い間この無意味なことを避けてきたのです...ここにいる誰もモデリングについて理解していないことが明らかになりましたし、理解している人はこのスレッドで時間を無駄にすることはありません...。OK、ネットにはあなたがここで意味もなく吐いたあからさまな専門用語より、もっと役に立つDL情報がたくさんありますよ ...

統計学については、アカデミックな数学者に聞いたほうがいいし、私が答えるべきことでもない...。- 自己相関がDLを支配しているというあなたの信念に興味はないのですが...。- 5回目にして「ダメなモデルです」と書いてしまった（10回目は書きたくない）...。学問に答えさせる（もし、私の答えで何かを証明したくなったのなら）

Aleksey Nikolayev 2021.12.19 13:03 #25260

医師番号:

まあ、いいや。質問を変えます。以下の2つの状況は、それぞれ異なるのでしょうか？

1) 無限の大きさのサンプルがある。2つの時間モーメントnと(n-t)を考える。1 <= (n-t) <= nと考える。ACF((n-t),n)=sqrt((n-t)/n) を計算する。

2) 長さnの標本がある。ラグtのサンプルACFを計算する：ACF(t) =sqrt((n-t)/n).

違いは、最初のケースでは、ACFはすべての可能な時間モーメントのペアについて考慮されるのに対し、2番目のケースでは、時間モーメントの1つが固定されt2=nであり、多くの時間モーメントのペア（例えば、ペアt1=1、t2=2）が考慮から外れることである。一般に、ACFは2つの引数の関数である。定常過程の場合のみ、ACFは1つの引数t=t1-t2（ラグ）の関数として考えることができる。

サンプルACFは常にプロセスの特定の数値サンプル（実現）から計算され、常に1つの引数（ラグ値）の関数であることが判明しています。これは、SB実装のサンプルACFがそのACFの推定値ではない主な理由である)

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2526