トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 3254

mytarmailS 2023.09.23 15:08 #32531

Maxim Dmitrievsky #:SQLを読むのは効率的ですか？ 人生で一度も .... apache ArrowかDuckDBを使ってみてください。 それでもRAMが一番速い。 ..... 問題そのものは、G...醜いを介して解決され、あなたの問題は、必要のないcor.行列です。

削除済み 2023.09.23 15:09 #32532

Forester #:alglibには二重相関計算関数がある。変数をすべてchar/ucharに変えればすべてうまくいくと思う。 他にも使い古された関数が何十個もあるので、それも作り直すべきだ。そしてCMatrixDoubleから動的配列か何かに切り替えるべきだ。

Pearson product-moment correlation matrix

|//| INPUT PARAMETERS:
|//| X - array[N,M], sample matrix:
|//| * J-th column corresponds to J-th variable
|//| * I-th row corresponds to I-th observation
|//| N - N>=0, number of observations:
|//| * if given, only leading N rows of X are used
|//| * if not given, automatically determined from input
|//| size
|//| M - M>0, number of variables:
|//| * if given, only leading M columns of X are used
|//| * if not given, automatically determined from input
|//| size
|//| OUTPUT PARAMETERS:
|//| C - array[M,M], correlation matrix (zero if N=0 or N=1)
|//+------------------------------------------------------------------+
static bool CBaseStat::PearsonCorrM(const CMatrixDouble &cx,const int n,
const int m,CMatrixDouble &c) そして、もし自作のプログラムがあるのなら、もしそれを行う既製のパッケージがないのなら、量子化も行わなければならないだろう。 ナンパイで計算すると速いのに、パンダで計算すると長いし、メモリも食う。後で再確認します。

mytarmailS 2023.09.23 15:09 #32533

Maxim Dmitrievsky #:パターンなし、パターンは相関行列で検索される。 何か理解できないことがあるのかもしれない。

削除済み 2023.09.23 15:12 #32534

mytarmailS #:私が理解していないことがあるのかもしれない。パターン＝互いに高い相関関係を持つサンプルの集合全体。データセット全体には、このようなパターンがいくつも存在しうる。行列がなければ、何も見つからないか、断片的な部分を選ぶことになる。 だから、それぞれの行を取り出し、他のすべての行との相関を計算しなければならない。

Aleksei Kuznetsov 2023.09.23 15:26 #32535

Maxim Dmitrievsky #:パターン＝互いに高い相関を持つサンプルの集合全体データセット全体には、このような集合が多数存在する可能性がある行列がないと何も見つからないか、断片的な部分を選ぶことになる。 だから、それぞれの行を取り出し、他のすべての行との相関を計算しなければならない。 15-16シーズンも似たようなことをした。現在の状況、たとえば直近の20～50バーを取り出し、最も類似した20の例を履歴から探しました。そして、その20の例から平均的な未来を描きました。ほとんどの場合、直線で+-5ポイントだった。当時、5ptの利益は私には少し小さく、ノイズの端にあるように思えた。結局、私はMOに切り替えました。 一般的には、クラスタリングに似ている。 ここでは、例の類似性が最大化される。. 木における分類/回帰は、これらの例の将来の類似性を最大化する。それは過去の類似性を悪くする。

削除済み 2023.09.23 15:28 #32536

Forester #: 昔、同じようなことをしたことがある。

mytarmailS 2023.09.23 15:47 #32537

Maxim Dmitrievsky #:パターン = 相互に高い相関を持つサンプルの全セットデータセット全体には、このようなパターンが多数存在する可能性があり、履歴のマッチ数はそれぞれ異なる行列がなければ、何も見つからないか、断片的な部分を選ぶことになる。 だから、それぞれの行を取り出し、他のすべての行との相関を計算しなければならない。 我々は3次元のデータを持っている。 行は観察で、列は形質です。 最初の行は最新のデータです。 2 5 -0.2773501 [4,] 2 5 3 0.9449112 [5,] 5 3 2 -0.1889822 [6,] 3 2 3 -1.0000000 [7,] 2 3 3 0.5000000 [8,] 3 3 1 0.5000000 [9,] 3 1 5 -0.8660254 [10,] 1 5 5 0.5000000 [11,] 5 5 2 0.5000000 [12,] 5 2 2 -0.5000000 [13,] 2 2 1 0.5000000 [14,] 2 1 5 -0.6933752 [15,] 1 5 5 0.5000000 [16,] 5 5 1 0.5000000 [17,] 5 1 1 -0.5000000 [18,] 1 1 5 -0.5000000 [19,] 1 5 5 0.5000000 [20,] 5 5 2 0.5000000 [21,] 5 2 2 -0.5000000 [22,] 2 2 1 0.5000000 [23,] 2 1 4 -0.7559289 [24,] 1 4 1 1.0000000 [25,] 4 1 4 -1.0000000 [26,] 1 4 3 0.7559289 [27,] 4 3 2 0.0000000 [28,] 3 2 2 -0.5000000 そして、最後/現在の行と履歴の間の「類似性パターン」を得ることができる。 クラスタリングをしてこのようなものを得ることもできる。 cor cluster [1,] 1 4 1 1.0000000 10 [2,] 4 1 2 -0.7559289 6 [3,] 1 2 5 -0.2773501 5 [4,] 2 5 3 0.9449112 10 [5,] 5 3 2 -0.1889822 7 [6,] 3 2 3 -1.0000000 3 [7,] 2 3 3 0.5000000 1 [8,] 3 3 1 0.5000000 4 [9,] 3 1 5 -0.8660254 5 [10,] 1 5 5 0.5000000 1 [11,] 5 5 2 0.5000000 2 [12,] 5 2 2 -0.5000000 9 [13,] 2 2 1 0.5000000 4 [14,] 2 1 5 -0.6933752 5 [15,] 1 5 5 0.5000000 1 [16,] 5 5 1 0.5000000 4 [17,] 5 1 1 -0.5000000 9 [18,] 1 1 5 -0.5000000 5 [19,] 1 5 5 0.5000000 1 [20,] 5 5 2 0.5000000 2 [21,] 5 2 2 -0.5000000 9 [22,] 2 2 1 0.5000000 4 [23,] 2 1 4 -0.7559289 5 [24,] 1 4 1 1.0000000 10 [25,] 4 1 4 -1.0000000 8 [26,] 1 4 3 0.7559289 1 [27,] 4 3 2 0.0000000 7 [28,] 3 2 2 -0.5000000 9 しかし、現在/最後の行に関する状態だけが必要なのに、なぜ相関行列 全体を 数える必要があるのか、私には理解できない。 [,1] [,2] [,3] [,4] [,5] [,6] [,7] [1,] 1.0000000 -0.75592895 -0.27735010 0.94491118 -0.1889822 -1.0000000 0.5000000 [2,] -0.7559289 1.00000000 -0.41931393 -0.92857143 0.7857143 0.7559289 -0.9449112 [3,] -0.2773501 -0.41931393 1.00000000 0.05241424 -0.8910421 0.2773501 0.6933752 [4,] 0.9449112 -0.92857143 0.05241424 1.00000000 -0.5000000 -0.9449112 0.7559289 [5,] -0.1889822 0.78571429 -0.89104211 -0.50000000 1.0000000 0.1889822 -0.9449112 [6,] -1.0000000 0.75592895 0.27735010 -0.94491118 0.1889822 1.0000000 -0.5000000 [7,] 0.5000000 -0.94491118 0.69337525 0.75592895 -0.9449112 -0.5000000 1.0000000 [8,] 0.5000000 0.18898224 -0.97072534 0.18898224 0.7559289 -0.5000000 -0.5000000 [9,] -0.8660254 0.32732684 0.72057669 -0.65465367 -0.3273268 0.8660254 0.0000000 [10,] 0.5000000 -0.94491118 0.69337525 0.75592895 -0.9449112 -0.5000000 1.0000000 [11,] 0.5000000 0.18898224 -0.97072534 0.18898224 0.7559289 -0.5000000 -0.5000000 [12,] -0.5000000 0.94491118 -0.69337525 -0.75592895 0.9449112 0.5000000 -1.0000000 [13,] 0.5000000 0.18898224 -0.97072534 0.18898224 0.7559289 -0.5000000 -0.5000000 [14,] -0.6933752 0.05241424 0.88461538 -0.41931393 -0.5765567 0.6933752 0.2773501 [15,] 0.5000000 -0.94491118 0.69337525 0.75592895 -0.9449112 -0.5000000 1.0000000 [16,] 0.5000000 0.18898224 -0.97072534 0.18898224 0.7559289 -0.5000000 -0.5000000 [17,] -0.5000000 0.94491118 -0.69337525 -0.75592895 0.9449112 0.5000000 -1.0000000 [18,] -0.5000000 -0.18898224 0.97072534 -0.18898224 -0.7559289 0.5000000 0.5000000 [19,] 0.5000000 -0.94491118 0.69337525 0.75592895 -0.9449112 -0.5000000 1.0000000 [20,] 0.5000000 0.18898224 -0.97072534 0.18898224 0.7559289 -0.5000000 -0.5000000 [21,] -0.5000000 0.94491118 -0.69337525 -0.75592895 0.9449112 0.5000000 -1.0000000 [22,] 0.5000000 0.18898224 -0.97072534 0.18898224 0.7559289 -0.5000000 -0.5000000 [23,] -0.7559289 0.14285714 0.83862787 -0.50000000 -0.5000000 0.7559289 0.1889822 [24,] 1.0000000 -0.75592895 -0.27735010 0.94491118 -0.1889822 -1.0000000 0.5000000 [25,] -1.0000000 0.75592895 0.27735010 -0.94491118 0.1889822 1.0000000 -0.5000000 [26,] 0.7559289 -1.00000000 0.41931393 0.92857143 -0.7857143 -0.7559289 0.9449112 [27,] 0.0000000 0.65465367 -0.96076892 -0.32732684 0.9819805 0.0000000 -0.8660254 [28,] -0.5000000 0.94491118 -0.69337525 -0.75592895 0.9449112 0.5000000 -1.0000000 [,8] [,9] [,10] [,11] [,12] [,13] [,14] [1,] 0.5000000 -0.8660254 0.5000000 0.5000000 -0.5000000 0.5000000 -0.69337525 [2,] 0.1889822 0.3273268 -0.9449112 0.1889822 0.9449112 0.1889822 0.05241424 [3,] -0.9707253 0.7205767 0.6933752 -0.9707253 -0.6933752 -0.9707253 0.88461538 [4,] 0.1889822 -0.6546537 0.7559289 0.1889822 -0.7559289 0.1889822 -0.41931393 [5,] 0.7559289 -0.3273268 -0.9449112 0.7559289 0.9449112 0.7559289 -0.57655666 [6,] -0.5000000 0.8660254 -0.5000000 -0.5000000 0.5000000 -0.5000000 0.69337525 [7,] -0.5000000 0.0000000 1.0000000 -0.5000000 -1.0000000 -0.5000000 0.27735010 [8,] 1.0000000 -0.8660254 -0.5000000 1.0000000 0.5000000 1.0000000 -0.97072534 [9,] -0.8660254 1.0000000 0.0000000 -0.8660254 0.0000000 -0.8660254 0.96076892 [10,] -0.5000000 0.0000000 1.0000000 -0.5000000 -1.0000000 -0.5000000 0.27735010 [11,] 1.0000000 -0.8660254 -0.5000000 1.0000000 0.5000000 1.0000000 -0.97072534 [12,] 0.5000000 0.0000000 -1.0000000 0.5000000 1.0000000 0.5000000 -0.27735010 [13,] 1.0000000 -0.8660254 -0.5000000 1.0000000 0.5000000 1.0000000 -0.97072534 [14,] -0.9707253 0.9607689 0.2773501 -0.9707253 -0.2773501 -0.9707253 1.00000000 [15,] -0.5000000 0.0000000 1.0000000 -0.5000000 -1.0000000 -0.5000000 0.27735010 [16,] 1.0000000 -0.8660254 -0.5000000 1.0000000 0.5000000 1.0000000 -0.97072534 [17,] 0.5000000 0.0000000 -1.0000000 0.5000000 1.0000000 0.5000000 -0.27735010 [18,] -1.0000000 0.8660254 0.5000000 -1.0000000 -0.5000000 -1.0000000 0.97072534 [19,] -0.5000000 0.0000000 1.0000000 -0.5000000 -1.0000000 -0.5000000 0.27735010 [20,] 1.0000000 -0.8660254 -0.5000000 1.0000000 0.5000000 1.0000000 -0.97072534 [21,] 0.5000000 0.0000000 -1.0000000 0.5000000 1.0000000 0.5000000 -0.27735010 [22,] 1.0000000 -0.8660254 -0.5000000 1.0000000 0.5000000 1.0000000 -0.97072534 [23,] -0.9449112 0.9819805 0.1889822 -0.9449112 -0.1889822 -0.9449112 0.99587059 [24,] 0.5000000 -0.8660254 0.5000000 0.5000000 -0.5000000 0.5000000 -0.69337525 [25,] -0.5000000 0.8660254 -0.5000000 -0.5000000 0.5000000 -0.5000000 0.69337525 [26,] -0.1889822 -0.3273268 0.9449112 -0.1889822 -0.9449112 -0.1889822 -0.05241424 [27,] 0.8660254 -0.5000000 -0.8660254 0.8660254 0.8660254 0.8660254 -0.72057669 [28,] 0.5000000 0.0000000 -1.0000000 0.5000000 1.0000000 0.5000000 -0.27735010 [,15] [,16] [,17] [,18] [,19] [,20] [,21] [1,] 0.5000000 0.5000000 -0.5000000 -0.5000000 0.5000000 0.5000000 -0.5000000 [2,] -0.9449112 0.1889822 0.9449112 -0.1889822 -0.9449112 0.1889822 0.9449112 [3,] 0.6933752 -0.9707253 -0.6933752 0.9707253 0.6933752 -0.9707253 -0.6933752 [4,] 0.7559289 0.1889822 -0.7559289 -0.1889822 0.7559289 0.1889822 -0.7559289 [5,] -0.9449112 0.7559289 0.9449112 -0.7559289 -0.9449112 0.7559289 0.9449112 [6,] -0.5000000 -0.5000000 0.5000000 0.5000000 -0.5000000 -0.5000000 0.5000000 [7,] 1.0000000 -0.5000000 -1.0000000 0.5000000 1.0000000 -0.5000000 -1.0000000 [8,] -0.5000000 1.0000000 0.5000000 -1.0000000 -0.5000000 1.0000000 0.5000000 [9,] 0.0000000 -0.8660254 0.0000000 0.8660254 0.0000000 -0.8660254 0.0000000 [10,] 1.0000000 -0.5000000 -1.0000000 0.5000000 1.0000000 -0.5000000 -1.0000000 [11,] -0.5000000 1.0000000 0.5000000 -1.0000000 -0.5000000 1.0000000 0.5000000 [12,] -1.0000000 0.5000000 1.0000000 -0.5000000 -1.0000000 0.5000000 1.0000000 [13,] -0.5000000 1.0000000 0.5000000 -1.0000000 -0.5000000 1.0000000 0.5000000 [14,] 0.2773501 -0.9707253 -0.2773501 0.9707253 0.2773501 -0.9707253 -0.2773501 [15,] 1.0000000 -0.5000000 -1.0000000 0.5000000 1.0000000 -0.5000000 -1.0000000 [16,] -0.5000000 1.0000000 0.5000000 -1.0000000 -0.5000000 1.0000000 0.5000000 [17,] -1.0000000 0.5000000 1.0000000 -0.5000000 -1.0000000 0.5000000 1.0000000 [18,] 0.5000000 -1.0000000 -0.5000000 1.0000000 0.5000000 -1.0000000 -0.5000000 [19,] 1.0000000 -0.5000000 -1.0000000 0.5000000 1.0000000 -0.5000000 -1.0000000 [20,] -0.5000000 1.0000000 0.5000000 -1.0000000 -0.5000000 1.0000000 0.5000000 [21,] -1.0000000 0.5000000 1.0000000 -0.5000000 -1.0000000 0.5000000 1.0000000 [22,] -0.5000000 1.0000000 0.5000000 -1.0000000 -0.5000000 1.0000000 0.5000000 [23,] 0.1889822 -0.9449112 -0.1889822 0.9449112 0.1889822 -0.9449112 -0.1889822 [24,] 0.5000000 0.5000000 -0.5000000 -0.5000000 0.5000000 0.5000000 -0.5000000 [25,] -0.5000000 -0.5000000 0.5000000 0.5000000 -0.5000000 -0.5000000 0.5000000 [26,] 0.9449112 -0.1889822 -0.9449112 0.1889822 0.9449112 -0.1889822 -0.9449112 [27,] -0.8660254 0.8660254 0.8660254 -0.8660254 -0.8660254 0.8660254 0.8660254 [28,] -1.0000000 0.5000000 1.0000000 -0.5000000 -1.0000000 0.5000000 1.0000000 [,22] [,23] [,24] [,25] [,26] [,27] [,28] [1,] 0.5000000 -0.7559289 1.0000000 -1.0000000 0.75592895 0.0000000 -0.5000000 [2,] 0.1889822 0.1428571 -0.7559289 0.7559289 -1.00000000 0.6546537 0.9449112 [3,] -0.9707253 0.8386279 -0.2773501 0.2773501 0.41931393 -0.9607689 -0.6933752 [4,] 0.1889822 -0.5000000 0.9449112 -0.9449112 0.92857143 -0.3273268 -0.7559289 [5,] 0.7559289 -0.5000000 -0.1889822 0.1889822 -0.78571429 0.9819805 0.9449112 [6,] -0.5000000 0.7559289 -1.0000000 1.0000000 -0.75592895 0.0000000 0.5000000 [7,] -0.5000000 0.1889822 0.5000000 -0.5000000 0.94491118 -0.8660254 -1.0000000 [8,] 1.0000000 -0.9449112 0.5000000 -0.5000000 -0.18898224 0.8660254 0.5000000 [9,] -0.8660254 0.9819805 -0.8660254 0.8660254 -0.32732684 -0.5000000 0.0000000 [10,] -0.5000000 0.1889822 0.5000000 -0.5000000 0.94491118 -0.8660254 -1.0000000 [11,] 1.0000000 -0.9449112 0.5000000 -0.5000000 -0.18898224 0.8660254 0.5000000 [12,] 0.5000000 -0.1889822 -0.5000000 0.5000000 -0.94491118 0.8660254 1.0000000 [13,] 1.0000000 -0.9449112 0.5000000 -0.5000000 -0.18898224 0.8660254 0.5000000 [14,] -0.9707253 0.9958706 -0.6933752 0.6933752 -0.05241424 -0.7205767 -0.2773501 [15,] -0.5000000 0.1889822 0.5000000 -0.5000000 0.94491118 -0.8660254 -1.0000000 [16,] 1.0000000 -0.9449112 0.5000000 -0.5000000 -0.18898224 0.8660254 0.5000000 [17,] 0.5000000 -0.1889822 -0.5000000 0.5000000 -0.94491118 0.8660254 1.0000000 [18,] -1.0000000 0.9449112 -0.5000000 0.5000000 0.18898224 -0.8660254 -0.5000000 [19,] -0.5000000 0.1889822 0.5000000 -0.5000000 0.94491118 -0.8660254 -1.0000000 [20,] 1.0000000 -0.9449112 0.5000000 -0.5000000 -0.18898224 0.8660254 0.5000000 [21,] 0.5000000 -0.1889822 -0.5000000 0.5000000 -0.94491118 0.8660254 1.0000000 ここで何を深く考えているのだろうか？ すべてのパターンを一度に見つけるということなのだろうか？ すべてのパターンが必要なのだろうか？ それとも、現在の状況と最後の観測に対応するものが必要なのだろうか？

削除済み 2023.09.23 15:49 #32538

mytarmailS #:三次元データはあるのか？行は観察であり、列は特徴である。最初の行は最新のデータのようだ。最後の行から他の各行への相関を計算できる。そして、最後の行／現在の行と履歴との間に、このような「類似性パターン」が得られる。クラスタリングをして、このようなものを得ることもできる。しかし、現在/最後の行に関する状態だけが必要なのに、なぜ相関行列 全体を 計算する必要があるのか理解できない。ここでの思考の深さは何なのだろうか？すべてのパターンを一度に見つけるから、すべてのパターンが必要なのか、それとも現状と最後の観測に対応するものが必要なのか。 現状はなく、ただの履歴検索だ。 そして、パターンをメトリクスでソートし、最適なものをボットに縫い付ける。

mytarmailS 2023.09.23 15:52 #32539

Maxim Dmitrievsky #:履歴を検索するだけだ。 一度に1つのパターンを検索すれば、RAMの使用料はほとんどかかりません。ある瞬間には1つのパターンにしか入れないのに、なぜ全履歴の全パターンを見たいのでしょうか？ それとも、私が何かを理解していないのでしょうか？

削除済み 2023.09.23 15:56 #32540

mytarmailS #:一度に1つのパターンを検索することができ、RAMはほとんど無料だ。ある瞬間には1つのパターンにしか入れないのに、なぜ全履歴のすべてのパターンを見たいのだろう？それとも、私が何かを理解していないのでしょうか？まだ、それらをすべて調べて、新しいデータでチェックするのに最適なものを選択する必要があります。#32456 Машинное обучение в трейдинге: теория, модели, практика и алготорговля - Если объем добавок в позицию зависит от текущей просадки, тогда никакие ТС не работают. 2023.09.21www.mql5.com Корреляционная матрица между строками заданных признаков. берется статистика по всем строкам как было в будущем в среднем. в тестере ищем корреляцию текущих значений с эталоном. Но я делаю в питоне и считаю корреляцию сразу для всех возможных пар SQLを読むのは効率的ですか？
人生で一度も
....
apache ArrowかDuckDBを使ってみてください。
それでもRAMが一番速い。
.....
問題そのものは、G...醜いを介して解決され、あなたの問題は、必要のないcor.行列です。
alglibには二重相関計算関数がある。変数をすべてchar/ucharに変えればすべてうまくいくと思う。 他にも使い古された関数が何十個もあるので、それも作り直すべきだ。そしてCMatrixDoubleから動的配列か何かに切り替えるべきだ。
//| INPUT PARAMETERS: |
//| X - array[N,M], sample matrix: |
//| * J-th column corresponds to J-th variable |
//| * I-th row corresponds to I-th observation |
//| N - N>=0, number of observations: |
//| * if given, only leading N rows of X are used |
//| * if not given, automatically determined from input |
//| size |
//| M - M>0, number of variables: |
//| * if given, only leading M columns of X are used |
//| * if not given, automatically determined from input |
//| size |
//| OUTPUT PARAMETERS: |
//| C - array[M,M], correlation matrix (zero if N=0 or N=1) |
//+------------------------------------------------------------------+
static bool CBaseStat::PearsonCorrM(const CMatrixDouble &cx,const int n,
const int m,CMatrixDouble &c)
そして、もし自作のプログラムがあるのなら、もしそれを行う既製のパッケージがないのなら、量子化も行わなければならないだろう。
ナンパイで計算すると速いのに、パンダで計算すると長いし、メモリも食う。後で再確認します。
パターンなし、パターンは相関行列で検索される。
パターン＝互いに高い相関関係を持つサンプルの集合全体。
データセット全体には、このようなパターンがいくつも存在しうる。
行列がなければ、何も見つからないか、断片的な部分を選ぶことになる。だから、それぞれの行を取り出し、他のすべての行との相関を計算しなければならない。
一般的には、クラスタリングに似ている。
ここでは、例の類似性が最大化される。
.
木における分類/回帰は、これらの例の将来の類似性を最大化する。それは過去の類似性を悪くする。
昔、同じようなことをしたことがある。
我々は3次元のデータを持っている。
行は観察で、列は形質です。
最初の行は最新のデータです。
最後の行と他の行の相関を計算することができる。
そして、最後/現在の行と履歴の間の「類似性パターン」を得ることができる。
クラスタリングをしてこのようなものを得ることもできる。
しかし、現在/最後の行に関する状態だけが必要なのに、なぜ相関行列 全体を 数える必要があるのか、私には理解できない。
すべてのパターンを一度に見つけるということなのだろうか？ すべてのパターンが必要なのだろうか？ それとも、現在の状況と最後の観測に対応するものが必要なのだろうか？
現状はなく、ただの履歴検索だ。
そして、パターンをメトリクスでソートし、最適なものをボットに縫い付ける。
一度に1つのパターンを検索すれば、RAMの使用料はほとんどかかりません。ある瞬間には1つのパターンにしか入れないのに、なぜ全履歴の全パターンを見たいのでしょうか？
まだ、それらをすべて調べて、新しいデータでチェックするのに最適なものを選択する必要があります。#32456