トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 253

 

面白いこと」の下。))

DTWアルゴリズム

あなたはシリーズの価格のいくつかの等しい部分を見つける必要があることを想像してみてください、しかし、価格は定常ではないので、もちろんこの特性のために、これらの部分の大きさは異なるだろう、このケースに対処する方法?

補間とdwtアルゴリズムという2つの可能な解決策を知っています。

про dwt - https://ru.wikipedia.org/wiki/%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_%D0%B4%D0%B8%D0%BD%D0%B0%D0%BC%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B9_%D1%82%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%B8_%D0%B2%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D0%BE%D0%B9_%D1%88%D0%BA%D0%B0%D0%BB%D1%8B

数式は自分でも分からないので割愛しますし、言葉も割愛し、誰でも再現できるようにコメント付きのコードを渡します...。

このコードは、ある問題を解決するために使われたわけです。

サイズ(長さ)8ポイント(数字は任意の推測値)のあるパターンを「メインパターン」と呼ぶことにする。

メインパターンと 同じようなパターンが見つかるはずですが、その寸法は5ポイントと13ポイントです(数字はランダムに取っています)。

結果は写真の通りです

ч

しかし、これらはすべて、アイデアを実現するためのツールであって、アイデアそのものではないことを覚えておく必要があります。

以下にコードを掲載します。

Алгоритм динамической трансформации временной шкалы — Википедия
  • ru.wikipedia.org
Алгоритм динамической трансформации временно́й шкалы (DTW-алгоритм, от англ.  ) — алгоритм, позволяющий найти оптимальное соответствие между временными последовательностями. Впервые применен в распознавании речи, где использован для определения того, как два речевых сигнала представляют одну и ту же исходную произнесённую фразу. Впоследствии...
ファイル:
zzz.txt  4 kb
 

簡単に言うと、このコードのポイントはこうです。

library(dtw)

X <- rnorm(10)
Y <- rnorm(20)

my.dtw <- dtw(X ,Y)

my.dtw$distance

どこ

my.dtw$distance
[1] 14.17198

近さの尺度(ユークリッド距離)であり、小さいほどXとYの近さが高い。

 
mytarmailS:

簡単に言うと、このコードのポイントはこうです。

library(dtw)

X <- rnorm(10)
Y <- rnorm(20)

my.dtw <- dtw(X ,Y)

my.dtw$distance

どこ

my.dtw$distance
[1] 14.17198

近さの尺度(ユークリッド距離)であり、小さいほどXとYの近さが高い。

念のため:近接度測定=1の場合、2行目は1行目から歪みで得られるのですか?
 
サンサニッチ・フォメンコ
念のため:近接度測定=1の場合、2行目は1行目から歪みで得られるのでは?

通常、2つの行の近さを変更する場合、これらの行は同じ長さでなければならないという規則があります。

dtwは、異なる次元の2つの行の近さを測定することができます。もちろん、正しい近さの値を見つけるために行を変形させます。

 

mytarmailS:

サイズ(長さ)8ポイントのパターンを「メインパターン」と呼ぶことにする(図はランダム)。

メインパターンと 同じようなパターンで、5点と13点のパターンを探してください(数字はジャンク品から引用)。

同じスレッドにあった、pg.130.

簡単に説明すると、古典的な DTW アルゴリズムは、固定長 n と m の 2 つのセグメントをそれぞれ比較し、配列 [1..n, 1..m] を埋め、セル [n, m] から結果を取得します。例えば、n=8 で m が 5 から 13 の値をとるような、ランダムな長さのセグメントが欲しい場合、配列 8*13 を埋めて、セル [8,5] から [8,13] をパス長で割った最小の結果を取ることになります。

この間、ロシアのウィキペディアが記事を全部書き換えた ことが判明し、私はそのことを知りませんでした。英語 版では、アルゴリズムの原理を理解しやすいように、疑似コードを残しています。

 
ヴィザード_。

アプローチ#4) しかし、「最初の100人」のクラブには入れず(133) (0.68705) オタク野郎に顔を殴られながら)))


すげえええええええええええええええええええええええええええええええ
 
アウルライター

同じスレッドにあった、pg.130.

つまり、古典的なDTWアルゴリズムでは、............................

あるいは、別の方法として、ぶっきらぼうに任意の部分をすべてひとつのサイズに補間して、そこで相関やユークリッド性を測ればいいのですが......。

 

みなさん、こんにちは。

私は助けを求め、「ポリハーモニック近似」と呼ばれるアルゴリズムを作る努力をすることを提案します - これはアルゴリズムの「MSUA」ファミリーのコンテキストで非常に深く巧妙な関数近似ですなぜ私はそう思うかは後で説明とおそらく画像で表明します

ссылкаhttps://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%B3%D1%80%D1%83%D0%BF%D0%BF%D0%BE%D0%B2%D0%BE%D0%B3%D0%BE_%D1%83%D1%87%D1%91%D1%82%D0%B0_%D0%B0%D1%80%D0%B3%D1%83%D0%BC%D0%B5%D0%BD%D1%82%D0%BE%D0%B2

リンクより抜粋

Обычно степень полинома опорной функции выбирается не выше {\displaystyle N-1} N-1, где {\displaystyle N} N - количество точек выборки. Часто бывает достаточно использовать в качестве опорных функции полиномы второй степени. В таком случае на каждом шаге итерации степень результирующего полинома удваивается.

Вместо полинома Колмогорова-Габора можно использовать ряды Фурье. Их имеет смысл применять, если в исходных данных наблюдается периодичность (например, уровень воды в реках, температура воздуха, объём осадков). Полученная в таком случае модель будет полигармонической [1].

===================================================

また、あの「MSUA」によるこの素晴らしいメソッドに関する数多くの書籍のうちの1冊へのリンクです。

この本は非常に強い考えを持っており、(数式が始まるまで)読みやすい。VERY highly recommended readinghttps://www.gmdh.net/articles/theory/bookNoiseIm.pdf

===================================================

また、ポリハーモニック近似がMOのデータ前処理に適した方法であることを確認するコメントもあります。

コメント抜粋

...................................…Следующим шагом была новая модель: к цене закрытия применяем фильтр низких частот (я использовал фильтр Батерворта 2-го порядка), применяем полиномиально-гармоническую аппроксимацию, преобразуем A*cos(wx)+B*sin(wx) к виду M*sin(wx+f) и в качестве вторичных признаков берем M и f.
…. И вот с такой моделью мне удалось построить сеть, которая имела очень хорошие обобщающие свойства: новые данные почти все правильно распознавала........................

link to original sourcehttp://www.kamynin.ru/archives/4917

 
mytarmailS:

複雑そうだし、結果の確証もないのでパスします。
RにはGMDHパッケージ(英語では "MGUA")があります。

ちなみにNumeraiでは、logloss <0.69にモデルを確定しています。
0.68930
しかし、どこからか、0.4-0.5という結果で100人出てきて、ある地獄、今は一般的に月のように賞品まで出ています。

理由: