트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 253

 

"흥미로운 것들"이라는 제목에서))

DTW 알고리즘

시리즈에서 동일한 가격 세그먼트를 찾아야 하지만 가격이 고정적이지 않기 때문에 당연히 이 속성 때문에 이러한 세그먼트의 크기가 다를 것이라고 상상해 보십시오. 이러한 경우에는 어떻게 해야 합니까?

나는 여전히 두 가지 가능한 솔루션을 알고 있습니다. 이것은 보간법과 dwt 알고리즘입니다. 후자는 지금 매우 밀접하게 플레이하고 있습니다.

약 dwt - https://ru.wikipedia.org/wiki/%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_%D0% B4%D0%B8%D0%BD%D0%B0%D0%BC%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B9_%D1%82% D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%B8_%D0% B2%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D0%BE%D0%B9_%D1%88%D0%BA%D0%B0%D0%BB% D1%8B

내가 직접 이해하지 못하기 때문에 수식을 로드하지 않을 것이고, 단어로도 로드하지 않을 것이며, 누구나 재현할 수 있도록 주석 처리된 코드를 제공할 것입니다 ...

따라서 이 코드에서 문제가 해결되었습니다.

우리는 특정 패턴을 가지고 있습니다. 크기(길이)가 8포인트(불도저의 숫자)인 "메인 패턴" 이라고 부르겠습니다.

당신 은 주요 패턴 과 유사한 패턴을 찾아야하지만 그들은 5와 13 포인트를 측정했습니다 (숫자는 불도저로 취했습니다)

사진의 결과

시간

그것이 어떻게 사용될 수 있는지, 그리고 그것이 가능한지 여부는 열린 질문입니다. 제가 성공적으로 적용할 수 있었던 것 같습니다. 그러나 이 모든 것이 아이디어를 구현하기 위한 도구일 뿐이라는 것을 기억해야 합니다. 그러나 아이디어 자체가 아니라 ...

아래에 코드를 게시하겠습니다

Алгоритм динамической трансформации временной шкалы — Википедия
  • ru.wikipedia.org
Алгоритм динамической трансформации временно́й шкалы (DTW-алгоритм, от англ.  ) — алгоритм, позволяющий найти оптимальное соответствие между временными последовательностями. Впервые применен в распознавании речи, где использован для определения того, как два речевых сигнала представляют одну и ту же исходную произнесённую фразу. Впоследствии...
파일:
zzz.txt  4 kb
 

간단히 말해서 코드의 요점은 다음과 같습니다.

library (dtw)

X <- rnorm( 10 )
Y <- rnorm( 20 )

my.dtw <- dtw(X ,Y)

my.dtw$distance

어디

my.dtw$distance
[ 1 ] 14.17198

이것은 근접도(유클리드 거리)의 척도이며 작을수록 X와 Y의 근접도가 커집니다.

 
mytarmailS :

간단히 말해서 코드의 요점은 다음과 같습니다.

library (dtw)

X <- rnorm( 10 )
Y <- rnorm( 20 )

my.dtw <- dtw(X ,Y)

my.dtw$distance

어디

my.dtw$distance
[ 1 ] 14.17198

이것은 근접도(유클리드 거리)의 척도이며 작을수록 X와 Y의 근접도가 커집니다.

만일을 대비하여: 근접 측정값 = 1이면 왜곡에 의해 첫 번째 행에서 두 번째 행을 얻습니까?
 
산산이치 포멘코 :
만일을 대비하여: 근접도 = 1이면 첫 번째 행에서 두 번째 행이 왜곡에 의해 얻어집니까?

일반적으로 두 행 사이의 근접성을 변경하려는 경우 이러한 행의 길이는 동일해야 합니다.

dtw는 크기가 다른 두 행의 근접성을 측정할 수 있으며, 당연히 올바른 근접 값을 찾기 위해 행을 왜곡합니다.

 

mytarmailS :

우리는 특정 패턴을 가지고 있습니다. 크기(길이)가 8포인트(불도저의 숫자)인 "메인 패턴" 이라고 부르겠습니다.

당신 은 주요 패턴 과 유사한 패턴을 찾아야하지만 그들은 5와 13 포인트를 측정했습니다 (숫자는 불도저로 취했습니다)

같은 주제, 130페이지에 있었습니다.

간단히 말해서, 기존 DTW 알고리즘에서 고정 길이 n 및 m의 두 세그먼트를 각각 비교하고 배열 [1..n, 1..m]을 채우고 계산 결과를 다음에서 가져옵니다. 셀 [n, m]. 세그먼트 중 하나의 길이가 임의적(부동)이어야 하는 경우(예: n=8, am은 5에서 13 사이의 값을 취합니다.) 8 * 13 배열을 채우고 셀에서 최소 결과를 취합니다. [8,5]에서 [8.13]까지를 경로 길이로 나눈 값입니다.

이 기간 동안 러시아 Wikipedia에서 전체 기사가 다시 작성 되었지만 나는 알지 못했습니다. 영문 기사에서 변경된 사항은 없으며 의사 코드가 남아 있어 알고리즘의 원리를 더 쉽게 이해할 수 있습니다.

 
마법사_ :

접근 번호 4) 그러나 그는 "최초"(133) (0.68705)의 클럽에 들어가지 않았으며 괴상한 질식 자의 얼굴을 받았습니다))


우와! 시원한!!!
 
송곳 작가 :

같은 주제, 130페이지에 있었습니다.

요컨대, 고전적인 DTW 알고리즘에서 ...........

그리고 다른 방법으로 가능합니다. 모든 임의의 섹션을 단일 크기로 보간하고 거기에서 상관 관계 또는 유클리드를 측정하는 것은 어리석은 일입니다 ...

 

안녕하세요!

나는 도움을 요청하고 "다조화 근사"라는 특정 알고리즘을 만들기 위한 노력에 연합할 것을 제안합니다. 이것은 "MGUA" 알고리즘 제품군의 맥락에서 함수에 대한 매우 깊고 현명한 근사입니다. 왜 그렇게 생각 할까요? 나중에 설명과 사진으로 발표

링크 https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%B3%D1%80%D1%83%D0%BF% D0%BF%D0%BE%D0%B2%D0%BE%D0%B3%D0%BE_%D1%83%D1%87%D1%91%D1%82%D0%B0_%D0%B0%D1% 80%D0%B3%D1%83%D0%BC%D0%B5%D0%BD%D1%82%D0%BE%D0%B2

링크에서 발췌

Обычно степень полинома опорной функции выбирается не выше {\displaystyle N- 1 } N- 1 , где {\displaystyle N} N - количество точек выборки. Часто бывает достаточно использовать в качестве опорных функции полиномы второй степени. В таком случае на каждом шаге итерации степень результирующего полинома удваивается.

Вместо полинома Колмогорова-Габора можно использовать ряды Фурье. Их имеет смысл применять, если в исходных данных наблюдается периодичность (например, уровень воды в реках, температура воздуха, объём осадков). Полученная в таком случае модель будет полигармонической [ 1 ].

=====================================================

또한 이 훌륭한 방법인 "MGUA"에 대한 많은 책 중 하나에 대한 링크

이 책에는 매우 강력한 아이디어가 포함되어 있어 읽기 쉽습니다(공식이 시작될 때까지). https://www.gmdh.net/articles/theory/bookNoiseIm.pdf읽는 것이 좋습니다.

=====================================================

또한 다조파 근사가 MO에 대한 데이터 전처리의 올바른 방향임을 확인하는 일부 의견

댓글 클리핑

...................................…Следующим шагом была новая модель: к цене закрытия применяем фильтр низких частот (я использовал фильтр Батерворта 2 -го порядка), применяем полиномиально-гармоническую аппроксимацию, преобразуем A* cos (wx)+B* sin (wx) к виду M* sin (wx+f) и в качестве вторичных признаков берем M и f.
…. И вот с такой моделью мне удалось построить сеть, которая имела очень хорошие обобщающие свойства: новые данные почти все правильно распознавала........................

원본 소스 링크 http://www.kamynin.ru/archives/4917

 
mytarmails :

어려워보이고 결과가 확실하지 않아 패스합니다.
R에는 GMDH 패키지(영어로 "MGUA")가 있습니다.

그건 그렇고, Numerai에서는 모델을 logloss <0.69로 훈련했습니다.
0.68930
하지만 어디선가 100명이 0.4-0.5의 점수로 나왔다. 일종의 지옥이었다. 이제 상금을 노리는 달과 같다.

사유: