트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 644

 
Alexander_K2 :

예! 할 말을 잊었다.

상태는 입자를 거의 완전히 특성화하는 데이터 세트로 간주됩니다. 저것들. 이것은 데이터 세트, 즉 첨도, 비대칭, 네겐트로피 등 고유한 특성을 가진 샘플 크기입니다.

저것들. R. Feynman의 확신으로 특정 쌍에 대한 샘플 크기를 올바르게 결정하고 기록에 대한이 샘플에 대한 이러한 계수의 특징적인 평균 값을 계산하면 특정 매개 변수 집합이 있음을 예측할 수 있다고 주장 할 수 있습니다 주어진 순간에, 특정 시간 간격이 지나면 시스템은 안정적인 매개변수로 상태가 됩니다.

이것이 내가 이 스레드에서 기대하는 것입니다. 원하는 샘플 크기를 결정하는 데 도움이 필요하면 작성해 주시면 도와드리겠습니다.

그런 다음 그러한 질문 - 자기 회귀 프로세스가 있다고 가정 해 봅시다. 과거에 대한 현재 상태의 의존

시스템을 예측하기 위해 지연이 다른 일련의 증분을 올바르게 선택하는 방법은 무엇입니까? 시차가 일정하거나 시간이 지남에 따라 변경되어야 하는지, 변경되는 경우 이를 결정하는 방법(진부한 열거 제외)

목표를 꾸준히 예측하는 증분 조합이 있다면 이에 대해 NN을 훈련하는 것이 더 이상 어렵지 않기 때문입니다.

 
막심 드미트리예프스키 :

그런 다음 그러한 질문 - 자기 회귀 프로세스가 있다고 가정 해 봅시다. 과거에 대한 현재 상태의 의존

시스템을 예측하기 위해 지연이 다른 일련의 증분을 올바르게 선택하는 방법은 무엇입니까? 시차가 일정하거나 시간이 지남에 따라 변경되어야 하는지, 변경되는 경우 이를 결정하는 방법(진부한 열거 제외)

여기에 분명히 어려움을 야기하는 점이 있습니다.

데이터세트가 시간상 로컬이 아닙니다.

이것이 기본 포인트!

저것들. 시간으로 작업하는 경우 엄격하게 정의된 기간 동안 다른 데이터 집합을 처리한다는 것을 이해해야 합니다. 이것이 걸림돌의 초석입니다. 특정 값의 동일한 샘플로 작업하려고 하면 시간이 지남에 따라 "떠다니는" 관찰 창이 나타납니다.

두 가지 방법으로 이 문제를 해결합니다.

1. 특정 틱 세트(샘플 크기)로 독점적으로 작업합니다. 이는 특정 쌍에 대해 한 번만 적용되는 것입니다. 그러나 이 집합은 형성 시기가 다르기 때문에 예측 이 불가능합니다.

2. 일정한 시간 창에서 독점적으로 작업하십시오. 이 경우에는 반대로 부동 볼륨의 틱이 있습니다. 이 어려움을 해결하는 방법은 무엇입니까? 대답은 소위 입력하는 것입니다. "의사 상태", 즉 관찰 창의 데이터 수를 필요한 샘플 크기까지 얻는 방법. 나는 기하급수적인 시간 척도로 강제로 작업함으로써 이것을 한다. 저것들. 엄격하게 정의된 시간 창에서 지수를 통해 데이터를 읽고 실제 틱인지 아닌지는 중요하지 않습니다. 이 경우 예측이 가능합니다. 유일한 것은 - 지수 간격이 올바른 솔루션인지 의심됩니다. Feynman은 일정한 간격으로 일했습니다.

1way를 선택하면 예측 문제는 원칙적으로 해결할 수 없습니다.

양방향 - 해결 가능 하지만 그러한 아카이브는 없습니다.

그게 내가 막힌 곳이고 어리석게도 내 아카이브를 모집하는 동안입니다. 불행히도 다른 방법이 보이지 않습니다 ...

 
Alexander_K2 :

2. 일정한 시간 창에서 독점적으로 작업하십시오. 이 경우에는 반대로 부동 샘플 크기가 있습니다. 이 어려움을 해결하는 방법은 무엇입니까? 대답은 소위 입력하는 것입니다. "의사 상태", 즉 관찰 창의 데이터 수를 필요한 샘플 크기까지 얻는 방법. 나는 기하급수적인 시간 척도에서 강제로 작업함으로써 이것을 한다. 저것들. 엄격하게 정의된 시간 창에서 지수를 통해 데이터를 읽고 실제 틱인지 아닌지는 중요하지 않습니다. 이 경우 예측이 가능합니다. 유일한 것은 - 지수 간격이 올바른 솔루션인지 의심됩니다. Feynman은 일정한 간격으로 일했습니다.

사실, 지수 간격은 상수 창 문제를 해결하는 데 도움이 됩니다. 제가 이해하는 한 이것이 올바른 솔루션입니다(그렇어야 합니다). 훈련 샘플이 1000개의 막대(틱)라고 가정해 보겠습니다. 문제가 되지 않습니다. 물론 슬라이딩 윈도우를 사용하면 패턴이 바뀌고 신경망을 다시 훈련해야 합니다. 그러나 샘플에 증분 조합이 포함되어 있으면 지연 시간 이 기하급수적으로 증가합니다 .효과적으로 동일한 창에 대해 가능한 모든 상태가 현재 슬라이딩됩니다.

내가 운전할 수도 있지만 시도하기 쉽습니다. 그러나 문제는 언제 멈출 것인가

 
막심 드미트리예프스키 :

사실, 지수 간격은 상수 창 문제를 해결하는 데 도움이 됩니다. 제가 이해하는 한 이것이 올바른 솔루션입니다(그렇어야 합니다). 훈련 샘플이 1000개의 막대(틱)라고 가정해 보겠습니다. 문제가 되지 않습니다. 물론 슬라이딩 윈도우를 사용하면 패턴이 바뀌고 신경망을 다시 훈련해야 합니다. 그러나 샘플에 증분 조합이 포함되어 있으면 지연 시간 이 기하급수적으로 증가합니다 .효과적으로 동일한 창에 대해 가능한 모든 상태가 현재 슬라이딩됩니다.

내가 운전할 수도 있지만 시도하기 쉽습니다. 그러나 문제는 언제 멈출 것인가

그리고 시스템이 불안정한 상태에서 안정적인 상태로 전환될 때 멈출 필요가 있습니다.

저것들. 예를 들어, 주어진 시점에서 네겐트로피의 증가가 보이면(추세가 시작됨) 특정 시간 간격 후에 네겐트로피는 기록에서 계산된 특징적인 평균값으로 돌아갑니다.

이 전환 시간 간격을 결정하는 방법은 무엇입니까? 글쎄, 이것은 실제 예측입니다. 바보가 아닙니다. 이것이 내가 신경망에서 기대하는 것이며 이 스레드를 읽습니다. :)

 
알렉산더_K2 :

그리고 시스템이 불안정한 상태에서 안정적인 상태로 전환될 때 멈출 필요가 있습니다.

저것들. 예를 들어, 주어진 순간에 네겐트로피의 증가가 보이면(추세가 시작됨) 특정 시간 간격 후에 네겐트로피는 기록에서 계산된 특징적인 평균 값으로 돌아갑니다.

이 전환 시간 간격을 결정하는 방법은 무엇입니까? 글쎄, 이것은 실제 예측입니다. 바보가 아닙니다. 이것이 내가 신경망에서 기대하는 것이며 이 스레드를 읽습니다. :)

아, 작업은 다소 사소한 것으로 축소되었습니다. 모델을 지수 증분으로 훈련하고 예측 가격과 현재 가격 사이의 스프레드 차트를 작성하고 평균 편차가 어떻게 분포되는지 확인합니다(잔차)

흔적에. 일주일 안에 할게요 :) Negentropy라는 단어만 Dispersion이라는 단어로 대체됩니다.

 
막심 드미트리예프스키 :

아, 작업은 다소 사소한 것으로 축소되었습니다. 모델을 지수 증분으로 훈련하고 예측 가격과 현재 가격 사이의 스프레드 차트를 작성하고 평균 편차가 어떻게 분포되는지 확인합니다(잔차)

흔적에. 일주일 뒤에 할게요 :)

기다려요, 맥심. 진심으로, 나는 그것이 할 수 있다고 확신합니다. 신호를 여는 것을 잊지 마십시오. 내가 가장 먼저 구독합니다.

시장에서 실제로 작동할 수 있는 것은 신경망과 이론 두 가지뿐입니다. 결과적으로 다른 모든 것은 정크, 적합 및 빈 주머니입니다.

 
알렉산더_K2 :

기다려, 맥심. 진심으로, 나는 그것이 할 수 있다고 확신합니다. 신호를 여는 것을 잊지 마십시오. 내가 가장 먼저 구독합니다.

시장에서 실제로 작동할 수 있는 것은 신경망과 테어버 두 가지뿐입니다. 결과적으로 다른 모든 것은 정크, 적합 및 빈 주머니입니다.

예를 들어 봇을 보내 드리겠습니다. 나중에 무언가를 비틀 수 있습니다 :D 명확성을 위해 먼저 지표로 할 것입니다.

 

이를 위해 - https://www.mql5.com/en/forum/86386/page643#comment_6472393

박사 상인 :

예측 변수를 필터링하기 위한 또 다른 흥미로운 패키지를 찾았습니다. FSelector라고 합니다. 엔트로피 사용을 포함하여 예측 변수를 제거하기 위한 약 12가지 방법을 제공합니다.


예측기 드롭아웃 함수 random.forest.importance()는 일부 테스트에서 꽤 괜찮은 결과를 보여주었습니다. 그녀의 의견으로는 일반적으로 모든 예측 변수가 최소한 약간 중요하다는 것이 불편하지만, 예를 들어 평균 중요도를 계산하고 평균보다 중요한 예측 변수만 취하면 매우 좋은 결과를 얻습니다. 결과.

 library (FSelector)

load( "ALL_cod.RData" )
trainTable <- Rat_DF1
PREDICTOR_COLUMNS_SEQ <- 1 : 27
TARGET_COLUMN_ID      <- 29

targetFormula <- as .simple.formula(colnames(trainTable)[PREDICTOR_COLUMNS_SEQ], colnames(trainTable)[TARGET_COLUMN_ID])

rfImportance <- random.forest.importance(targetFormula, trainTable)
colnames(trainTable)[PREDICTOR_COLUMNS_SEQ][rfImportance[[ 1 ]] > mean(rfImportance[[ 1 ]])]
 
박사 상인 :

저는 올해 1월경에 eurusd m1을 사용했고 1일의 슬라이딩 윈도우를 사용했습니다.

논리적으로 엔트로피가 증가하면 거래를 중단하고 낮은 수준에서 계속 거래해야 합니다. 그리고 여기에서는 엔트로피가 낮고 어떤 이유로 플랫에서 거래하는 것이 더 쉽지만 추세는 이례적입니다.

(첨부된 코드의 오타 수정, 기존 코드를 이미 다운로드한 경우 다시 다운로드)

시리즈가 고정되어 있지 않다는 것이 육안으로 명확하기 때문에 초기 인용에 대해 yf를 테스트하는 것은 의미가 없습니다.

그리고 흥미로운(저에게는 그렇지 않습니다. 저는 항상 그것을 사용합니다) log(p/p-1) 시계열 에 대한 그래프입니다.

거기 뭐가 있어? 물론 y축을 따라 눈금이 필요합니다.

 
박사 상인 :

예측 변수를 선별하기 위한 또 다른 흥미로운 패키지를 찾았습니다. FSelector라고 합니다. 엔트로피 사용을 포함하여 예측 변수를 제거하기 위한 약 12가지 방법을 제공합니다.


CORElearn 패키지에는 매우 흥미로운 릴리프 예측자 선택 도구 세트도 있습니다.

이 주제에 대한 긴 연습에서 캐럿, 특히 saf에 있는 예측자 선택 기능보다 더 나은 것을 찾지 못했습니다.

그러나 예측 변수의 사전 선택이 대상 변수와 "관련된" 원칙에 따라 이루어지지 않으면 이 모든 것이 작동하지 않습니다.

두 클래스의 예를 사용하여 다시 반복하겠습니다.

  • 예측자의 일부는 한 클래스와 관련되어야 하고 다른 부분은 다른 클래스와 관련되어야 합니다. 예측 변수의 이 두 부분이 교차하면 극복할 수 없는 분류 오류가 발생합니다.



추신.

주요 구성 요소에 대해 논의했고 알고리즘이 감독되지 않는다는 단점을 보았습니다.

여기 선생님과 함께:

sgpls( x, y, K, eta, scale.x= TRUE ,
        eps= 1 e- 5 , denom.eps= 1 e- 20 , zero.eps= 1 e- 5 , maxstep= 100 ,
        br= TRUE , ftype='iden' )
Arguments

x       Matrix of predictors.
y       Vector of class indices.
K       Number of hidden components.
eta     Thresholding parameter. eta should be between 0 and 1 .
scale.x Scale predictors by dividing each predictor variable by its sample standard deviation?
eps     An effective zero for change in estimates. Default is 1 e- 5 .
denom.eps       An effective zero for denominators. Default is 1 e- 20 .
zero.eps        An effective zero for success probabilities. Default is 1 e- 5 .
maxstep Maximum number of Newton-Raphson iterations. Default is 100 .
br      Apply Firth's bias reduction procedure?
ftype   Type of Firth's bias reduction procedure. Alternatives are "iden" (the approximated version ) or "hat" (the original version ). Default is "iden".

spl 패키지

사유: