지수 평활법을 이용한 시계열 예측(계속)

MetaTrader 5 — 지표 | 5 8월 2021, 09:40

254

개요

'지수 평활법을 이용한 시계열 예측' 파트 1에서는 지수 평활화 모델에 대한 간략한 설명으로 시작해 모델 매개 변수 최적화 방법, 그리고 감쇠를 이용한 점진적 성장 모델을 기반으로 한 예측 인디케이터에 대해 다루었습니다. 파트 2는 파트 1 예측 인디케이터의 정확도 향상에 대한 내용입니다.

통화쌍 가격 또는 아무리 가까운 미래에 대한 것일지라도 신뢰할 만한 예측을 한다는 건 복잡한 일입니다. 따라서 먼 미래에 대한 예측은 거의 불가능하겠지만 그래도 12단계 예측 시스템 제작을 한번 시도해 볼까 합니다. 아무래도 신뢰 구간이 가장 좁게 나타나는 첫 몇 단계에 신중을 기울여야겠죠.

10~12단계 예측 시스템은 다양한 예측 메소드 및 모델의 행동 패턴에 대한 설명을 주요 목표로 합니다. 필요한 경우 모든 시간 간격에 대한 예측의 정확도는 신뢰 구간 오차 한계를 이용해 평가 가능합니다. 본문에서는 파트 1에서 만든 인디케이터의 기능을 향상시켜 줄 몇 가지 방법에 대해 알아 보겠습니다.

인디케이터 개발 단계에 필요한 최소 함수 설정을 위한 알고리즘은 지난 글에서 이미 다루었으므로 이번 글에서는 다루지 않습니다. 간단한 설명을 위해 이론에 관한 설명 또한 최소화하고자 합니다.

1. 기존 인디케이터

IndicatorES.mq5 인디케이터(이전 글 참조)를 이용하겠습니다.

해당 인디케이터를 컴파일하려면 동일한 디렉토리에 위치한 세 가지 파일, IndicatorES.mq5, CIndicatorES.mqh와 PowellsMethod.mqh가 필요한데요. 본문 하단에 위치한 files2.zip에도 포함되어 있습니다.

우선 기존 인디케이터 제작에 이용되었던 지수 평활화 모델 수식을 다시 살펴보겠습니다.

수식을 읽는 방법은 다음과 같습니다.

-[0,1] 시퀀스 레벨 평활화 매개 변수
-[0,1] 평활화 매개 변수
-[0,1] 감쇠 매개 변수
-관측 후 주어진 시간 t의 시퀀스 레벨 평활화 값
-주어진 시간 t의 평활화 덧셈 추세
-주어진 시간 t의 시퀀스 값
-예측 단계 수
-주어진 시간 t에서의 m단계 예측
-주어진 시간 t에서의 1단계 예측 오류

인디케이터의 유일한 입력 변수는 구간의 길이를 정의하는 값입니다. 이에 따라 초기 구간 값이 정해지고 모델의 매개 변수들이 최적화되죠. 주어진 구간 내 모델 매개 변수의 최적 값과 필요한 연산을 결정하면 1단계 예측 모델에 대한 예측 값, 신뢰 구간 및 차트 선이 나타납니다. 새로운 바가 생성될 때마다 매개 변수가 최적화되며 예측이 일어나고요.

해당 인디케이터의 업그레이드에 따른 결과 변화는 본문 하단에 첨부된 Files2.zip 파일에 첨부된 테스트 시퀀스를 이용해 평가하겠습니다. 첨부 파일의 \Dataset2 폴더에 EURUSD, USDCHF 및 USDJYP 통화쌍 시세 파일이 포함되어 있습니다. 미국 달러 지수(DXY) 파일 또한 찾아볼 수 있는데요. 각 파일은 M1, H1 그리고 D1의 세 가지 타임 프레임을 갖고 있습니다. 가장 최근 값이 파일의 제일 끝에 위치하도록 순서가 설정되어 있고요. 각 파일은 1200개의 엘리먼트를 포함합니다.

예측 오류는 평균절대비오차(MAPE) 계수를 이용해 측정됩니다.

총 12개의 테스트 시퀀스를 각각 80개의 엘리먼트를 포함하는 50개의 오버랩 구간으로 나누어 MAPE 값을 계산합니다. 이렇게 얻어진 추산치의 평균이 비교 대상 인디케이터에 대한 예측 오류 인덱스로 이용됩니다. 같은 방법으로 2단계 및 3단계 예측 오류 값을 계산합니다. 평균 추산치는 다음과 같이 표기합니다.

MAPE1–1단계 예측 오류 평균 추산치
MAPE2–2단계 예측 오류 평균 추산치
MAPE3–3단계 예측 오류 평균 추산치
MAPE1-3–평균값(MAPE1+MAPE2+MAPE3)/3

MAPE 값 계산 시 매 단계별로 예측 오류 절대값이 현재 시퀀스 값으로 나뉘어집니다. 0으로 나누거나 음수 값이 나오는 것을 방지하기 위해 인풋 시퀀스는 0이 아닌 양의 값을 취해야 하기 때문입니다.

표 1에 기존 인디케이터 예측 값이 나타나 있습니다.

	MAPE1	MAPE2	MAPE3	MAPE1-3
IndicatorES	0.2099	0.2925	0.3564	0.2863

표 1. 초기 인디케이터 예측 오류 추산

표 1에 나타난 데이터는 Errors_IndicatorES.mq5 파일 스크립트(본문 하단 files2.zip에 포함)를 이용해 얻은 것입니다. 컴파일 및 스크립트 실행을 위해서는 CIndictorES.mqh 파일과 PowellsMethod.mqh 파일이 Errors_IndicatorES.mq5 파일과 동일한 디렉토리에 위치해야 하며 인풋 시퀀스는 Files/Dataset2/ 폴더에 저장되어야 합니다.

예측 오류 초기 추산치가 획득되었으니 본격적인 인디케이터 업그레이드를 시작하겠습니다.

2. 최적화 기준

'지수 평활법을 이용한 시계열 예측'에서 기존 인디케이터 모델 매개 변수는 1단계 예측 오류 값 제곱의 합의 최소화를 통해 결정되었습니다. 1단계 예측 모델에 최적화된 매개 변수가 2단계 이상 예측 모델에 대한 최소 오류값을 발생시키지 않는다고 봐도 되겠죠. 물론 10~12단계 예측 모델의 오류가 거의 없으면 좋겠지만 해당 시퀀스에 대해 만족스러운 예측 결과를 얻는 것은 거의 불가능한 일입니다..

따라서 매개 변수 최적화 시 1~3단계 예측 모델 오류 추산치의 제곱의 합을 이용하기로 합니다. 기존 인디케이터에 대한 첫 번째 업그레이드네요. 평균 오류 발생 횟수는 3단계에 걸쳐 점차 감소할 것으로 예측할 수 있습니다.

물론 기존 인디케이터의 주요 구조는 바꾸지 않고 매개 변수 최적화 기준만 변경하는 것입니다. 따라서 전체 예측 정확도가 갑자기 몇 배나 증가하기를 기대할 수는 없죠.

예측 결과를 비교하기 위해 지난 글에서 소개된 CIndicatorES 클래스와 유사한 CMod1 클래스를 생성합니다. 목적 함수 func가 수정되었죠.

기존 CIndicatorES 클래스의 func 함수는 다음과 같습니다.

double CIndicatorES::func(const double &p[])
  {
  int i;
  double s,t,alp,gam,phi,k1,k2,k3,e,sse,ae,pt;
  
  s=p[0]; t=p[1]; alp=p[2]; gam=p[3]; phi=p[4]; k1=1; k2=1; k3=1;
  if     (alp>0.95){k1+=(alp-0.95)*200; alp=0.95;}       // Alpha  > 0.95
  else if(alp<0.05){k1+=(0.05-alp)*200; alp=0.05;}       // Alpha  < 0.05
  if     (gam>0.95){k2+=(gam-0.95)*200; gam=0.95;}      // Gamma  > 0.95
  else if(gam<0.05){k2+=(0.05-gam)*200; gam=0.05;}       // Gamma  < 0.05
  if     (phi>1.0 ){k3+=(phi-1.0 )*200; phi=1.0; }      // Phi    > 1.0
  else if(phi<0.05){k3+=(0.05-phi)*200; phi=0.05;}       // Phi    < 0.05
  sse=0; 
  for(i=0;i<Dlen;i++)
    {
    e=Dat[i]-(s+phi*t); sse+=e*e;
    ae=alp*e; pt=phi*t; s=s+pt+ae; t=pt+gam*ae;
    }
  return(Dlen*MathLog(k1*k2*k3*sse));
  }

약간의 수정을 거쳐 다음의 func 함수로 변경되었습니다.

double CMod1::func(const double &p[])
  {
  int i;
  double s,t,alp,gam,phi,k1,k2,k3,e,err,ae,pt,phi2,phi3,a;
  
  s=p[0]; t=p[1]; alp=p[2]; gam=p[3]; phi=p[4]; k1=1; k2=1; k3=1;
  if     (alp>0.95){k1+=(alp-0.95)*200; alp=0.95;        // Alpha   > 0.95
  else if(alp<0.05){k1+=(0.05-alp)*200; alp=0.05;}       // Alpha   < 0.05
  if     (gam>0.95){k2+=(gam-0.95)*200; gam=0.95;}      // Gamma   > 0.95
  else if(gam<0.05){k2+=(0.05-gam)*200; gam=0.05;}       // Gamma   < 0.05
  if     (phi>1.0 ){k3+=(phi-1.0 )*200; phi=1.0; }      // Phi     > 1.0
  else if(phi<0.05){k3+=(0.05-phi)*200; phi=0.05;}       // Phi     < 0.05
  phi2=phi+phi*phi; phi3=phi2+phi*phi*phi;
  err=0;
  for(i=0;i<Dlen-2;i++)
    {
    e=Dat[i]-(s+phi*t); err+=e*e;
    a=Dat[i+1]-(s+phi2*t); err+=a*a;
    a=Dat[i+2]-(s+phi3*t); err+=a*a;
    ae=alp*e; pt=phi*t; s=s+pt+ae; t=pt+gam*ae;
    }
  e=Dat[Dlen-2]-(s+phi*t); err+=e*e;
  a=Dat[Dlen-1]-(s+phi2*t); err+=a*a;
  ae=alp*e; pt=phi*t; s=s+pt+ae; t=pt+gam*ae;
  a=Dat[Dlen-1]-(s+phi*t); err+=a*a;
  return(k1*k2*k3*err);
  }

이제 목적 함수 연산 시 1, 2, 3단계 예측 오류 추산치 제곱의 합이 사용됩니다.

또한, 해당 클래스를 기반으로 위에서 언급했던 Errors_IndicatorES.mq5처럼 예측 오류 추산치를 측정할 수 있는 Erros_mod1.mq5 스크립트가 생성되었습니다. CMod1.mqh 파일과 Errors_Mod1.mq5 파일은 본문 하단에 위치한 files2.zip 파일에 포함되어 있습니다.

표 2는 기존 인디케이터와 업그레이드된 인디케이터의 예측 오류 추산치를 나타냅니다.

	MAPE1	MAPE2	MAPE3	MAPE1-3
IndicatorES	0.2099	0.2925	0.3564	0.2863
Mod1	0.2144	0.2898	0.3486	0.2842

표 2. 예측 오류 측정치 비교

오류 계수인 MAPE2와 MAPE3, 그리고 평균값인 MAPE1-3이 실제로도 좀 더 낮게 나왔네요. 일단 저장 후 계속해서 수정하겠습니다.

3. 평활화 과정 매개 변수 조정

현재 값을 기준으로 평활화 매개 변수를 수정하는 것은 인풋 시퀀스 변경 시에도 평활화 계수가 최적화되도록 하기 위함입니다. 평활화 계수 조정 방법은 참고 문헌 2, 3에서 찾아볼 수 있습니다.

적응형 지수 평활화 모델을 이용하면 인디케이터의 예측 정확도가 향상될 것이므로 평활화 계수가 동적으로 변화하는 모델을 사용하도록 하겠습니다.

안타깝게도 예측 알고리즘에서 사용해 보니 대부분의 적응형 메소드가 항상 원하는 결과를 가져오지는 못하더군요. 적절한 적응형 메소드를 찾는 일은 매우 귀찮고 시간도 오래 걸리는 일입니다. 따라서 우리의 경우 참고 문헌 4번을 따라 5번에서 제시된 STES 접근법을 이용하도록 하겠습니다.

해당 접근법에 대한 설명은 참고 문헌에서 확인 가능하니 곧바로 기존 평활화 모델 수식에 적응형 평활화 계수를 적용해 보도록 하겠습니다.

평활화 계수 알파의 값은 알고리즘 단계별로 계산되며 예측 오류 값의 제곱값에 좌우됩니다. b와 g 계수의 값이 알파 값에 대한 예측 오류 값의 영향을 결정하죠. 나머지 수식은 기존과 동일합니다. STES 접근법에 대한 추가 설명은 참고 문헌 6번에서 찾아볼 수 있습니다.

이전 버전에서는 인풋 시퀀스별 알파 계수 최적화 값을 지정해야 했던 반면, 이제 인풋 시퀀스 평활화 과정에서 적응형 계수 b와 g가 최적화되며 알파 값이 자동으로 정해질 겁니다.

이는 CMod2 클래스를 이용해 구현됩니다. 이번에도 func 함수 관련 사항만 수정했는데요. 이제 해당 함수는 다음과 같이 나타납니다.

double CMod2::func(const double &p[])
  {
  int i;
  double s,t,alp,gam,phi,sb,sg,k1,k2,e,err,ae,pt,phi2,phi3,a;
  
  s=p[0]; t=p[1]; gam=p[2]; phi=p[3]; sb=p[4]; sg=p[5]; k1=1; k2=1;
  if     (gam>0.95){k1+=(gam-0.95)*200; gam=0.95;}        // Gamma   > 0.95
  else if(gam<0.05){k1+=(0.05-gam)*200; gam=0.05;}        // Gamma   < 0.05
  if     (phi>1.0 ){k2+=(phi-1.0 )*200; phi=1.0; }       // Phi     > 1.0
  else if(phi<0.05){k2+=(0.05-phi)*200; phi=0.05;}        // Phi     < 0.05
  phi2=phi+phi*phi; phi3=phi2+phi*phi*phi;
  err=0;
  for(i=0;i<Dlen-2;i++)
    {
    e=Dat[i]-(s+phi*t); err+=e*e;
    a=Dat[i+1]-(s+phi2*t); err+=a*a;
    a=Dat[i+2]-(s+phi3*t); err+=a*a;
    alp=0.05+0.9/(1+MathExp(sb+sg*e*e));                  // 0.05 < Alpha < 0.95
    ae=alp*e; pt=phi*t; s=s+pt+ae; t=pt+gam*ae;
    }
  e=Dat[Dlen-2]-(s+phi*t); err+=e*e;
  a=Dat[Dlen-1]-(s+phi2*t); err+=a*a;
  alp=0.05+0.9/(1+MathExp(sb+sg*e*e));                    // 0.05 < Alpha < 0.95
  ae=alp*e; pt=phi*t; s=s+pt+ae; t=pt+gam*ae;
  a=Dat[Dlen-1]-(s+phi*t); err+=a*a;
  return(k1*k2*err);
  }

알파 계수 값을 설정하는 수식이 약간 변경되었습니다. 해당 계수 값의 최대 및 최소 허용 값이 각각 0.05와 0.95로 설정되었습니다.

예측 오류 추산을 위해 CMod2 클래스를 기반으로 한 Errors_Mod2.mq5 스크립트가 작성됩니다. CMod2.mqh 파일과 Errors_Mod2.mq5 파일은 본문 하단의 files2.zip 파일에 포함되어 있습니다.

표 3은 스크립트 실행 결과입니다.

	MAPE1	MAPE2	MAPE3	MAPE1-3
IndicatorES	0.2099	0.2925	0.3564	0.2863
Mod1	0.2144	0.2898	0.3486	0.2842
Mod2	0.2145	0.2832	0.3413	0.2797

표 3. 예측 오류 측정치 비교

적응형 평활화 계수 사용 결과 테스트 시퀀스에 대한 예측 오류 값이 약간 더 줄었습니다. 두 번의 업그레이드를 통해 오류 계수 MAPE1-3이 약 2% 감소되었죠.

큰 변화는 없었지만 일단은 여기까지만 수정하도록 하겠습니다. 다음에는 박스-칵스(Box-Cox) 변환을 이용해 보면 좋겠네요. 해당 변환은 초기 시퀀스 분포를 정규 분포와 유사하게 만드는 데에 쓰입니다.

우리의 경우, 초기 시퀀스를 변환하고, 예측 값을 산출한 후 산출된 예측 값을 재변환시킬 수 있겠죠. 변환 계수는 예측 오류 값이 최소화될 수 있도록 설정되어야 합니다. 박스-칵스 변환을 이용한 예제는 참고 문헌 7번에서 찾아볼 수 있습니다.

4. 예측 신뢰 구간

IndicatorES.mq5 인디케이터(이전 글 참조)의 예측 신뢰 구간은 특정 지수 평활화 모델에 맞는 분석 방정식을 통해 산출되었습니다. 따라서 업그레이드된 인디케이터는 기존의 인디케이터와 다른 값을 갖습니다. 평활화 계수 변수가 있기 때문에 위의 분석 방정식은 더이상 사용할 수 없습니다.

기존의 분석 방정식이 예측 오류 측정치의 분포가 좌우 대칭을 이루는 정규 분포일 것이라는 가정 때문에도 더이상 사용할 수 없겠네요. 필요 조건이 맞지 않을 뿐더러 예측 오류 분포는 정규 분포가 아닐 수도 있고 또 대칭을 이루지 않을 수도 있으니까요.

초기 인디케이터의 신뢰 구간 측정 시, 인풋 시퀀스에서부터 1단계, 2단계, 3단계.... n단계까지의 분석식을 이용한 예측 오류가 고려됩니다.

분석식을 이용하지 않고도 인풋 시퀀스에서 곧바로 예측 오류를 계산하는 방법도 있기는 합니다. 하지만 여기에는 큰 단점이 있죠. 인풋 시퀀스가 짧은 경우 신뢰 구간 추정치가 광범위하게 흩어지며 분산 및 평균의 제곱 편차 계산으로는 예상되는 오류의 정규성 관련 문제를 해결할 수 없게 됩니다.

이는 비모수 부트스트랩(리샘플링)을 통해 해결할 수 있습니다(참고 문헌 9번 참조). 핵심은 간단합니다. 초기 시퀀스에서 벗어나 무작위 샘플링(균등 분포)을 하는 경우 해당 인공 시퀀스의 분포가 초기 분포와 동일한 분포를 띤다는 것입니다.

N개의 멤버를 가진 인풋 시퀀스가 있다고 가정합니다. [0, N-1] 구간에 균등 분포를 이루는 유사 난수 시퀀스를 생성하여 초기 배열에 대한 샘플링 시 이를 인덱스로 사용하면 초기 시퀀스보다 훨씬 긴 인공 시퀀스가 생성됩니다. 이렇게 하면 생성된 시퀀스의 분포가 초기 시퀀스의 분포와 동일하거나 거의 동일한 모습을 띠죠.

신뢰 구간 측정을 위한 부트스트랩 프로시저는 다음과 같습니다.

업그레이드된 지수 평활화 모델의 인풋 시퀀스에서 모델 매개 변수의 초기 최적화 값과 해당 계수, 적응형 계수를 구합니다. 최적화 매개 변수는 Powell의 최적화 알고리즘을 이용해 산출됩니다.
산출된 최적화 매개 변수를 이용해 초기 시퀀스에 1단계 예측 오류 배열을 생성합니다. 이때 배열 내 엘리먼트의 개수는 인풋 시퀀스의 길이 N과 동일합니다.
오류 배열 내 각각의 엘리먼트에서 평균값을 뺀 오류 값을 정렬합니다.
유사 난수 시퀀스 생성기를 이용해 [0, N-1] 구간에 인덱스를 생성하고 이를 이용해 9999개의 엘리먼트로 이루어진 인공 오류 시퀀스를 형성(리샘플링)합니다.
현재 사용되는 모델의 방정식에 인공적으로 생성된 오류 배열 값을 입력해 9999개의 유사 난수 시퀀스 값을 갖는 배열을 형성합니다. 이전에는 인풋 시퀀스 값을 모델의 방정식에 대입해 예측 오류 값을 산출했다면, 이번에는 그 반대의 계산을 하는 거죠. 배열 내 각각의 엘리먼트마다 오류 값이 대입되어 입력값을 계산합니다. 그 결과, 인풋 시퀀스와 동일한 분포를 갖는, 예측 신뢰 구간을 직접 계산하기에 충분한 길이를 가진 9999개의 엘리먼트로 이루어진 배열이 탄생합니다.

이제 생성된 시퀀스를 이용해 신뢰 구간을 측정하면 됩니다. 생성된 예측 오류 배열이 오름차순을 따르는 경우, 249번과 9749번 인덱스를 갖는 배열 내 셀은 95% 신뢰 구간에 해당하는 값을 갖게 됩니다.

예측 구간을 보다 정확하게 측정하려면 홀수 길이를 갖는 배열을 이용하는 것이 좋습니다. 우리의 경우 예측 신뢰 구간의 한계는 다음과 같이 측정됩니다.

기존 설정된 최적화 모델 매개 변수를 이용해 생성된 시퀀스로 9999개의 1단계 예측 오류 값을 갖는 배열을 형성합니다.
결과 배열을 정렬합니다.
정렬된 배열에서 249번과 9749번 인덱스를 갖는 값을 선택합니다. 이는 95% 신뢰 구간을 나타냅니다.
2단계 이상의 예측 오류 측정이 필요한 경우 앞의 세 단계를 반복합니다.

이런 접근법에는 장점과 단점이 공존하는데요.

장점 가운데 하나는 예측 오류 값의 분포에 대해 생각할 필요가 없다는 것입니다. 정규 분포를 따르거나 대칭을 이룰 필요가 없죠. 또한 사용 모델에 대한 분석식을 만들기 어려울 때 적용하기 좋은 방법이기도 합니다.

단점으로는 연산 범위가 크게 확장된다는 것과 예측 오류 값이 유사 난수 시퀀스 생성기의 능력에 좌우된다는 점이 있겠네요.

해당 접근법은 꽤 원시적인 방법이므로 개선의 여지가 큽니다. 다만 우리의 경우 시각적 평가 목적으로 신뢰 구간이 필요한 것이므로 이 정도 정확도만으로도 충분한 것이죠.

5. 기존 인디케이터 수정 결과

기존의 인디케이터를 업그레이드한 ForecastES.mq5 인디케이터가 완성되었습니다. 유사 난수 시퀀스 생성기를 이용해 리샘플링을 진행했습니다. 기존의 MathRand() 생성기로는 덜 만족스러운 결과가 도출되었는데요. 아마 생성된 구간 [0, 32767]이 충분히 넓지 못했기 때문일 겁니다.

ForecastES.mq5 인디케이터 컴파일 시 PowellsMethod.mqh 파일과 CForeES.mqh 파일 그리고 RNDXor128.mqh 파일은 인디케이터와 동일한 디렉토리에 저장되어야 합니다. 해당 파일은 모두 fore.zip 파일에 첨부되어 있습니다.

아래는 ForecastES.mq5 인디케이터의 소스 코드입니다.

//+------------------------------------------------------------------+
//|                                                   ForecastES.mq5 |
//|                                          Copyright 2012, victorg |
//|                                              https://www.mql5.com |
//+------------------------------------------------------------------+
#property copyright   "2012, victorg."
#property link        "https://www.mql5.com"
#property version     "1.02"
#property description "Forecasting based on the exponential smoothing."

#property indicator_chart_window
#property indicator_buffers 4
#property indicator_plots   4

#property indicator_label1  "History"
#property indicator_type1   DRAW_LINE
#property indicator_color1  clrDodgerBlue
#property indicator_style1  STYLE_SOLID
#property indicator_width1  1
#property indicator_label2  "Forecast"           // Forecast
#property indicator_type2   DRAW_LINE
#property indicator_color2  clrDarkOrange
#property indicator_style2  STYLE_SOLID
#property indicator_width2  1
#property indicator_label3  "ConfUp"             // Confidence interval
#property indicator_type3   DRAW_LINE
#property indicator_color3  clrCrimson
#property indicator_style3  STYLE_DOT
#property indicator_width3  1
#property indicator_label4  "ConfDn"             // Confidence interval
#property indicator_type4   DRAW_LINE
#property indicator_color4  clrCrimson
#property indicator_style4  STYLE_DOT
#property indicator_width4  1

input int nHist=80; // History bars, nHist>=24

#include  "CForeES.mqh"
#include  "RNDXor128.mqh"

#define   NFORE 12
#define   NBOOT 9999

double    Hist[],Fore[],Conf1[],Conf2[];
double    Data[],Err[],BSDat[],Damp[NFORE],BSErr[NBOOT];
int       NDat;

CForeES   Es;
RNDXor128 Rnd;
//+------------------------------------------------------------------+
//| Custom indicator initialization function                         |
//+------------------------------------------------------------------+
int OnInit()
  {
   NDat=nHist; if(NDat<24)NDat=24;
   MqlRates rates[];
   CopyRates(NULL,0,0,NDat,rates);                 // Load missing data
   ArrayResize(Data,NDat);
   ArrayResize(Err,NDat);
   ArrayResize(BSDat,NBOOT+NFORE);

   SetIndexBuffer(0,Hist,INDICATOR_DATA);
   PlotIndexSetString(0,PLOT_LABEL,"History");
   SetIndexBuffer(1,Fore,INDICATOR_DATA);
   PlotIndexSetString(1,PLOT_LABEL,"Forecast");
   PlotIndexSetInteger(1,PLOT_SHIFT,NFORE);
   SetIndexBuffer(2,Conf1,INDICATOR_DATA);         // Confidence interval
   PlotIndexSetString(2,PLOT_LABEL,"ConfUp");
   PlotIndexSetInteger(2,PLOT_SHIFT,NFORE);
   SetIndexBuffer(3,Conf2,INDICATOR_DATA);         // Confidence interval
   PlotIndexSetString(3,PLOT_LABEL,"ConfDN");
   PlotIndexSetInteger(3,PLOT_SHIFT,NFORE);
   IndicatorSetInteger(INDICATOR_DIGITS,_Digits);
   return(0);
  }
//+------------------------------------------------------------------+
//| Custom indicator iteration function                              |
//+------------------------------------------------------------------+
int OnCalculate(const int rates_total,
                const int prev_calculated,
                const datetime &time[],
                const double &open[],
                const double &high[],
                const double &low[],
                const double &close[],
                const long &tick_volume[],
                const long &volume[],
                const int  &spread[])
  {
   int i,j,k,start;
   double s,t,alp,gam,phi,sb,sg,e,f,a,a1,a2;

   if(rates_total<NDat){Print("Error: Not enough bars for calculation!"); return(0);}
   if(prev_calculated==rates_total)return(rates_total); // New tick but not new bar
   start=rates_total-NDat;
//-----------------------
   PlotIndexSetInteger(0,PLOT_DRAW_BEGIN,rates_total-NDat);
   PlotIndexSetInteger(1,PLOT_DRAW_BEGIN,rates_total-NFORE);
   PlotIndexSetInteger(2,PLOT_DRAW_BEGIN,rates_total-NFORE);
   PlotIndexSetInteger(3,PLOT_DRAW_BEGIN,rates_total-NFORE);

   for(i=0;i<NDat;i++)Data[i]=open[rates_total-NDat+i]; // Input data
   Es.CalcPar(Data);                                    // Optimization of parameters
   s=Es.GetPar(0); t=Es.GetPar(1); gam=Es.GetPar(2);
   phi=Es.GetPar(3); sb=Es.GetPar(4); sg=Es.GetPar(5);
//----
   a=phi; Damp[0]=phi;
   for(j=1;j<NFORE;j++){a=a*phi; Damp[j]=Damp[j-1]+a;}  // Phi table
//----
   f=s+phi*t;
   for(i=0;i<NDat;i++) // History
     {
      e=Data[i]-f; Err[i]=e;
      alp=0.05+0.9/(1+MathExp(sb+sg*e*e));               // 0.05 < Alpha < 0.95
      a1=alp*e; a2=phi*t; s=s+a2+a1; t=a2+gam*a1;
      f=(s+phi*t); Hist[start+i]=f;                      // History
     }
   for(j=0;j<NFORE;j++)Fore[rates_total-NFORE+j]=s+Damp[j]*t;  // Forecast
//----
   a=0;
   for(i=0;i<NDat;i++)a+=Err[i];
   a/=NDat;
   for(i=0;i<NDat;i++)Err[i]-=a;                       // alignment of the array of errors
//----
   f=Es.GetPar(0)+phi*Es.GetPar(1);
   for(i=0;i<NBOOT+NFORE;i++) // Resampling
     {
      j=(int)(NDat*Rnd.Rand_01());
      if(j>NDat-1)j=NDat-1;
      e=Err[j];
      BSDat[i]=f+e;
      alp=0.05+0.9/(1+MathExp(sb+sg*e*e));               // 0.05 < Alpha < 0.95
      a1=alp*e; a2=phi*t; s=s+a2+a1; t=a2+gam*a1;
      f=s+phi*t;
     }
//----
   for(j=0;j<NFORE;j++) // Prediction intervals
     {
      s=Es.GetPar(0); t=Es.GetPar(1);
      f=s+phi*t;
      for(i=0,k=0;i<NBOOT;i++,k++)
        {
         BSErr[i]=BSDat[i+j]-(s+Damp[j]*t);
         e=BSDat[i]-f;
         a1=alp*e; a2=phi*t; s=s+a2+a1; t=a2+gam*a1;
         f=(s+phi*t);
        }
      ArraySort(BSErr);
      Conf1[rates_total-NFORE+j]=Fore[rates_total-NFORE+j]+BSErr[249];
      Conf2[rates_total-NFORE+j]=Fore[rates_total-NFORE+j]+BSErr[9749];
     }
   return(rates_total);
  }
//-----------------------------------------------------------------------------------

이해를 돕기 위해 인디케이터는 최대한 직선 프로그램으로 구성했습니다. 최적화 단계는 포함되어 있지 않습니다.

그림 1과 2는 두 개의 인디케이터 연산 결과를 나타냅니다.

ForecastES.mq5 인디케이터 연산 예제 1

그림 1. ForecastES.mq5 인디케이터 연산 예제 1

ForecastES.mq5 인디케이터 연산 예제 2

그림 2. ForecastES.mq5 인디케이터 연산 예제 2

그림 2를 보면 95% 신뢰 구간이 대칭을 이루지 않는다는 것을 확실히 알 수 있죠. 인풋 시퀀스가 꽤 많은 극단값을 가지고 있음을 의미합니다. 예측 오류 값이 불규칙적으로 분포된 것이죠.

www.mql4.com과 www.mql5.com에서 보외법이 적용된 인디케이터를 다운로드할 수 있습니다. 그 중 하나를 이용해 보죠. ar_extrapolator_of_price.mq5 파일을 열어 그림 3과 같이 매개 변수를 설정하여 우리가 개발한 인디케이터와 결과를 비교해 봅니다.

ar_extrapolator_of_price.mq5 인디케이터 설정

그림 3. ar_extrapolator_of_price.mq5 인디케이터 설정

두 인디케이터의 연산 결과는 EURUSD와 USDCHF 통화쌍의 서로 다른 구간에서 비교되었습니다. 겉으로 보기에는 두 인디케이터의 예측 방향이 대부분 비슷하게 나타나죠. 그러나 구간을 넓히면 디버전스가 뚜렷하게 보입니다. ar_extrapolator_of_price.mq5 인디케이터의 예측 선이 더 많이 끊기게 되죠.

그림 4는 ForecastES.mq5 인디케이터와 ar_extrapolator_of_price.mq5 인디케이터를 동시에 실행한 결과입니다.

예측 결과 비교

그림 4. 예측 결과 비교

ar_extrapolator_of_price.mq5 인디케이터의 예측 값이 진한 주황색 실선으로 표시되어 있습니다.

결론

이번 글과 지난 글을 통해 배운 내용을 요약하면 다음과 같습니다.

시간열 예측에 이용되는 지수 평활화 모델 소개
모델 구현 프로그래밍 방법 소개
최적화 초기 값 및 모델 매개 변수 선택 관련 문제 설명
Powell의 알고리즘을 이용한 함수 최소화 프로그램 구현
인풋 시퀀스를 이용한 예측 모델용 매개 변수 최적화 솔루션
간단한 예측 알고리즘 업그레이드 방법
부트스트랩과 분위수를 이용한 예측 신뢰 구간 계산 방법
본문에서 설명된 모든 방법과 알고리즘이 적용된 ForecastES.mq5 예측 인디케이터 개발
해당 주제와 관련된 여러 글이나 책 등도 링크해 놓았습니다.

ForecastES.mq5 인디케이터와 관련하여, Powell의 알고리즘을 이용한 최적화 알고리즘이 주어진 정확도를 만족시키는 목적 함수의 최소값을 구하지 못하는 경우도 있음에 주의하세요. 이 경우 알고리즘이 최대 실행 가능 횟수만큼 실행된 후 메세지가 나타날 겁니다. 본문에서는 필요하지 않기 때문에 따로 설명하지 않았습니다. 인디케이터 실제 적용 시에는 면밀한 모니터링이 필요합니다.

각 단계에서 여러 예측 모델을 동시에 실행한 후 아카이케 정보 기준 등을 이용해 하나의 인디케이터를 추가하는 식으로 예측 인디케이터를 한층 더 업그레이드할 수 있습니다. 혹은 비슷한 모델을 적용하는 경우 각 예측 값의 가중 평균을 계산할 수도 있겠죠. 모델별 예측 오류 계수에 따라 가중 인자를 선택하면 됩니다.

시간열 예측이 굉장히 광범위한 주제라 본문에서 깊게 다루지 못한 부분이 많아 아쉽네요. 제가 쓰는 글들이 관련 주제에 대한 여러분들의 관심을 키울 기회가 되었으면 합니다.

참고 문헌

'지수 평활법을 이용한 시계열 예측'
Yu. P. Lukashin. Adaptive Methods for Short-Term Forecasting of Time Series: Textbook. - М.: Finansy i Statistika, 2003.-416 pp.
S.V. Bulashev. Statistics for Traders. - М.: Kompania Sputnik +, 2003. - 245 pp.
Everette S. Gardner Jr., Exponential Smoothing: The State of the Art – Part II. June 3, 2005.
James W. Taylor, Smooth Transition Exponential Smoothing. Journal of Forecasting, 2004, Vol. 23, pp. 385-394.
James W. Taylor, Volatility Forecasting with Smooth Transition Exponential Smoothing. International Journal of Forecasting, 2004, Vol. 20, pp. 273-286.
Alysha M De Livera. Automatic Forecasting with a Modified Exponential Smoothing State Space Framework. 28 April 2010, Department of Econometrics and Business Statistics, Monash University, VIC 3800 Australia.
Rob J Hyndman et al. Prediction Intervals for Exponential Smoothing Using Two New Classes of State Space Models. 30 January 2003.
The Quantile Journal. issue No. 3, September 2007.
http://ru.wikipedia.org/wiki/Квантиль
'시간열 주요 특성 분석'

MetaQuotes 소프트웨어 사를 통해 러시아어가 번역됨.
원본 기고글: https://www.mql5.com/ru/articles/346

파일 첨부됨 |

ZIP파일 다운로드

files2.zip (40.75 KB)

fore.zip (53.5 KB)

경고: 이 자료들에 대한 모든 권한은 MetaQuotes(MetaQuotes Ltd.)에 있습니다. 이 자료들의 전부 또는 일부에 대한 복제 및 재출력은 금지됩니다.

이 글은 사이트 사용자가 작성했으며 개인의 견해를 반영합니다. Metaquotes Ltd는 제시된 정보의 정확성 또는 설명 된 솔루션, 전략 또는 권장 사항의 사용으로 인한 결과에 대해 책임을 지지 않습니다.

이 작가의 다른 글

최근 코멘트 | 토론으로 가기 (8)

Victor | 18 4월 2012 에서 06:29

elab74:
빅터, 히스토리 이동으로 인디케이터를 수정한 적이 없나요? 마지막 막대뿐만 아니라요. 구현하신 방법의 효율성을 대략적으로 추정하고 싶습니다.

아니요, 인디케이터를 변경하지 않았습니다.

Victor | 2 5월 2012 에서 12:41

ForecastES.mq5 파일에서 감지된 오류가 수정되었습니다. 업데이트된 ForecastES.mq5 파일은 이전과 마찬가지로 Fore.zip 아카이브에 있습니다.

Sami Saydam | 29 12월 2013 에서 14:31

MetaQuotes:

새 문서 지수 평활을 사용한 시계열 예측(계속) 이 게시되었습니다:

작성자: Victor

MT5의 코드베이스 섹션에서 이 수정된 새 지표를 여러 번 검색하려고 시도했지만 찾을 수 없었습니다.

제가 쉽게 다운로드하여 테스트할 수 있도록 MT5의 코드 베이스에 추가해 주시겠습니까? 아니면 수정된 인디케이터와 MT5에 다운로드하는 방법을 알려주시겠습니까?

MT4에서도 같은 방법이 있나요?

어떤 것이든 도움이 될 수 있습니다.

감사합니다

Sergey Golubev | 6 6월 2014 에서 21:48

트레이딩, 자동매매 시스템 및 트레이딩 전략 테스트 포럼

"지수 평활을 이용한 시계열 예측" 문서에 대한 토론

뉴디지털, 2014.06.06 21:48

두려움 없는 외환 트레이더 되기

다음에 무슨 일이 일어날지 알아야 할까?
더 나은 방법이 있을까요?
모른다는 것을 알 때의 전략

"좋은 투자는 자신의 생각을 따르겠다는 신념과 실수했을 때 인정하는 유연성 사이의 독특한 균형입니다."
마이클 슈타인하르트

"트레이딩 오류의 95%는 틀릴 수 있다는 생각, 돈을 잃을 수 있다는 생각, 놓칠 수 있다는 생각, 테이블 위에 돈을 남겨두는 생각, 즉 네 가지 트레이딩 공포에서 비롯된다."
-마크 더글러스, Trading In the Zone

많은 트레이더가 예측이라는 아이디어에 매료되어 있습니다. 예측의 필요성은 성공적인 트레이딩에 내재되어 있는 것 같습니다. 결국 돈을 벌려면 다음에 무슨 일이 일어날지 알아야 한다고 생각하겠죠? 다행히도 이는 옳지 않으며 이 글에서는 다음에 무슨 일이 일어날지 몰라도 잘 거래할 수 있는 방법을 설명합니다.

다음에 무슨 일이 일어날지 알아야 하나요?

다음에 무슨 일이 일어날지 알면 도움이 되겠지만 아무도 확실히 알 수는 없습니다. 내부자 거래가 주식 시장에서 종종 시험대에 오르는 범죄인 이유는 일부 트레이더가 미래를 알고 싶어 필사적으로 속임수를 쓰다가 적발되면 엄중한 벌금을 내기 때문입니다. 요컨대, 돈이 걸려 있을 때 확실한 미래를 생각하는 것은 위험하며 거래를 할 때는 확실성보다 불확실성을 생각하는 것이 가장 좋습니다.

거래의 미래를 반드시 알아야 한다고 생각하는 것의 문제점은 예상과 달리 거래에 불리한 일이 발생하면 두려움이 생긴다는 것입니다. 두려움 그 자체는 나쁘지 않습니다. 그러나 돈을 걸고 거래하는 대부분의 트레이더는 두려움에 사로잡혀 거래를 체결하지 못하는 경우가 많습니다.

다음에 무슨 일이 일어날지 알 필요가 없다면 무엇이 필요할까요? 목록은 의외로 짧고 간단하지만 더 중요한 것은 무슨 일이 일어날지 모른다고 생각하면 트레이딩 세계에 항상 존재하는 위험을 과도하게 활용하고 경시할 가능성이 높기 때문입니다.

편안하게 거래에 진입할 수 있는 깨끗한 호가창
거래 설정이 더 이상 유효하지 않은 잘 정의된 무효화 지점
잠재적 반전 진입 포인트
적절한 거래 규모/자금 관리

더 나은 방법이 있을까요?

어제 유럽중앙은행은 리파이 금리와 예금 금리를 인하하기로 결정했습니다. 많은 트레이더가 숏 포지션을 취했지만 EURUSD는 일일 ATR 범위의 250%를 커버하고 고점 부근에서 마감하여 EURUSD 강세를 나타냈습니다. 간단히 말해, 결과는 대부분의 트레이더가 예상할 수 있는 범위를 벗어난 것이었고, 숏에 들어갔다가 공포에 휩싸였다면 숏을 청산하지 않았을 가능성이 높으며, 이는 손실에 대한 두려움의 또 다른 표현인 "시장의 희생자"였습니다.

그렇다면 더 좋은 방법은 무엇일까요? 믿거나 말거나, 시장이 얼마나 감정적일 수 있는지 이해하고 시장이 "가야 하는" 방향에 얽매이지 않는 것이 최선이라는 것을 이해하면서 시장에 접근하는 것입니다. 많은 트레이더는 계좌의 이익이 아니라 자존심을 지키기 위해 손실이 난 트레이딩을 유지합니다. 물론 더 나은 트레이딩 방법은 계좌 자산을 보호하는 데 집중하고 자존심은 트레이딩에 부정적인 영향을 미치지 않도록 트레이딩룸 문 앞에 두는 것입니다.

모르는 것을 알 때의 전략

두려움 없이 거래할 수 있는 트레이더에게는 한 가지 공통점이 있습니다. 그들은 손실 거래를 접근 방식에 포함시킵니다. 이는 체스의 갬빗과 유사하며 많은 트레이더에게 두려움이 주는 우위와 강점을 제거합니다. 체스를 모르는 분들에게 갬빗은 이점을 얻기 위해 폰과 같이 가치가 낮은 말을 희생하는 플레이입니다. 트레이딩에서 갬빗은 트레이딩에 진입하는 순간 우위를 파악할 수 있는 첫 번째 거래가 될 수 있습니다.

제임스 스탠리의 USD 헤지는 하나의 거래가 손실이 될 것이라는 가정하에 작동하는 전략의 좋은 예입니다. 이 전략의 의미는 무엇일까요? 손실을 미리 가정하고 많은 트레이더를 괴롭히는 두려움 없이 거래할 수 있다는 것입니다. 추세가 자신에게 유리한지 불리한지 판단하는 데 사용할 수 있는 또 다른 도구는 프랙탈입니다.

트레이딩과 체스의 세계 밖을 보면 손실을 가정하여 손실이 발생했을 때 냉정하게 대처할 수 있는 다른 비즈니스가 있습니다. 바로 카지노와 보험회사입니다. 이 두 비즈니스는 모두 손실을 가정하고 계산된 위험에 따라 움직이기 때문에 두려움 없이 운영되며, 작은 손실을 전략의 일부로 가정한다면 여러분도 그렇게 할 수 있습니다.

마크 더글라스의 또 다른 명언을 소개합니다:
"내가 틀렸는지 아닌지에 대한 걱정을 덜할수록 상황이 더 명확해져서 포지션에 들어오고 나가는 것이 훨씬 쉬워졌고, 손실을 줄여 다음 기회를 잡을 수 있는 정신적 여유를 가질 수 있었습니다." -마크 더글러스

행복한 트레이딩 되세요!

출처

Ayoub Ayoub | 19 4월 2025 에서 16:16

🤝

엑스퍼트 어드바이저 비주얼 마법사로 엑스퍼트 어드바이저 만들기

MetaTrader 5 의 엑스퍼트 어드바이저 비주얼 마법사는 매우 직관적인 그래픽 환경과 다양한 매매 블록을 제공하여 단 몇 분만에 엑스퍼트 어드바이저를 만들 수 있도록 도와줍니다. 클릭, 드래그 앤드 드롭만 할 줄 알면 종이에 그리는 것처럼 외환 거래 전략을 시각화할 수 있습니다. 이렇게 만들어진 매매 다이어그램은 몰라니스(Molanis) MQL5 코드 생성기로 자동 분석되며 즉시 사용 가능한 엑스퍼트 어드바이저로 완성됩니다. 인터랙티브 그래픽 환경 덕분에 MQL5 코드를 쓰지 않고 간단하게 디자인할 수 있죠.

판별 분석을 이용한 매매 시스템 구축

자동 매매 시스템을 만들다 보면 어떤 인디케이터와 어떤 신호가 가장 잘 맞을지 선택하기 어려울 때가 있습니다. 판별 분석은 인디케이터와 신호 간의 조합을 찾는 데에 도움이 되는 방법 중 하나인데요. 이 글은 시장 데이터 수집용 엑스퍼트 어드바이저 개발과 스타티스티카(Statistica)를 이용한 외환 시장(FOREX)용 예측 모델에 대한 판별 분석 적용법을 다룹니다.

트레이드미네이터 3: 라이즈 오브 더 트레이딩 머신

지난 글 '닥터 트레이드러브...'에서는 미리 선택된 매매 시스템의 매개 변수를 독자적으로 최적화할 수 있는 엑스퍼트 어드바이저를 만들었습니다. 게다가 한 가지 매매 시스템의 매개 변수를 최적화할뿐만 아니라 여러 매매 시스템 가운데 가장 좋은 시스템을 선택해 주는 엑스퍼트 어드바이저까지 만들기로 했죠. 어떻게 되나 봅시다.

인디케이터 및 통계적 매개 변수 분석하기

기술적 분석은 기본 시세 정보를 '보다 명확하게' 나타내는 인디케이터를 구현하여 투자자가 시장을 분석하고 가격 움직임을 예측할 수 있도록 해줍니다. 그러니 초기 시세 변동 및 획득 결과의 신뢰도와 관련된 문제를 해결할 수 없다면 인디케이터를 사용할 필요가 없겠죠. 당연히 매매 시스템에 적용할 필요도 없고요. 왜 그런지 자세히 알아보도록 하겠습니다.