기고글 토론 "트레이더의 통계 도우미: 가설들"

 

새로운 기고글 트레이더의 통계 도우미: 가설들 가 게재되었습니다:

이 문서에서는 수리통계학의 기초 중 하나인 가설에 대해 다뤄보겠습니다. 다양한 가설들은 실제 예시에 수리통계적 관점으로 접근해서 검토, 검증됩니다. 실제 데이터는 비모수적 방법을 사용하여 일반화됩니다. 데이터 처리에는 Statistica 패키지와 포팅된 ALGLIB MQL5 수리분석 라이브러리가 사용됩니다.

자신만의 매매 시스템을 만들고자 하는 트레이더라면 늦건 빠르건 언젠가는 애널리스트가 되기 마련입니다. 애널리스트가 되면 시장의 흐름을 분석하고 매매 아이디어를 테스트해보게 됩니다. 아이디어 테스트는 전략 테스터의 최적화 모드에서 최상의 패러미터 값에 대한 일반적인 검색으로부터, 과학적(때때로 의사 과학적인) 시장 조사에 이르기까지 다양한 접근 방식을 기반으로 시험해볼 수 있습니다.

이 문서에서는 연구 및 추론 검증을 위한 통계 분석 도구인 통계적 가설을 고려해보시길 추천드립니다. 이제부터 Statistica 패키지와 포팅된 수리분석 라이브러리 ALGLIB MQL5 를 이용하여 예제들을 분석하는 방법으로 다양한 가설을 검증해보겠습니다.

2. 가설 검증하기. 이론

검증 대상인 가설을 귀무 가설이라고 합니다 (Н0). 대립 가설 (Н1)은 그 대안이 되는 가설입니다. 이는 H0와 반대 편에 있는 가설과도 같습니다, 즉, 논리적으로 귀무 가설을 부정하는 가설입니다.

어떤 트레이딩 시스템에서 손절에 관한 데이터가 있다고 가정해보세요. 테스트용으로 두개의 가설을 만들어보겠습니다.

Н0 – 평균 손절값은 30 포인트이다.

Н1 – 평균 손절값은 30 포인트가 아니다.

각 가설을 받아들이고 기각하는 케이스는 다음과 같습니다.

  1. Н0은 참이고, 받아들여짐.
  2. Н0은 거짓이며, 기각되고 H1이 받아들여짐.
  3. Н0은 참이나 H1이 받아들여짐.
  4. Н0은 거짓이나 받아들여짐.

마지막 두 케이스는 오류로 이어집니다.

이제 유의 수준의 값이 설정됩니다. 유의 수준이란 귀무 가설이 참이지만 대립 가설이 받아들여질 가능성(세번째 케이스)의 확률입니다. 이 확률은 최소화시켜야합니다.

우리가 앞서 세운 예시를 가지고 들자면, 평균 손절값이 실제로는 30 포인트임에도 아니라고 가정하게 될 때에 해당합니다.

일반적으로 유의 구간 (α)은 0.05입니다. 이는 귀무가설의 시험 통계값 100 건 중 5 건 정도가 해당된다는 의미입니다.

시험 통계값은 차트 상에서 평가됩니다 (1번 그림).In our case the test statistic value will be evaluated on a classical chart (Fig.1).

1번 그림. 표준 확률 법칙에 의한 시험 통계값 분포

1번 그림. 표준 확률 법칙에 의한 시험 통계값 분포

작성자: Denis Kirichenko

 
  1. 거짓말에는 순진한 거짓말, 뻔뻔한 거짓말, 통계적 거짓말 세 가지가 있다 © 마크 트웨인
  2. "블리크의 역설: 여러 실험을 수행하고 각각의 실험에 대해 귀무가설의 확률을 계산합니다. 개별 실험의 모든 통계적 결과가 "성공적"이었지만, 즉 각각의 귀무가설이 p < n의 확률로 기각되었지만 메타 분석 후에는 반대 결과인 p > n을 얻게 됩니다.
  3. 특정 영역에 통계를 적용하기 전에 우리가 ergodic 환경을 다루고 있는지 확인해야합니다. 그렇지 않으면 영리한 얼굴을 가진 숫자 게임으로 판명 될 것입니다.
 
Reshetov:
  1. "블렉의 역설: 우리는 여러 실험을 수행하고 각각의 실험에 대한 귀무가설의 확률을 계산합니다. 개별 실험의 모든 통계적 결과가 "성공적"이었음에도 불구하고, 즉 각각의 실험에 대한 귀무가설이 p < n의 확률로 거부되었음에도 불구하고 메타 분석 후에는 p > n이라는 반대 결과를 얻게 됩니다.

이것은 흥미로운 역설입니다. 이에 대한 자세한 내용은 어디에서 확인할 수 있나요?

2. 특정 영역에 통계를 적용하기 전에 우리가 에르고딕 환경을 다루고 있는지 확인해야 합니다. 그렇지 않으면 우리는 영리한 얼굴로 숫자 게임을 할 것입니다.
인체공학적 환경이 무엇을 의미하는지 명확히 하세요.
 
denkir:

흥미로운 역설입니다. 이에 대한 자세한 내용은 어디에서 확인할 수 있나요?

인체공학적 환경이 무엇을 의미하는지 명확히 설명해 주세요.

귀하의 기사는 저에게 이중적인 인상을줍니다.

게다가. 이 포럼에서는 결과에 대한 가상의 평가에 대해 질문하는 행위 자체가 매우 중요합니다. 포럼은 마쉬카를 그리고 그 간격에 마쉬카가 아니라 이것이 사실이라고 가정하는 사람들로 가득 차 있습니다.

마이너스.

Reshetov에 전적으로 동의합니다. 당신이 말한 모든 것-이것은 고정 시리즈 또는 그에 가까운 시리즈, 즉 시간에 따른 모와 편차의 변화가 거의없는 시리즈를 의미합니다. 그러나 금융 시장에는 그러한 시리즈가 없으며 금융 시장에 대한 통계의 전체 적용은 시계열의 고정성을 중심으로 이루어집니다. 가장 유명한 예는 ARIMA, ARCH 등입니다.

그림 2에 히스토그램이 표시된 무작위 계열은 이 계열이 고정 계열과 관계가 약하고 왜곡되어 있으며 꼬리가 상당히 다르다는 것을 보여줍니다. 특히 사용자가 그린 완벽한 정상 곡선과 비교하면 더욱 잘 드러납니다. 따라서 귀하의 추론은 이 예시에는 전혀 적용되지 않습니다. 이 예시는 레셰토프의 생각을 보여주는 예시일 뿐입니다.

추신. 통계에서 가장 위험하고 비열한 개념은 상관 관계입니다. 전혀 언급하지 않는 것이 좋습니다.

 
faa1947:
...당신이 말한 모든 것 - 이것은 고정 시리즈 또는 그에 가까운 시리즈, 즉 시간에 따른 모수와 분산 변화가 거의없는 시리즈를 의미합니다. 그리고 금융 시장에는 그러한 시리즈가 없으며 금융 시장에 대한 통계의 전체 적용은 시계열의 고정성을 중심으로 이루어집니다. 가장 유명한 예는 ARIMA, ARCH 등입니다.

그림 2에 히스토그램이 표시된 무작위 계열은 이 계열이 고정 계열과 관계가 약하고 왜곡되어 있으며 꼬리가 상당히 다르다는 것을 보여줍니다. 특히 사용자가 그린 완벽한 정상 곡선과 비교하면 더욱 잘 드러납니다. 따라서 귀하의 추론은 이 예시에는 전혀 적용되지 않습니다. 이 그림은 레셰토프의 생각을 보여주는 예시입니다.

의견 주셔서 감사합니다!

제 반론을 제시하겠습니다.

고정성은 시계열의 특징입니다. 그림 2는 변동 계열입니다. 이 기사에서는 시계열에 대해 이야기하지 않습니다! 시간이 유용한 특성이라는 데 동의하지만.....

내가 이해하는 한, 등방성은 연구중인 시스템의 특정 안정성을 의미합니다....

그래서 중요한 점에 주목하고 싶습니다. 금융 시계열에 대해 이야기하자면 시스템이 고정되어 있지 않더라도 계량 경제학을 사용하여 모델의 동작을 설명하는 안정적인 모델 (예 : GARCH)을 찾을 수 있습니다. 그리고 여기서 저는 시스템의 불변성-모델에 따른 동작을 볼 수 있습니다.... 하지만 시스템이 모델을 "깨뜨릴"확률이 있다는 조건이 있습니다...

 
denkir:

의견을 보내주셔서 감사합니다!

제 반론은 다음과 같습니다.

고정성은 시계열의 특징입니다. 그림 2는 변동 시리즈입니다. 이 기사에서는 시계열에 대해 이야기하지 않습니다! 시간이 유용한 특성이라는 데 동의하지만.....

내가 이해하는 한, 등방성은 연구중인 시스템의 특정 안정성을 의미합니다....

그래서 중요한 점에 주목하고 싶습니다. 금융 시계열에 대해 이야기하자면 시스템이 고정되어 있지 않더라도 계량 경제학을 사용하여 모델의 동작을 설명하는 안정적인 모델 (예 : GARCH)을 찾을 수 있습니다. 그리고 여기서 저는 시스템의 불변성-모델에 따른 동작을 볼 수 있습니다.... 하지만 시스템이 모델을 "깨뜨릴" 확률이 있다는 조건이 있습니다.....

몇 년 전, 저는 대부분의 사람들이 완전히 받아 들일 수없는 한 가지 아이디어를 입증하는 기사를 사이트에 게시했습니다. 즉.

많은 지표가 있습니다. 모든 사람들은 지표가 그려지면 동일하다고 생각합니다. 결국 우리는 바로 이것을 봅니다. 동시에, 우리가 현실에서 보는 것이 존재하지 않을 수 있다는 것은 대부분의 사람들에게 발생하지 않습니다! 그 이유는 진부합니다. 지표에 해당하는 회귀를 취하면 일부 계수의 신뢰 구간이 너무 넓어서 그러한 계수의 값에 대해 전혀 말할 수 없으며 그러한 결함 계수를 버리면 지표 패턴이 완전히 달라진다는 것이 쉽게 드러날 수 있습니다. 그들이 말할 때 : 진실이 있고, 거짓이 있고, 통계가 있다는 것은이 슬프고 매우 익숙하지 않은 상황을 의미합니다. 신뢰 구간을 포함하여 아무것도 신뢰할 수 없습니다.

그래서 저는 파라메트릭 모델을 떠나 머신러닝 기반 모델에 참여하게 되었습니다. 거기에는 고정성에는 문제가 없지만 과잉 훈련의 문제가 완전히 영광입니다.

 

그리고 저는 그 기사가 마음에 들었습니다.

예, 비교 시스템 (또는 시스템)이 매개 변수를 변경하면 테스트 결과가 쓸모가 없습니다.

그러나 방법 적용의 데모는 매우 기쁩니다. Forex에서는 드문 일입니다!

나는 견적 가격에 대해 비슷한 방법을 정확하게 적용하는 사람으로서 다른 것을 말하고 싶습니다. 환경이 균질한지 (두 개의 독립된 대형 샘플에서) 미리 확인한 다음 가설 테스트 결과를 어느 정도 침착하게 신뢰할 수 있습니다. 이는 동일한 테스트를 통해서도 가능합니다.