기고글 토론 "통계적 추정"

 

새로운 기고글 통계적 추정 가 게재되었습니다:

대부분의 수학적 모델과 방법은 서로 다른 가정을 기반으로 하기 때문에 시퀀스의 통계적 모수 추정은 매우 중요합니다. 예를 들어 분포 법칙의 정규성이나 분산 값 또는 기타 모수가 있습니다. 따라서 시계열 분석 및 예측 시 주요 통계 모수를 빠르고 명확하게 추정할 수 있는 간단하고 편리한 도구가 필요합니다. 이 문서는 랜덤 시퀀스의 가장 간단한 통계적 모수와 시각적 분석의 여러 메소드에 대해 설명할 것입니다. MQL5에서는 이러한 방법의 구현과 Gnuplot 애플리케이션을 사용한 계산 결과의 시각화 메소드를 제공합니다.

이제 erremove.mq5 스크립트를 시작하면 그림 2에 표시된 그래프가 별도의 창에 그려집니다.

erremove.mq5

 

작성자: Victor

 
Для тех, кто серьезно занимался (-ется) анализом совместного движения фин. инструментов (> 2-х) - MQL4 форум
  • www.mql5.com
Для тех, кто серьезно занимался (-ется) анализом совместного движения фин. инструментов (> 2-х) - MQL4 форум
 

"이상값 제거하기.


통계 매개변수 추정을 진행하기 전에 표본에 총오차(이상값)가 포함되어 있으면 추정치의 정확도가 충분하지 않을 수 있다는 점에 유의해야 합니다. 이상값이 추정치의 정확도에 미치는 영향은 표본 크기가 작을 때 특히 강합니다. 이상값은 분포의 중심에서 비정상적으로 벗어난 값을 말합니다. 이러한 편차는 통계 수집 및 시퀀스 생성 과정에서 발생한 다양한 종류의 예상치 못한 사건과 오류로 인해 발생할 수 있습니다.

대부분의 경우 주어진 값이 이상값인지 또는 고려 중인 프로세스에 속하는지를 명확하게 판단하는 것이 불가능하기 때문에 이상값을 필터링할지 여부를 결정하는 것은 다소 어렵습니다. 이상값이 감지되어 필터링하기로 결정한 경우, 이러한 잘못된 값을 어떻게 처리해야 할까 하는 문제가 발생합니다. 가장 논리적인 방법은 단순히 표본에서 제외하는 것이며, 일반 모집단의 통계적 특성 추정의 정확도는 높아질 수 있지만 시간 시퀀스를 다룰 때는 시퀀스에서 표본을 제외하는 데 주의해야 한다는 점을 잊지 말아야 합니다."라고 설명합니다.

아예 하지 않는 것이 좋습니다.

예, 모든 데이터는 유효성을 검사해야 하며, 유효성 검사는 자동화되어야 합니다.

하지만 원본 데이터를 수동으로 또는 자동으로 조작하는 것보다 데이터 소스를 폐기하는 것이 더 낫습니다.

실생활에서 '가능성이 낮다'는 이유로 큰 위험을 받아들이거나 배제하는 것은 많은 비극과 재난의 원인입니다.

 

빅터, 이런 종류의 질문입니다.

첨도가 1보다 작을 수 있다고 생각하시나요?

그렇다면

gs=(1.55+0.8*MathLog10((double)n/10.0)*MathSqrt(kurt-1))*MathSqrt(sum2/(n-1));

-1과 같을 것입니다. :-)

좋은 글입니다!

 
denkir:

빅터, 이런 종류의 질문입니다.

첨도가 1보다 작을 수 있다고 생각하시나요?

그렇다면

-1과 같을 것입니다. :-)

좋은 글입니다!


대부분의 경우 이론적으로 첨도는 1보다 작을 수 없습니다. 아마도 직선 샘플로 구성된 시퀀스의 경우 1과 같은 값을 얻을 수 있을 것입니다. 예를 들어 1,2,3,4,5입니다.

오류로 인해 기사에서 사용된 알고리즘이 1보다 작은 값을 제공할 수 있는지 여부는 모르겠습니다. 기사 말미에 계수 계산 알고리즘의 동작이 조사되지 않았다고 언급되어 있습니다.

 

실제로 편향되지 않은 추정치를 계산할 때 첨도는 1보다 작은 값을 취할 수 있습니다. 예를 들어 입력 시퀀스 4,7,13,16의 경우입니다.

지적해 주셔서 감사합니다. 수정하겠습니다.

 
수정이 완료되었습니다.