기고글 토론 "차트 분석에 대한 계량학적 접근" - 페이지 10

 
denkir:

이를 위해 "클래스" 또는 "간격"이라는 개념을 사용한다는 것을 이해합니다.

faa1947, 귀하의 그림에서 분포가 단일 모달이 아닌 것을 볼 수 있습니다. 그것은 또 다른 문제입니다.

그런 다음 클래스 (랙)의 수도 일부 공식, 규칙에 의해 계산됩니다. 가장 유명한 것들은 다음과 같습니다:

스터지스 공식, 프리드먼-디아코니스 규칙, 스콧의 규칙, 제곱근 선택 등이 있습니다.

위의 제 게시물을 참조하세요 . 그래도 샘플의 길이부터 시작해야 하는데, 이는 TS에 대한 예측의 목적에 따라 결정됩니다. 즉, 샘플 길이가 포즈 입력(포즈 종료)이 가능한지 아닌지에 대한 질문에 답하기에 충분한가? 대부분의 경우 샘플 길이는 중요하지 않으며(최대 100개) 위와 같은 환상적인 분포는 사라질 것입니다.
 
-Alexey-:

덴키르 :

할 수 있다고 생각합니다. 표본의 통계적 매개 변수(특히 분포 매개 변수)에 어떤 식으로든 영향을 미치지 않아야 합니다. 그렇기 때문에 이상치입니다.

위 진술의 근거는 무엇인가요? (그런데 매개 변수에 영향을 미치기는 하지만 이것이 제거되는 이유는 아닙니다).

표본 크기가 이상값의 영향을 받지 않을 만큼 충분히 크다는 것을 근거로 합니다. 이것이 제가 큰 표본 크기를 선호하는 이유 중 하나입니다. 그런 다음 동료 faa1947이 제가 착각하지 않았다면 이상값은 이상값과 같지 않다고 말했습니다. 예를 들어 샘플에서 1.20-1.50 범위 내에서 유로화 환율이 변동했는데 서버 오류로 인해 15.77 달러의 값이 반환된 경우 이러한 이상값은 샘플의 모든 통계적 매개 변수를 엉망으로 만들 수 있다는 것이 분명합니다 .


-알렉시-:

정규 분포는 계열의 특성을 특징짓는 반면, 비고정 분포는 정의상 계열의 특성이 변하는 분포입니다.

그런데 진분포와 고정성 사이에는 어떤 연관성이 있을까요? 저는 그런 연관성을 본 적이 없다고 고백합니다. 비밀이 아니라면 어디에서 얻었습니까? ;-)


 
faa1947:
См. мой пост выше -Alexey. Все-таки надо начинать с длины выборка, которая определяется целью прогноза для ТС. Т.е.: достаточна ли длина выборки для ответа на вопрос: можно входить  в позу (выходить из позы) или нельзя? Скорее всего длина выборки будет не значительной (до сотни) и исчезнут фантастические распределения, подобные выше приведенному.

여기에 문제가 있습니다. 샘플 크기를 줄이면 변동성 클러스터링과 같은 현상을 놓칠 수 있습니다. 그러면 비선형 모델을 사용할 필요가 없습니다. 따라서 선형 모델을 사용할 수 있습니다. 그리고 이것은 금융 계열의 특성인 파생상품(행렬 분석의 파생상품과 혼동하지 마세요)을 반영하지 않습니다.

바이모달 분포를 얻은 근거가 되는 데이터는 무엇인가요? 해당 데이터가 포함된 파일을 업로드해 주시겠어요?

 
denkir:

여기에 문제가 있습니다. 샘플 크기를 줄이면 변동성 클러스터링과 같은 현상을 놓칠 수 있습니다. 그러면 비선형 모델을 사용할 필요가 없습니다. 따라서 선형 모델을 사용할 수 있습니다. 그리고 이것은 금융 계열의 특성인 파생상품(행렬 분석의 파생상품과 혼동하지 마세요)을 반영하지 않습니다.

우리가 시스템 접근 방식을 공언한다면, 우리는 목표에서 포즈에 대한 진입 / 출구로 춤을 추어야합니다. 건조 잔류물의 지수는 어떻게 될까요? 제한된 샘플을 가져온다면 변동성이나 비정형성을 전혀 가질 필요가 없겠죠? 모델을 선택해야 합니다. ARMA(ARIMA도 아님)가 널리 사용됩니다. 우리는 특정 모델을 적용하려는 목표가 없습니다. 목표는 합리적인 수준의 신뢰 한계로 예측을 얻는 것입니다. 예를 들어 100, 500, 1000개의 캔들스틱에 대한 예측을 계산하는 것만으로도 흥미롭습니다. 어쩌면 우리는 무언가를 보게 될 것입니다.

바이모달 분포를 얻은 데이터의 근거가 되는 데이터는 무엇인가요? 데이터가 포함된 파일을 업로드해 주시겠습니까?

1999/01/04부터 2011/01/13까지 EURUSD D1, 터미널에서 가져온 3063개의 캔들스틱입니다.

 
denkir:

표본이 이상값에 반응하지 않을 만큼 충분히 크다는 것을 근거로 합니다. 이것이 제가 큰 표본 크기를 선호하는 이유 중 하나입니다. 그런 다음 제 동료 faa1947은 제가 착각하지 않았다면 이상값은 이상값과 같지 않다고 말했습니다. 예를 들어 샘플에서 유로화 환율이 1.20-1.50 범위 내에서 변동한 후 서버 오류가 발생하여 15.77 달러의 값이 반환되면 이러한 이상값이 샘플의 모든 통계적 매개 변수를 엉망으로 만들 것입니다 .


하지만 실제 분포와 정규성 사이의 연관성은 무엇일까요? 저는 그런 연관성을 본 적이 없다고 고백합니다. 비밀이 아니라면 어디에서 얻었습니까? ;-)


마지막 페이지에서 교과서에서 인용 한 내용으로 답변했습니다. 명확하지 않은 경우 더 자세히 설명하겠습니다:

일반 모집단의 개념은 특정 조건 집합에 의해 완전히 조건화되기 때문에 어떤 의미에서 무작위 변수 (확률 분포 법칙, 확률 공간)의 개념과 유사합니다.

특정 조건 집합은 정지된 프로세스를 생성합니다. 정의되지 않은 경우 - 일반 인구가 없으며 각각 진정한 분포가 없습니다. 논리는 대략 이와 같습니다. 물론 제가 틀릴 수도 있지만요.

귀하의 답변에 따르면-답변이 잘못되었습니다. 그건 그렇고, 나는 당신이 위의 진술을 한 근거가되는 행렬에 대한 참조를보고 싶었습니다. 가지고 있지 않다면 (즉, 이상값이 제거되는 이유와 분포에 어떤 영향을 미치는지 모르는 경우) 이전에 저에게했던 것처럼 자료를 배우는 것이 좋습니다. 큰 이상 값으로 모든 것이 명확하고이를 확인해야한다는 점에 유의하는 것이 옳지 만 (이러한 확인은 따옴표의 차이를 감지 할 수 있음) 문제는 그것에 관한 것이 아니라 3-4-5 시그마에 관한 것입니다. 또한 제거해야하는지 여부에 대한 질문을 건드리지 않더라도 제거 방법론 (적어도 위에서 언급 한 책에 따르면 모든 것을 말하지는 않지만)은 내가 생각하는 것처럼 매우 크고 긴 작업이며 매우 복잡하다는 것도 흥미 롭습니다.

 
-Alexey-:

특정 조건 세트는 고정된 프로세스를 생성합니다. 불확실한 경우 일반 모집단이 존재하지 않으므로 실제 분포가 존재하지 않습니다. 논리는 대략 이와 같습니다. 물론 제가 틀릴 수도 있습니다.

위키백과에 따르면 일반 모집단은 연구자가 분석을 위해 선택한 값의 집합입니다. 연구자는 '고정성'과 같이 모호한 규칙을 포함하여 모든 규칙에 따라 일반 모집단으로 표본을 추출할 수 있습니다. 예를 들어 '루블로 유로를 구매하는 모든 거래'와 같이 통계의 개념을 벗어난 규칙이 선택되는 것은 정상입니다. 거래는 우리가 대략적으로만 알고 있는 어떤 경제 프로세스에 의해 생성되며 거래의 수를 알 수 없습니다. 이 두 가지 상황으로 인해 우리는 비고정성을 통화 시세의 주요 특징으로 간주하고 나머지는 모두 그 신호입니다.

큰 이상값으로 모든 것이 명확하고 이에 대한 확인이 있어야한다는 것을 올바르게 지적했지만 (이러한 확인은 따옴표의 차이를 감지 할 수 있음) 연설 (및 질문)은 그들에 관한 것이 아니라 약 3-4-5 시그마에 관한 것입니다.

또한 유로-달러 쌍의 D1 시세 히스토그램을 100개의 캔들 스틱으로 가져옵니다.

다음은 샘플의 설명 통계입니다.

또한 종가 값 중 하나는 3 시그마, 5 시그마 및 5 평균으로 일관되게 변경되었습니다.

보입니다:

1. 사방에 왼손 꼬리가 있습니다.

2. 모든 곳에서 캔들 스틱 100개당 20개의 간격이 지정되어 있지만 히스토그램 열의 수가 변경됩니다.

3. 정규법칙에 대한 적합도의 p-값과 그에 따라 적합도의 신뢰 범위가 변경됩니다.

 
faa1947:
위키백과에 따르면 모집단이란 연구자가 분석을 위해 선택한 값의 집합입니다. 연구자는 "고정성"과 같은 모호한 규칙을 포함하여 모든 규칙에 따라 일반 모집단을 선택할 수 있습니다. 예를 들어 '루블로 유로를 구매하는 모든 거래'와 같이 통계의 개념을 벗어난 규칙이 선택되는 것은 정상입니다. 거래는 우리가 대략적으로만 알고 있는 어떤 경제 프로세스에 의해 생성되며 거래의 수를 알 수 없습니다. 이 두 가지 상황으로 인해 우리는 통화 시세의 주요 특징을 비 고정성으로 간주하고 다른 모든 것은 그 신호입니다.

그 중 절반은 틀렸고 나머지 절반은 과소 평가되고 일부는 정확합니다. 그렇기 때문에 전문 문헌으로 위키를 확인하고 교육부 및 그 모든 것에서 권장하는 것이 바람직합니다. 나중에 통계 백과 사전에서 정의를 작성하겠습니다. 완전히 헷갈리신 것 같습니다.

모집단은 연구자가 분석을 위해 선택한 값의 집합입니다.

이는 기존의 모든 데이터가 선택되었고 다른 데이터가 없는 것으로 알려진 경우에만 해당됩니다. 그렇지 않고 양초 10개를 가져온다면 이는 일반 모집단이 아니라 표본 모집단입니다. 예를 들어, 기계의 작업을 측정할 때 내일 새로운 데이터가 있을 것이라는 것을 알 수 있지만 일반 모집단은 존재하지 않습니다. 일반 모집단은 그것(표본)에 의해 평가됩니다 - 추정, 샘플링에 대해 읽어보세요. 그리고 추정 할 때 일반 법칙에 맞지 않지만 (그런 것으로 알려지지 않은 경우) 법칙은 특별한 방법으로 식별되며 알 수없는 동안 어떻게 제거 할 수 있는지 (책에 대한 링크를 제공했습니다-그것에 대해 기록되어 있습니다). 그리고 그것은 하나의 샘플이 아니라 여러 샘플에 의해 추가로 평가되고 특수 테스트가 비교됩니다.
 
-Alexey-:

그 중 절반은 틀렸고 나머지 절반은 과소 평가되었으며 일부는 정확합니다. 따라서 전문 문헌으로 위키를 확인하고 교육부 등에서 권장하는 모든 것을 확인하는 것이 바람직합니다. 나중에 통계 백과 사전에서 정의를 작성하겠습니다. 완전히 헷갈리신 것 같습니다.

이것은 기존의 모든 데이터를 가져 와서 다른 데이터가 없다는 것이 알려진 경우에만 해당됩니다. 그렇지 않고 양초 10개를 가져온다면 그것은 일반 모집단이 아니라 표본 모집단입니다. 예를 들어, 기계의 작업을 측정할 때 내일 새로운 데이터가 있을 것이라는 것은 알려져 있지만 일반 모집단은 존재하지 않습니다. 일반 모집단은 그것(샘플)에 대해 평가됩니다 - 평가에 대해 읽어보세요. 그리고 추정 할 때 그것은 일반 법칙에 맞지 않지만 (그것이 그런 것으로 알려지지 않은 경우) 법칙은 특별한 방법으로 식별되며, 알 수없는 동안 어떻게 제거 할 수 있는지 (책에 대한 링크를 제공했습니다-그것에 대해 기록되어 있습니다). 그리고 그것은 하나의 샘플이 아니라 여러 샘플에 의해 추가로 평가되고 특수 테스트가 비교됩니다.

불행히도, 당신은 내 게시물의 의미를 이해하려고 노력하지 않고 문맥에서 별도의 문구를 제거 할 수있었습니다. 다시 한 번 말씀드립니다. 외환에서 일반 모집단을 선택하는 규칙은 우리에게 알려지지 않은 모든 거래입니다. 나는 위키에서와 같이 백과 사전의 정의에 관심이 없습니다. 나는 일반 인구의 통계적 특성이 아닌 예측에 관심이 있습니다. 당신의 압력으로 나는 거의 식물 음행에 빠질 뻔했고 심지어 "일반 인구"의 정의를보기 위해 통계 패키지로 갔다 : 세계적으로 유명한 패키지는이 개념을 고려하지 않습니다.

배출량 정리. 배출이 적합도에 미치는 영향에 대한 구체적인 내용을 자세히 살펴보십시오. 배출을 제거하지 않으면 잘못된 적합도를 얻을 수 있으며, 이것이 바로 요점이며 매우 좋은 특성을 가지고 있을 가능성이 높습니다. 이상값을 변경하면 샘플에서 하나 또는 두 개의 값 때문에 법칙의 매개 변수나 법칙이 변경됩니다. 피팅 후에는 데이터를 정리할 필요가 없습니다.

그래도 교과서를 읽는 것이 매우 바람직하며, 수리 통계학이 아닌 계량 경제학에 관한 매트릭스 패키지에 대한 더 나은 설명서를 읽는 것이 이해를 높이는 데 도움이 될 것입니다. 모든 계량경제학 패키지는 분석을 위한 데이터 준비부터 시작하며, 그 반대의 경우는 피팅을 먼저 한 다음 데이터를 준비하는 것이 아닙니다.

 
그럼 이만 가보겠습니다. 모든 패키지는 도구일 뿐 그 이상은 아닙니다. 우리는 다른 언어를 사용하는 것 같습니다 :) 독자들이 오해하지 않기를 바랐을 뿐인데, 꼭 필요한 분들은 이해해 주셨으면 좋겠습니다.
 
-Alexey-:
. :) 독자들이 오해하지 않기를 바랐지만 필요한 분들은 알아주셨으면 좋겠습니다.

그럼 이만 가보겠습니다.

올바른 결정이 아니라고 생각합니다.

모든 패키지는 도구일 뿐 그 이상은 아닙니다. 우리는 서로 다른 언어를 사용하는 것 같습니다.

패키지에 대한 조언을 드리게 되어 죄송합니다. 논문이나 논문과 같은 이론적 논증에서는 여러분의 접근 방식이 저보다 훨씬 타당하고 바람직합니다. 그러나 우리에게는 실용적인 문제가 있으며 패키지는 단순한 도구가 아니라 많은 개념이 함께 모여 실용적인 결과를 만들어내는 시스템입니다. 우리는 용어에 대한 명확한 해석뿐만 아니라 명확한 계산도 얻을 수 있습니다. 이 기사의 저자는 GARCH를 언급했는데, 이것은 "일반 인구"보다 훨씬 덜 모호한 매우 유연한 개념입니다.

앞으로도 이 주제에 많은 관심을 가져주시길 바랍니다.