기고글 토론 "차트 분석에 대한 계량학적 접근" - 페이지 7

[삭제]  
faa1947:

브라보! 많은 문제를 다룬 훌륭한 글입니다. 하지만 비판받을 수 있는 부분도 있습니다. 예를 들어, 어떤 기준으로 이상값을 제거해야 한다고 결정하셨나요? 이상값은 제거해서는 안 됩니다.
 
-Alexey-:
브라보! 많은 문제를 다룬 훌륭한 글입니다. 하지만 비판받을 수 있는 부분도 있습니다. 예를 들어, 어떤 기준으로 이상값을 제거해야 한다고 결정하셨나요? 제거할 수 없습니다.
이상값은 이상값과 동일하지 않습니다. 따옴표를 살펴봐야 합니다. 이상값이 비교적 드문 경우라면 삭제가 아니라 임계값으로 잘라내야 합니다. 그렇지 않은 경우 어떻게 해야 할지 명확하지 않습니다. 원칙적으로 이상값은 통계를 크게 왜곡합니다. 모든 통계 패키지는 이러한 가능성에 대비하여 적절한 권장 사항을 제공합니다.
[삭제]  
faa1947:
이상값은 이상값이 아닙니다. 따옴표를 살펴봐야 합니다. 이상값이 비교적 드물게 발생하는 경우 임계값으로 트리밍해야 합니다(삭제하지 않음). 그렇지 않은 경우 어떻게 해야 할지 명확하지 않습니다. 원칙적으로 이상값은 통계를 크게 왜곡합니다. 모든 통계 패키지는 이러한 가능성을 고려하고 적절한 권장 사항을 제공합니다.

제가 아는 한, 이상값은 측정 결과가 적어도 어떤 법칙에 의해 통합된다는 것이 미리 알려진 경우, 즉 측정 값을 생성하는 프로세스가 비무작위 또는 무작위 고정되어 있고 이상값이 무작위성(비무작위 또는 고정성의 한계를 초과)에 의해 발생할 수 있으며 이 경우 이러한 무작위성은 왜곡입니다. 우리가 일련의 가격을 다루고 고정되지 않은 경우 모든 수준의 무작위성은 통계의 일부이며 (비 무작위 부분 외에 분리하기는 어렵지만) 통계의 일부를 제거하는 것은 각각 통계의 왜곡입니다. 나는 무작위 비 고정 프로세스로 작업 할 때 무언가를 제거 (절단)할 권리가 없다는 생각에 더 가깝습니다. 그건 그렇고, 예를 들어 트리밍의 궁극적 인 목표가 무엇이라고 생각하는지 대답하지 않았습니다. 통계 패키지는 아마도 정적 계열로 작업하는 것을 목표로 할 것이며, 이 경우 비정상적인 값을 트리밍하라는 권장 사항이 유효합니다.

그렇지 않은 경우에는 어떻게 해야 할지 명확하지 않습니다.

무슨 뜻인가요?
 
-Alexey-:

제가 아는 한 이상값은 결과가 적어도 어떤 법칙에 의해 통일되어 있다는 것을 미리 알고있을 때, 즉 측정 값을 생성하는 프로세스가 비 무작위 또는 무작위 고정되어있을 때 측정 할 때 제거되며, 이상값은 임의성 (비 임의성 또는 고정성의 한계를 초과)에 의해 발생할 수 있으며이 경우 이러한 임의성은 왜곡입니다. 우리가 일련의 가격을 다루고 고정되지 않은 경우 모든 수준의 무작위성은 통계의 일부이며 (비 무작위 부분 외에 분리하기는 어렵지만) 통계의 일부를 제거하는 것은 각각 통계의 왜곡입니다. 나는 무작위 비 고정 프로세스로 작업 할 때 무언가를 제거 (절단)할 권리가 없다는 생각에 더 가깝습니다. 그건 그렇고, 예를 들어 트리밍의 궁극적 인 목표가 무엇이라고 생각하는지 대답하지 않았습니다. 통계 패키지는 아마도 고정 계열로 작업하는 것을 목표로 할 것이며, 이 경우 비정상적인 값을 트리밍하는 권장 사항이 유효합니다.

무슨 뜻인가요?

ARIMA 모델조차도 고정되지 않은 계열을 고정된 형태로 축소하여 처리합니다.

따옴표를 자르는 문제에는 표면과 심층이라는 두 가지 층이 있는 것 같습니다.

예를 들어 표면적으로는 시장의 비고정성과는 무관한 스탑을 무너뜨리는 문제가 있습니다.

수학적 통계와 계량경제학을 적용할 때의 더 깊은 문제는 초기 데이터, 중간 결과, 결론을 모두 수학적이지 않은 직관적인 방법으로 확인해야 한다는 것입니다. 컷오프 임계값(2, 3, 4 시그마 또는 기타)의 선택은 그래프를 눈으로 확인한 후에만 가능하며 신뢰 구간을 선택하는 문제를 말합니다. 수리통계학을 적용할 때 가장 큰 문제는 통계학자의 기술 없이는 그 적용을 생각할 수 없다는 것입니다. 아무도 "잘라내지 마라"라는 규칙을 공식화하지 않습니다. 잘라내면 비고정성의 특성이 제거되고, 잘라내지 않으면 샘플링에 실패하여 일반 인구의 실제 분포가 왜곡됩니다.

계량경제학의 핵심은 가설 검정이며, 여기서 첫 번째와 두 번째 종류의 오류, 즉 잘못된 대안 가설을 선호하여 올바른 귀무 가설을 거부하고 잘못된 귀무 가설을 선호하여 올바른 대안 가설을 거부하는 오류를 범할 수 있습니다.

위의 내용을 감안할 때 저는 귀하의 의견에 동의함과 동시에 동의하지 않을 수 있습니다. 특정 표본을 미리 고려하지 않고는 귀하의 질문에 명확하게 답변할 수 없습니다.

[삭제]  

Даже модель ARIMA работает с нестационарными рядами путем приведения их к стационарному виду.

그리고 그 이후에도 모델 주문은 시간이 지남에 따라 변경될 수 있습니다. 결론 - 고정되지 않은 데이터 계열이 어느 시점에서 고정된 계열로 작동하도록 설계된 모델(방법)에 장착되었습니다. 그렇기 때문에 추적을 얼마나 자주, 얼마나 오래 수행해야 하는지 조사할 필요가 있습니다. 그것 없이는 - 부적절한 모델을 어떻게 사용합니까?

절단하지 않았습니다-실패한 샘플로 인해 일반 인구의 실제 분포를 왜곡했습니다.

여기서 추론이 잘못되었다고 생각합니다. 비고정 계열에는 일반 모집단이 없으며, 그렇지 않으면 고정 계열입니다. 그리고 그렇기 때문에 진정한 분포가 없습니다.

녹다운에 대해-그것인지 아닌지 어떻게 알 수 있습니까? 물론 강한 수준에 가까운 여러 DC의 데이터, 심지어 둥근 데이터를 분석하고 그중 일부가 정지를 무너 뜨린 것을 확인하면 (기준을 도입해야 함), 나는 당신과 동의하며 절단에 대한 준 객관적인 근거가 나타납니다. 그러나-이것을 확립하는 것은 전체 작업, 큰 연구입니다.

수학적 통계와 계량 경제학을 적용하는 더 깊은 문제는 초기 데이터, 중간 결과 및 결론을 모두 수학적이지 않은 직관적 인 방법으로 확인해야한다는 것입니다. 컷오프 임계값(2, 3, 4 시그마 또는 기타)의 선택은 그래프를 눈으로 확인한 후에만 가능하며 신뢰 구간을 선택하는 문제와 관련이 있습니다. 수리통계학 적용의 가장 큰 문제점은 통계학자의 기술 없이는 그 적용을 생각할 수 없다는 것입니다.

저는 그렇게 부르지 않습니다. 통계학자의 기술 또는 훈련 정도는 고정 계열과 관련하여 고정 계열로 작업하는 방법의 적용 가능성의 한계를 비 고정 계열과 관련하여 추정 할 수있는 방법에 따라 결정됩니다. 그러나 직관적으로 추정하는 것이 아니라 여전히 정량적으로 (수치적으로) 추정합니다.
 
-Alexey-:

그리고 그 후에도 모델 주문은 시간이 지남에 따라 변경될 수 있습니다. 결론 - 일부 사이트에서 고정 계열로 작동하도록 설계된 모델(방법)에 비고정 데이터 계열을 적용했습니다.

TA의 표준 추론: 비고정 계열은 서로 다른 특성을 가진 정지된 부분의 합입니다. Matlab의 도구 상자를 사용하면이 문제는 전혀 고려되지 않습니다. BP가 정규 분포와 몇 가지 차이점이 있다고 간주 한 다음 이러한 편차와 싸우는 것으로 간주됩니다. 그들 모두가 처리되는 것은 아닙니다.

이것이 사실이기 때문에 추격의 빈도, 작동 시간을 어떻게 든 조사 할 필요가 있습니다. 그것없이-어떻게 부적절한 모델을 사용합니까?

그런 문제는 없습니다. 예측에는 한 발 앞 (다음 캔들)과 여러 발 앞의 두 가지 종류가 있습니다.

여기서는 추론이 잘못되었다고 생각합니다. 비고정 계열에는 일반 모집단이 없으며, 그렇지 않으면 이미 고정 계열입니다. 그리고 그렇기 때문에 진정한 분포가 없습니다.

저는 원칙적으로 동의하지 않습니다. 고정성은 모집단의 크기가 아니라 계열의 특성입니다.

정류장을 쓰러뜨리는 것에 대해-그것인지 아닌지 어떻게 알 수 있습니까? 물론 여러 DC의 데이터, 거의 강한 수준, 심지어 둥근 수준의 데이터를 분석하고 그중 일부가 정지를 날려 버린 것을 확인하면 (기준을 도입해야 함), 나는 당신과 동의하며, 절단에 대한 준 객관적인 근거가 나타납니다. 그러나 이것을 확립하려면 전체 작업, 많은 연구가 필요합니다.

정류장을 무너 뜨리는 것은 단지 예일뿐입니다. 따옴표를 검토할 때는 어떤 것을 따옴표로 채택할지, 어떤 것을 알 수 없는 이유로 탈락시킬지 결정해야 합니다.

저는 그렇게 부르지 않습니다. 통계학자의 기술 또는 훈련 정도는 고정 계열과 관련하여 고정 계열로 작업하는 방법의 적용 가능성의 한계를 비고정 계열과 관련하여 어떻게 추정할 수 있는지에 따라 결정됩니다. 그러나 직관적으로 추정하는 것이 아니라 여전히 정량적으로 (수치 적으로) 추정합니다.

나는 동의하지 않습니다. 고정 시리즈에 완전히 가져 오는 것은 불가능합니다. 그것이 가설 정의의 오류에서 비롯된 곳입니다.


[삭제]  
faa1947:

TA의 표준 추론: 비정적 급수는 서로 다른 특성을 가진 정지된 부분의 합입니다.

이 추론에 대한 근거가 있나요? 결국, 언급 된 합계에 의해 얻은 시리즈는 우연히 그것없이 얻을 수 있으며 다른 법칙을 가진 다른 세그먼트의 다른 합계에 의해 얻을 수 있습니다. 그리고 그것이 그렇기 때문에-그렇다면 어떻게 (무엇이 사실입니까)?

우리가 Matlab의 도구 상자를 가져 가면이 문제는 전혀 고려되지 않습니다 : BP가 정상 분포와 몇 가지 차이점이 있고 이러한 편차로 더 많은 투쟁을하는 것으로 간주됩니다.

이것은 무엇을 근거로 고려되나요?

이 문제는 없습니다. 예측에는 한 발 앞(다음 캔들)과 여러 발 앞의 두 가지 종류가 있습니다.

매개변수가 다른 모델이 다음 단계에서 더 최적일 수 있다는 사실과 어떤 관련이 있나요?

저는 원칙적으로 동의하지 않습니다. 고정성은 모집단의 크기가 아니라 계열의 특성입니다.

이에 대해 명확하지 않은데 무슨 뜻인지 더 자세히 설명해 주시겠습니까? 정규 분포는 계열의 특성을 특징짓는 반면, 비정규 분포는 정의상 계열이 변화하는 분포입니다. 따라서 일반 모집단에 속하는 진정한 분포는 존재하지 않습니다. 정규분포는 주어진 순간에, 그리고 한정된 수의 캔들스틱에 대해 단 하나만 존재합니다.

스톱을 무너뜨리는 것은 한 예일 뿐입니다. 시세를 검토할 때 우리는 시세로 취할 것과 알 수 없는 이유로 탈락할 것을 결정해야 합니다.

이유를 알 수 없는 경우 어떤 기준으로 결정할 수 있을까요?

저는 동의하지 않습니다. 고정 계열로 축소하는 것은 완전히 불가능합니다. 따라서 가설을 정의하는 데 오류가 있습니다.

이제 저는 원칙적으로 동의하지 않습니다. 문구 자체에 동의하지 않습니다. 특성이 무작위로 변하는 시리즈를 어떻게 고정적으로 만들 수 있습니까? 즉,이 접근 방식은 어떤 것에 근거하지 않는데 어떤 가설에 대해 이야기 할 수 있습니까?
 
-Alexey-:

이 추론에 대한 근거가 있나요? 결국 언급 된 합계에 의해 얻은 시리즈는 우연히 그것없이 얻을 수 있으며 다른 법칙을 가진 다른 플롯의 다른 합계에 의해 얻을 수 있습니다. 그리고 이것이 사실이기 때문에-그것은 무엇입니까 (사실입니까)?

내 게시물에서 나는 그것에 대한 근거가 없다고 주장했습니다. TA에서는 다른 방법이 없습니다.

어떤 근거로 그렇게 생각하시나요?

그것은 제 의견이 아니라 모든 수학 통계학의 기반이 되는 것입니다.

다음 단계에서는 다른 매개변수를 가진 모델이 더 최적일 수 있다는 사실과 무슨 관련이 있나요?

"최적"이라는 것은 존재하지 않습니다. 어느 정도의 신뢰도를 가진 적합도가 있거나 그렇지 않을 수 있습니다. 적합성이 있음 - 예측이 있음

이 부분이 명확하지 않은데 무슨 뜻인지 더 자세히 설명해 주시겠어요?

BP의 SV 수는 고정성을 결정하는 데 관여하지 않습니다.

원인을 알 수 없는 경우 어떤 기준으로 결정할 수 있나요?

이것은 무작위 프로세스의 표준입니다. 원인을 알 수 있다면 결정론적 프로세스일 가능성이 높습니다.

이제 저는 원칙적으로 동의하지 않습니다. 문구 자체에 동의하지 않습니다. 특성이 무작위로 변하는 시리즈를 어떻게 고정시킬 수 있습니까? 즉,이 접근 방식은 어떤 것에 근거하지 않는데 어떤 가설에 대해 이야기 할 수 있습니까?

예를 들어 GARCH는 변동성이 변화하는 모델입니다.

우리는 두 사람이 토론을 하는데 너무 추상적입니다. 심지어 최고 전문가도 참여하지 않습니다. 논의 중인 기사의 논의와 전개에 일관성이 있었으면 좋겠습니다. 예를 들어, 첫 번째 단계에서는 구체적인 예를 들어 데이터의 예비 분석과 모델링을 위한 준비를 자세히 고려해야 합니다. 예를 들면 다음과 같습니다:

1. 표본 크기의 정당성.

2. 데이터 변환의 필요성에 대한 정당화.

3. 데이터 변환 방법 선택:

- 이상값 및 누락된 데이터 처리

- 데이터 변환 - 추세, 주기성 제거

4. 추세 유형 및 그 설명의 결정

5. 변환된 데이터에 분포 맞추기 5.

6. 변환된 데이터의 고정성 분석.

7. 이질적 공분산성 고려하기

지금은 이것으로 충분합니다. 다른 계획도 충분히 허용됩니다. 논의 중인 논문에서 설명한 모델링에 대한 지수를 준비하는 문제를 체계적으로 정리하고 싶습니다.
 

토픽스타터[헤링본, 아직 그렇게 부르지 않았습니다]는 약간의 크리에이티브 위기에 처해 있습니다 :-))))

하지만 그는 토론을 따르고 있습니다....

그는 건설적인 의견을 보내 주신 faa1947에게 감사드립니다 ...

-Alexey-, 매트릭스를 공부하는 것이 좋습니다 ...

나는 모든 의견을 고려할 것이고 나중에 반론과 주장을 제시 할 것입니다 ...

[삭제]  
denkir:


-알렉시-, 매트릭스 공부를 추천해드리고 싶어요....

어떤 섹션을 추천할 수 있나요? 각 진술 (질문 포함)에 대해 매트릭스에 대한 링크를 제공 할 수 있습니다.

추신 창의적 위기는 비밀이 아니라면 어떤 순간과 관련이 있습니까? :)