기고글 토론 "박스-칵스(Box-Cox) 변환"

 

새로운 기고글 박스-칵스(Box-Cox) 변환 가 게재되었습니다:

이 글은 박스-칵스 변환에 대한 설명입니다. 박스-칵스 변환 사용 관련 문제를 다루며 임의의 시퀀스와 실제 시세를 적용한 변환 효율성 평가 예제가 포함되어 있습니다.

fname 변수로 지정된 파일 내 전체 값을 dat[] 배열로 불러오기합니다. 앞서 설명한 대로 초기 시퀀스 이동, 최적 매개 변수 탐색 및 박스-칵스 변환이 실행됩니다. 스크립트가 실행되면 변환 결과가 bcdat[] 배열에 저장됩니다.

소스 코드에서 확인할 수 있듯이 EURUSD M1 시세가 변환에 이용되었습니다. 그림 6과 7은 초기 시퀀스와 변환 시퀀스의 분석 결과입니다.

그림 6

그림 6. EURUSD M1 인풋 시퀀스 자크-바라 검정 결과: JB=100.94, p=0.000.

그림 7

그림 7. 변환된 시퀀스 람다 변수=0.4146, 자크-바라 검정 결과: JB=39.30, p=0.000

그림 7을 보니 EURUSD M1 시세 변환 결과는 앞서 실행한 유사 랜덤 시퀀스 변환 결과를 따라가지 못하네요. 박스-칵스 변환이 꽤 보편적으로 활용되기는 하지만 모든 인풋 시퀀스에 적용되는 것은 아닙니다. 예를 들어 멱법칙 변환을 통해 두 개의 꼭지점을 갖는 분포를 정규 분포로 바꿀 수는 없겠죠.

작성자: Victor

 
빅터, BC 변환 후 정상에 대한 근사치가 좋지 않은 경우 동일한 변환을 다시 적용하는 것이 바람직하다고 생각하시나요?
 
denkir:

빅터, BC 변환 후 정상에 대한 근사치가 좋지 않은 경우 동일한 변환을 다시 적용하는 것이 합리적이라고 생각하나요?

잘 모르겠지만 변환을 다시 적용해도 더 이상 첫 번째 변환만큼 강력한 효과가 없을 것 같습니다.

이런 종류의 변형은 완벽하지 않은 것 같습니다. 이러한 변환을 다른 변환과 마찬가지로 적용하면 입력 시퀀스의 초기 특성이 변경됩니다 (아마도). 그리고 여기서 가장 중요한 것은 그것을 과용하지 않는 것입니다. 그렇지 않으면 변환 후 얻은 시퀀스는 원래 시퀀스와 공통점이 없습니다. 그렇기 때문에 입력 시퀀스를 정상적인 시퀀스로 가져올 수 있는 변환이 널리 보급되지 않은 것일 수도 있습니다. 하지만 다시 한 번 강조하지만 저는 이러한 질문을 진지하게 고려하지 않았습니다.

 

그렇군요. 네, 꽤 심오한 주제입니다. 그들이 말했듯이, 보고 보았습니다.....

이 기사는 매우 유익합니다. 이전에 작성한 내용과 논리적 연관성이 있습니다. 자료 주셔서 감사합니다.

 
거래에 대해 이야기하면 지수를 따라 이동할 때 지수의 특성의 안정성이 흥미 롭습니다. 이동하지 않고 변환 후 변화의 특성을 제시했지만 한 막대를 앞으로 이동할 때 BC 매개 변수는 어떻게 될까요? 변환되지 않은 코티어를 따라 순차적으로 이동하여 통계 특성을 변환된 코티어의 통계 특성과 비교하면 어떤 것을 볼 수 있을까요? 시프트에 따라 분산 변동이 감소하나요? 만약 그렇다면 이는 BC에 큰 이점이 됩니다.
 
denkir:
그렇군요. 네, 꽤 심오한 주제입니다. 그들이 말했듯이, 보고 보았습니다.....

이 기사는 매우 유익합니다. 이전에 작성한 내용과 논리적 연관성이 있습니다. 자료 주셔서 감사합니다.

제 작업에 대한 평가에 감사드립니다.

 
faa1947:
거래에 대해 이야기하면 지수를 따라 이동할 때 지수의 특성의 안정성이 흥미 롭습니다. 이동하지 않고 변환 후 변화의 특성을 제시했지만 한 막대를 앞으로 이동할 때 BC 매개 변수는 어떻게 될까요? 변환되지 않은 코티어를 따라 순차적으로 이동하여 통계 특성을 변환된 코티어의 통계 특성과 비교하면 어떤 것을 볼 수 있을까요? 시프트에 따라 분산 변동이 감소하나요? 감소한다면 이는 바로 BC에 큰 이점이 되는 것입니다.

이 글은 주로 고전적인 통계 방법의 특징을 독자에게 알리고 실험을 위한 일종의 도구 상자를 제공하기 위해 고안된 입문자용 글입니다. 여러분의 질문은 이 글의 범위를 훨씬 뛰어넘는 것입니다. 제가 답변해 드릴 수 없습니다.