트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2564

 
Aleksey Vyazmikin # :

그래서 나는 특정 영역에서 통계적 이점을 제공하는 안정적인 패턴을 식별하기 위해 썼습니다. 그리고 우리는 예측 변수를 양자화합니다.

그러나 "어떻게" 이것을 하는 것이 더 나은지는 열린 질문입니다. 지금까지는 CatBoost 알고리즘의 경험적 가정 또는 통계적 분할에 따라 만들어진 준비된 테이블의 열거에 의해서만 가능합니다.

그림 3은 "양자"를 보여줍니다. 아마도 중간 범위가 선택되어 일종의 통계 이점이 있는 것 같습니다.

제 생각에 문제는 거의 모든 예측 변수의 공선성(상관성)에 있습니다. 또한 조합 문제가 있습니다. 예측 변수가 많으면 양자가 너무 많을 수 있습니다. 먼저 PCA 또는 PLS로 치수를 낮추는 것이 좋습니다.

 
mytarmailS # :
몬티홀의 역설 을 거래/의사결정에 연결하려고 시도한 사람이 있습니까?

여기서 전체적인 역설은 작업이 수학적으로 완전히 형식화되지 않는다는 것입니다. 완전한 형식화를 얼마나 정확히 수행하느냐에 따라 답이 달라진다.

유용성의 의미에서 - 아마도 하나의 실제 현상에 대해 다른 대답을 제공하는 다른 수학적 모델이 있을 수 있다는 사실에 대한 유익한 예일 것입니다.

 
프리콜류하. 나는 Hurst에서 눈금을 선택하고 0.5와 매우 다른 스프레드 규모의 값을 얻었습니다. 시간 규모가 클수록 Hurst는 0.5에 더 가깝습니다. 나는 기계 에 원시 시스템을 만들고 10, 100, 1000, 10000의 기간을 대체하기 시작했습니다. 모두가 거의 같은 기대를 합니다. 이것이 바로 효율적인 시장입니다.
 
Alexey Nikolaev # :

제 생각에 문제는 거의 모든 예측 변수의 공선성(상관성)에 있습니다. 또한 조합 문제가 있습니다. 예측 변수가 많으면 양자가 너무 많을 수 있습니다. 먼저 PCA 또는 PLS로 치수를 낮추는 것이 좋습니다.

나는 샘플에서 유사한 신호를 갖는 예측 변수를 제외한다고 위에서 썼습니다. 나는 유사한 것들의 그룹에서 최상의 결과를 그룹화하고 선택하는 방법을 사용하지만 양자 예측자 간의 상관 관계는 감소합니다.

조합 문제에 관해서는 - 정확히 어디에서 볼 수 있습니까? 훈련 샘플에서? 그렇다면 이론적으로 그럴 수 있으며 여기에서 SAR을 사용하는 것이 합리적일 수 있지만 최종 샘플이 준비되기 전에는 그렇지 않습니다. 실제로 나는 아직 그런 문제가 발생하지 않았으며 반대로 원래 샘플보다 예측 변수가 적습니다.

 
Alexey Nikolaev # :

여기서 전체적인 역설은 작업이 수학적으로 완전히 형식화되지 않는다는 것입니다. 완전한 형식화를 얼마나 정확히 수행하느냐에 따라 답이 달라진다.

유용성의 의미에서 - 아마도 하나의 실제 현상에 대해 다른 대답을 제공하는 다른 수학적 모델이 있을 수 있다는 사실에 대한 유익한 예일 것입니다.

이와 같이?

여기 코드가 포함된 기사가 있습니다.

또한 백만 개 이상의 구현

모든 것이 수학적으로 공식화되어 있습니까, 아니면 제가 이해하지 못했습니까?

 
mytarmailS # :

이와 같이?

여기 코드가 포함된 기사가 있습니다.

또한 백만 개 이상의 구현

모든 것이 수학적으로 공식화되어 있습니까, 아니면 제가 이해하지 못했습니까?

2개의 플라스크에 대한 문제와 같으며, 완전한 조건이 주어지지 않고 나머지 조건에 대해 환상을 가지므로 그러한 대답은 다음과 같습니다.

 
mytarmailS # :

이와 같이?

여기 코드가 포함된 기사가 있습니다.

또한 백만 개 이상의 구현

모든 것이 수학적으로 공식화되어 있습니까, 아니면 제가 이해하지 못했습니까?

위키 를 보면 초기 설정이 올바르지 않다고 나와 있고 다른 방법으로 수정할 수 있는지 완전히 명확하지 않습니다. 역설의 본질은 정확히 다른 사람들의 직관이 다른 방식으로 초기 과묵함을 채운다는 사실에 있습니다. 순전히 심리적 효과.

 
로르샤흐 # :

2개의 플라스크에 대한 문제와 같으며, 완전한 조건이 주어지지 않고 나머지 조건에 대해 환상을 가지므로 그러한 대답은 다음과 같습니다.

아무것도 이해하지 못했지만 문맹을 위해 적어 둡니다.

그렇다면 이 허스트의 의미는 간단히 말해서 무엇입니까?

이 Hurst를 구축한 귀하의 게시물을 읽고 이를 어떻게 처리해야 합니까?


 
Aleksey Vyazmikin # :

나는 샘플에서 유사한 신호를 갖는 예측 변수를 제외한다고 위에서 썼습니다. 나는 유사한 것들의 그룹에서 최상의 결과를 그룹화하고 선택하는 방법을 사용하지만 양자 예측자 간의 상관 관계는 감소합니다.

조합 문제에 관해서는 - 정확히 어디에서 볼 수 있습니까? 훈련 샘플에서? 그렇다면 이론적으로 그럴 수 있으며 여기에서 SAR을 사용하는 것이 합리적일 수 있지만 최종 샘플이 준비되기 전에는 그렇지 않습니다. 실제로 나는 아직 그런 문제가 발생하지 않았으며 반대로 원래 샘플보다 예측 변수가 적습니다.

음, 각 예측자를 두 부분으로만 나누고 각 예측자의 절반을 포함하는 모든 종류의 규칙을 살펴보면 2 ^ N개의 다른 조각이 있을 것입니다. 여기서 N은 예측자의 수입니다. 이제 각 조각을 가져오거나 버릴 수 있습니다. 이미 2^(2^N) 옵션이 있습니다. 이것은 작은 N으로도 엄청난 숫자입니다.

 
Alexey Nikolaev # :

음, 각 예측자를 두 부분으로만 나누고 각 예측자의 절반을 포함하는 모든 종류의 규칙을 살펴보면 2 ^ N개의 다른 조각이 있을 것입니다. 여기서 N은 예측자의 수입니다. 이제 각 조각을 가져오거나 버릴 수 있습니다. 이미 2^(2^N) 옵션이 있습니다. 이것은 작은 N으로도 엄청난 숫자입니다.

처음에는 버리고 결합합니다.

사유: