트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3011

 
Maxim Dmitrievsky #:
글쎄요, 소설에서도 똑같습니다. 그들은 많은 것을 생각해 내고 그것을 적을 시간이 없습니다 :) 그리고 Aleksey Nikolayev의 편집위원회가 모든 것을 줄입니다.

좋은 편집자는 좋습니다.

가장 중요한 것은 그가 이미 작동하는 것을 게시하는 것을 금지해서는 안되지만 방법을 이해하지 못한다는 것입니다.

 
mytarmailS #:

먼저 모델 내부가 쓰레기로 가득 차 있다는 사실을 깨달아야 합니다...

학습된 나무 모델을 내부의 규칙과 그 규칙에 대한 통계로 분해하면 다음과 같습니다.

처럼:


를 생성하고 샘플에서 오류 규칙 오류의 발생 빈도에 대한 의존성을 분석합니다.


에 대한 의존성을 분석하면


그런 다음 이 영역에 관심이 있습니다.


규칙이 매우 잘 작동하지만 10-30 개의 관찰은 통계가 아니기 때문에 통계의 신뢰성을 의심하는 것이 합리적 일 정도로 드문 경우입니다.

마침내 제가 수년 동안 말했던 것이 대중에게 전달되기 시작했습니다! :)

 
Forester #:

다른 사람이 트레이닝에 볼륨을 추가해 본 적이 있나요? 결과는 똑같았나요? 아니면 더 나은 결과를 얻었나요?

차트 아래에서 거래량과 같은 모델이 지표를 통해 실행되는 것을 발견했습니다.

저는 이 방향에 대해 깊이 파고들지 않았고 그저 관찰한 것뿐입니다.

 
СанСаныч Фоменко #:

제 게시물을 완전히 오해하신 것 같습니다. 기능의 적합성에 대한 수치적 추정치가 있든 없든 '희망'이라는 것은 존재하지 않습니다. 그리고 향후 특성의 적합성에 대한 수치적 평가가 있습니다.

흥미롭군요, 정확히 미래에 대해 비밀을 밝혀 주시겠습니까?

 
mytarmailS #:

기차 5k

유효 60k


모델 훈련 - 1-3초

규칙 추출 - 5~10초

각 규칙(20~30만 개의 규칙)의 유효성 검사 - 60~1~2분


물론 이는 모두 근사치이며 속성 및 데이터의 수에 따라 달라집니다.

어떤 종류의 모델인가요?

규칙 추정 알고리즘은 단일 코어에서 실행되나요?

 
Aleksey Vyazmikin #:

어떤 모델인가요?

규칙 추정 알고리즘이 단일 코어에서 실행되나요?

Forrest

하나에서

 
Aleksey Vyazmikin #:

드디어 제가 수년 동안 말했던 것이 대중에게 전달되기 시작했습니다! :)

아직도 제가 하는 말을 이해하지 못하는 사람이 있을 것 같아요.)

오컴의 면도기처럼 모든 것을 명확하고 간단하게 설명해 주셨어요.

 
Forester #:

이 테스트는 누적 거래량, 델타, 발산 및 수렴을 100바 단위로 한 EURUSD에 대한 CME의 실제 거래량을 사용했습니다. 총 400개 열 + 다른 종류의 열 5개.
모델 설정을 변경하지 않고 CME 데이터가 있는 405개 열(가격 델타와 지그재그는 그대로 유지)을 삭제하여 총 115개 열을 만들었더니 약간 더 나은 결과를 얻었습니다. 즉, 볼륨이 때때로 분할로 선택되지만 OOS에서 노이즈로 판명되었습니다. 그리고 훈련 속도가 3.5 배 느려집니다.

비교를 위해 차트를 위에 볼륨이 있고 아래에 볼륨이없는 차트를 남겨 두었습니다.

저는 CME가 있는 볼륨이 학습을 개선할 수 있는 추가 정보/규칙성을 가져다주기를 바랐습니다. 그러나 보시다시피 차트는 매우 비슷하지만 볼륨이 없는 모델이 조금 더 낫습니다.
이것은 CME에 대한 저의 두 번째 접근 방식이었으며 (3년 전에 시도했지만) 다시 실패했습니다.
모든 것이 가격에 고려된다는 것이 밝혀졌습니다.

다른 사람이 교육에 볼륨을 추가하려고 시도한 적이 있습니까? 결과는 같았나요? 아니면 개선 사항이 있나요?

볼륨없이 3 번 더 테스트를하고 볼륨으로 수행 한 테스트와 비교했습니다. 이미 모델의 하이퍼파라미터를 변경했습니다.
총 4번의 테스트: 볼륨을 추가하지 않은 3번의 테스트에서는 OOS가 더 좋았고 1번의 테스트에서는 더 나빴습니다. 즉, 때때로 볼륨이 약간 추가됩니다. 일반적으로 모든 것이 오류 수준입니다. 볼륨을 추가하는 것보다 무차별 대입을 통해 더 많은 것을 얻을 수 있습니다. 크게 개선되거나 크게 악화되지 않습니다.

저는 볼륨에서 더 많은 것을 기대했습니다.

 
Aleksey Vyazmikin #:

구체적으로 미래에 대해 궁금한데, 그 비결을 알려주실 수 있나요?

몇 번 글을 썼어요.

 
mytarmailS #:

포레스트

하나에

몇 퍼센트를 샘플링하고 있나요?

포레스트가 각각 절반의 예측자를 분할 사용하면 포레스트에 대한 유용성이 거의 없는 것 같습니다.

사유: