트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2634

 

조금 더 준철학. 편향과 분산 간의 균형은 항상 모델 복잡성을 제한합니다. 따라서 모델이 전체 예측 변수 집합에서 잘 수행될 것이라고 확신할 수 없습니다. 따라서 작업은 이 모델의 작업 하위 집합을 결정하는 것입니다. 내가 올바르게 이해했다면 이것이 바로 Maxim이 최근에 쓴 것입니다(약 2개의 모델). 이것은 "항상 시장에 나가려고 할 필요가 없다"는 오래된 생각과 잘 맞습니다.

이 모든 것을 하나의 모델로 결합하는 것이 좋을 것입니다. 예를 들어, 그러한 아이디어(aleksey Vyazmikin은 약간의 유사한 아이디어를 가짐) - 각 예측자를 세그먼트로 나누어 전체 예측자 세트를 다차원 큐브로 분할합니다. 그런 다음 이 모든 큐브에서 적합한 큐브 세트를 선택합니다. 큰 차원의 경우 이 문제는 조합적으로 해결할 수 없지만 랜드 포레스트와 유추하여 수행할 수 있습니다. 즉, 저차원의 예측 변수 집합을 무작위로 선택합니다. 각 예측 변수에 대한 세그먼트로의 초기 분할은 주식(거래가 시간이 아니라 이 예측 변수에 따라 정렬되는 경우)을 단조로운 조각으로 나누어 수행할 수 있습니다.

이 모든 것을 교차 검증(포워드) 및 예상되는 다른 모든 것으로 보완하십시오. 아마도 완전히 넌센스가 아닌 것으로 판명될 수도 있습니다. 글쎄, 또는 누군가가 이미 그런 일을 했습니다.

 
Mikhail Mishanin # :
유용한 기사.
https://habr.com/ru/company/ods/blog/544208/
모자. 다른 통계 테스트의 Solyanka
 
Maxim Dmitrievsky # :
모자. 다른 통계 테스트의 Solyanka

반성/이해를 위한 주제로

상관관계 != 인과관계

1-4.

그리고 어떤 경우에도 테스트를 수행합니다. 그래서 기사는 거의 광고입니다)

 
Mikhail Mishanin # :

반성/이해를 위한 주제로

상관관계 != 인과관계

1-4.

그리고 어떤 경우에도 테스트를 수행합니다. 그래서 기사는 거의 광고입니다)

누가 똑같다고 하더군요. 거짓 진술을 하고 나서 그것을 반박하는 것처럼
 
합성 데이터에서 패턴을 찾는 것이 가능한지 궁금합니다. 설명하겠습니다 - 100-200개의 관찰에 대한 작은 샘플에서 분포에서 많은 합성 데이터를 생성하고 이미 복잡한 시퀀스 등을 찾습니다.
 
mytarmailS # :
합성 데이터에서 패턴을 찾는 것이 가능한지 궁금합니다. 설명하겠습니다 - 100-200개의 관찰에 대한 작은 샘플에서 분포에서 많은 합성 데이터를 생성하고 이미 복잡한 시퀀스 등을 찾습니다.
논리적으로, 아닙니다.
 
Valeriy Yastremskiy # :
논리적으로, 아닙니다.
왜요?
 
mytarmailS # :
왜요?

논리적으로 :-)

PS/ 데이터가 너무 적고 ohlc 또는 개별 메트릭으로 거세됩니다.

PPS / 그러나 그러한 일반 샘플을 취하면 완전히 다른 옥양목. 보기/검색 - 여기에 공통점이 있는 템플릿 팩이 있습니다. 여기에서 각 조각의 크기는 크지 않을 수 있으며 전체 개수도 너무 클 수 있습니다. 세트를 구성할 때 메인 패턴을 표시해 주셨기 때문에

 
그것은 무엇을 의미합니까 - 정기적 인 샘플?