트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2595

 
도서관 # :

그런 다음 가능한 한 가장 짧은 섹션에서 훈련해야한다는 것이 밝혀졌습니다. 패턴을 변경한 후 새 모델이 더 빨리 작동하기 시작합니다.

예를 들어 훈련이 12개월 동안이라면 6개월 후에 패턴을 변경한 후 새 패턴과 이전 패턴은 50/50이 됩니다. 그리고 약 1년 안에 새로운 패턴에 대한 훈련과 거래가 있을 것입니다. 저것들. 거의 1년 동안 모델은 구식 패턴으로 거래되었으며 대부분 병합되었습니다.

한 달 동안 훈련하면 한 달 안에 모델이 다시 올바르게 작동하는 법을 배웁니다.

1주일이면 공부하면 좋겠지만.. 데이터가 이미 부족합니다.

떠나는 시간이 아주 짧으니 그만한 가치가 없다고 확신합니다. 그리고 데이터는 모델에 충분하지 않으며 시장 상태에 과적합될 위험이 있습니다. 적응의 개념은 좋아 보이지만 지연으로 인해(데이터가 축적되는 동안 상태가 이미 변경되었을 수 있음) 성배가 아닙니다. 동시에 여러 모델을 시도할 수 있습니다. 하나는 장기적인 패턴을 담당하고 다른 하나는 더 짧은(현재) 패턴을 담당하며 결정은 이러한 모든 모델의 결정에 따라 결정됩니다.

 
Alexey Nikolaev # :
거래에서 ML 사용에 대한 더 흥미로운 질문이 있습니다. 예를 들어 훈련에 사용할 기록 기간을 결정하는 알고리즘입니다. 아마도 교차 검증에 의해 최적화된 일부 메타 매개변수에 의해 설정될 수 있습니다. 프라도를 읽어야지

아마도 앞으로 걷는 것이 더 나을 것입니다. 그는 항상 기차 후에 OOS를 가지고 있습니다. HF에서는 첫 번째 패스만 이와 같으며 나머지는 FOS 전후의 열차 데이터를 사용합니다.

 
Replicant_mih # :

아주 짧은 기간에 떠날 가치가 없다고 확신합니다. 그리고 데이터는 모델에 충분하지 않으며 시장 상태에 과적합될 위험이 있습니다. 적응의 개념은 좋아 보이지만 지연으로 인해(데이터가 축적되는 동안 상태가 이미 변경되었을 수 있음) 성배가 아닙니다. 동시에 여러 모델을 시도할 수 있습니다. 하나는 장기적인 패턴을 담당하고 다른 하나는 더 짧은(현재) 패턴을 담당하며 결정은 이러한 모든 모델의 결정에 따라 결정됩니다.

M5 5000라인(약 2개월)에 대한 최근 실험에 따르면 흥미로운 것이 있다. 3000에서는 모든 것이 이미 나쁩니다. 그러나 이것은 특정 촬영 기능 + 대상에 대한 것입니다. 짧은 섹션에 대한 교육 후 모델이 작동할 때 또 다른 기능 세트와 대상이 있을 수 있습니다. 실험을 해봐야...
 
도서관 # :
M5 5000라인(약 2개월)에 대한 최근 실험에 따르면 흥미로운 것이 있다. 3000에서는 모든 것이 이미 나쁩니다. 그러나 이것은 특정 촬영 기능 + 대상에 대한 것입니다. 짧은 섹션에 대한 교육 후 모델이 작동할 때 또 다른 기능 세트와 대상이 있을 수 있습니다. 실험을 해봐야...

기능의 수에 따라 다르며 더 많은 기능을 좋아합니다. 일반적으로 5000은 충분하지 않습니다. 최대 5가지 기능이 있으면 5000이 정상일 것입니다.

 
도서관 # :

그런 다음 가능한 한 가장 짧은 섹션에서 훈련해야한다는 것이 밝혀졌습니다. 패턴을 변경한 후 새 모델이 더 빨리 작동하기 시작합니다.

예를 들어 훈련이 12개월 동안이라면 6개월 후에 패턴을 변경한 후 새 패턴과 이전 패턴은 50/50이 됩니다. 그리고 약 1년 안에 새로운 패턴에 대한 훈련과 거래가 있을 것입니다. 저것들. 거의 1년 동안 모델은 구식 패턴으로 거래되었으며 대부분 병합되었습니다.

한 달 동안 훈련하면 한 달 안에 모델이 다시 올바르게 작동하는 법을 배웁니다.

1주일이면 공부하면 좋겠지만.. 데이터가 이미 부족합니다.

그런 다음 훈련을 덜 받고 이익을 덜 줄 수 있습니다. .. 여기에서 말하자면 선택의 문제는 아마도 이미있을 것입니다. 때로는 현재 분포에서 샘플링이 기사와 같이 짧은 샘플에 도움이 될 수 있습니다.
 
Replicant_mih # :

소음에 대해서는 그렇습니다. 소음이 있는 부분과 없는 부분의 역사를 구분하는 관점에서 생각하지는 않았지만. 그런데 모델을 훈련시키기 전에 이것을 어떻게 이해해야 할까요? 반복적으로? 전체 섹션에 대해 교육하고 가장 잘 수행되는 부분을 살펴보고 이 섹션만 남겨두고 처음에는 이 섹션에서만 훈련했습니까? 실험적 확인 전에 철학적이라고 부를 수 있는 두 번째 질문이 발생합니다. 잡음이 있지만 더 잡음이 많은 데이터에 대해 평균적으로 훈련하거나 더 깨끗한 데이터에 대해 훈련하지만 조건부로 잡음이 있는 데이터는 볼 수 없습니다.


거대한 크기에 무슨 문제가 있습니까? 계산 시간을 늘리는 것 외에도?

글쎄, 다른 기차 길이에서 마지막 기록에 대한 교육과 모델이 이전 기록에서 어떻게 작동했는지 비교하는 것과 같이, 동시에 어딘가에서 작동을 멈추면 여기에서 "과거의 적용 가능성의 지평"이 고려됩니다. 마지막 역사. 그리고 미래에 어떻게 될지는 알 수 없지만 봇을 중지하는 기준을 결정할 수 있습니다. 예를 들어 봇은 과거보다 더 나쁜 거래를 시작했습니다.

긴 샘플에서는 하위 샘플에서 나타나는 일반적인 패턴이 사라질 수 있습니다. 하위 샘플의 패턴이 서로 모순되는 경우 노이즈에 대해서만 학습해야 하며 이는 성공하고 대부분의 경우에 발생합니다. :)
 
도서관 # :

아마도 앞으로 걷는 것이 더 나을 것입니다. 그는 항상 기차 후에 OOC를 가지고 있습니다. HF에서는 첫 번째 패스만 이와 같으며 나머지는 FOS 전후의 열차 데이터를 사용합니다.

예를 들어 catbust와 같은 특별한 시계열 KV가 있습니다. 그러나 데이터 세트는 혼합될 수 없습니다. 그리고 섞지 않으면 같은 길이의 단면을 바꾸는 피팅과 같습니다. 혼합하면 대략적으로 추세 변화에 의존하지 않는 로컬 신호에 대한 훈련이 더 많습니다. 누가 더 나은지 알아요 :)
 
막심 드미트리예프스키 # :
그리고 섞지 않으면 같은 길이의 단면을 바꾸는 피팅과 같습니다.
그렇게 거래를 하려고 합니다. 길이는 일주일과 같습니다. 나는 일주일 동안 거래하고 주말에 훈련합니다. 그리고 워킹 포워드도 마찬가지입니다.
 
두리스티카
 
도서관 # :

아마도 앞으로 걷는 것이 더 나을 것입니다. 그는 항상 기차 후에 OOC를 가지고 있습니다. HF에서는 첫 번째 패스만 이와 같으며 나머지는 FOS 전후의 열차 데이터를 사용합니다.

"다음 기간에 거래하는 방법"이라는 질문에 답하면 귀하의 의견에 동의합니다. "이 역사의 기간에 패턴이 있습니까?"라는 질문에 답하면 CV가 상당히 적용됩니다.

사유: