트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2805

 
https://habr.com/ru/post/695276/ 어떤 사람들에게는 유용하거나 흥미로울 수 있습니다.
Хитрые методики сэмплинга данных
Хитрые методики сэмплинга данных
  • 2022.10.27
  • habr.com
Любой, кто хоть раз обучал нейронки, знает, что принято на каждой эпохе шаффлить датасет, чтобы не повторялся порядок батчей. А зачем это делать? Обычно это объясняют тем, что шаффлинг улучшает генерализацию сетей, делает точнее эстимейт градиента на батчах и уменьшает вероятность застревания SGD в локальных минимумах. Здесь можно посмотреть...
 

때로는 가격 차트(주황색)에 잔고 차트(파란색)를 겹쳐서 표시하는 것이 유용할 때가 있습니다.

이 경우 예를 들어 모델이 10년 동안 하락장에서만 수익을 내고 있다는 것을 명확하게 알 수 있습니다.

보다 정교한 모델도 마찬가지로 하락장에서 주로 수익을 내는 법을 배우지만 상승장과 통합장에서는 수익이 줄어듭니다. 시장이 10년 동안 모두 하락했기 때문에 훈련 샘플이 편향되어 있습니다.


 
elibrarius #:

무작위로 선행을 선택하는 게 맞나요? 저는 캣버스팅이 아니라 기본 캣버스팅 예제의 코드를 보고 있었습니다. 모든 예측자가 거기서 사용됩니다. 즉, 가장 좋은 것이 사용됩니다. 상관 관계가있는 것은 그 옆에 있지만 약간 더 나쁩니다. 그러나 다른 분할 수준이나 보정 트리에서는 상관 관계가 있는 다른 예측자가 더 좋을 수 있습니다.

추정을 위해 예측자의 일부만 취할 수있는 별도의 매개 변수가 있습니다. 무작위로 취해지며 모델 트리 수가 증가하지만 이론적으로는 훈련 속도가 빨라집니다.

코드를 파싱했다면 확실했을 것이므로 개발자가 선언 한 내용에 대해서만 이야기하고 있으므로 개발자를 오해했을 가능성이 적습니다.

그래서 그들이 말하는 것은 분할 평가에 무작위성을 추가하여 학습을 개선했다는 것입니다.

상관관계가 있는 예측 변수를 제거하기 위한 전처리가 있다는 것은 들어본 적이 없습니다.

다른 예측 변수가 더 우수하거나 유용할 수 있다는 데는 동의하지만, 제 목표는 가능한 한 다양한 모델을 훈련시키는 것입니다. 저는 그들이 무언가를 배우기를 원합니다.

 
Maxim Dmitrievsky #:
그러니 제가 테스트할 수 있도록 몇 가지 유익한 수식을 던져주세요.

이해가 되지 않는데, 여러분에게 던져야 하나요 아니면 데이터 집합에 던져야 하나요? 데이터 집합의 경우, 대상이 이 프로세스에 관여하지 않기 때문에 유사 그룹화 또는 상관 관계와 어떤 관련이 있나요?

 
Aleksey Vyazmikin #:

이해가 되지 않는데, 사용자에게 던져야 하나요 아니면 데이터 세트에 던져야 하나요? 데이터 집합의 경우, 대상이 이 프로세스에 관여하지 않기 때문에 유사성 그룹화 또는 상관 관계와 어떤 관련이 있나요?

파이썬과 SQL에서 재현할 좋은 피시를 계산하는 공식을 알려주세요. 제가 직접 태그를 고르겠습니다.

저는 증분만 사용하기 때문에 그냥 보기만 하죠.

훈련 후 봇을 업로드할 수 있습니다.
 
Maxim Dmitrievsky #:

가격 차트(주황색)에 잔고 차트(파란색)를 오버레이하는 것이 유용한 경우가 있습니다.

이 경우 예를 들어 모델이 10 년 동안 하락장에서만 수익을 내고 있음을 명확하게 알 수 있습니다.

보다 정교한 모델도 마찬가지로 하락장에서 주로 수익을 내는 법을 배우지만 상승장과 통합장에서는 수익이 줄어듭니다. 시장이 10년 동안 모두 하락했기 때문에 훈련 샘플이 편향되어 있습니다.


가격이 마감과 개시 거래 사이의 델타 원칙에 기반한 것인가 아니면 일종의 시간 배분인가?

 
Aleksey Vyazmikin #:

가격은 거래 마감과 개시 사이의 델타 원칙에 기반한 가격인가요, 아니면 일종의 시간 배분인가요?

예, 거래 시점에 고정되어 있습니다.

 
Maxim Dmitrievsky #:

공식을 사용하여 좋은 칩을 계산하여 파이썬과 mql에서 재현할 수 있습니다. 라벨은 제가 직접 만들겠습니다.

저는 증분만 사용하기 때문에 그냥 보기만 합니다.

훈련 후 봇을 업로드할 수 있습니다.

기능의 '좋음'은 대상에 따라 결정된다는 것을 알고 계실 겁니다.

앞서 생성 원리에 대해 설명했습니다. MQL5의 코드는 모두 MQL5에 있으며 함수를 통한 변환에 대한 의문의 여지가 없으며 공식을 제공 할 수 없습니다.

예를 들어, 현재 세그먼트의 시작 시간 ZZ(48)이 선택되는 경우가 많습니다.

 
Aleksey Vyazmikin #:

기능의 '좋은 점'은 대상에 따라 결정된다는 것을 알고 계실 겁니다.

앞서 생성 원리에 대해 설명했습니다. MQL5의 코드는 모두 MQL5에 있으며 함수를 통한 변환에 대해서는 의문의 여지가 없으며 공식을 제시하는 것은 불가능합니다.

예를 들어, 현재 세그먼트의 시작 시간 ZZ(48)이 선택되는 경우가 많습니다.

아, 대부분 표준 지표와 그 파생상품에서요?

 
Maxim Dmitrievsky #:

예, 거래 시점이 고정되어 있습니다.

구매 및 판매에 대한 마크업을 만들고 입력 수에 따라 더 균형 잡힌 모델을 선택한 다음 샘플을 두 개로 분할하여 두 개의 개별 모델을 만드세요.

사유: