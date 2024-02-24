트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1532 1...152515261527152815291530153115321533153415351536153715381539...3399 새 코멘트 Aleksey Vyazmikin 2019.09.17 10:19 #15311 알렉세이 니콜라예프 : 또는 롤링 목록 시스템의 포트폴리오와 같은 것입니다. 정확히 무엇을 계산합니까? [삭제] 2019.09.17 10:27 #15312 알렉세이 니콜라예프 : 또는 롤링 리스트 시스템의 포트폴리오와 같은 것. 다음은 다중 클래스입니다. 현재 거래하는 것이 더 나은 시트를 선택할 두 번째 모델을 만드십시오. 이점은 명확하지 않고 만들기가 더 어렵습니다. Aleksey Vyazmikin 2019.09.17 10:36 #15313 막심 드미트리예프스키 : 자, 이론부터 시작하겠습니다. 예를 들어 판매용 모델과 구매 모델을 따로 선택하는 것이 무슨 의미가 있을까요? 구매 - 판매가 아닌 모든 것, 그리고 그 반대의 경우도 마찬가지입니다. 내 이념은 기본 거래 전략을 개선하는 것이며 전략이 추세이므로 처음부터 역전을 제공하지 않습니다. 플랫에서 시장 진입 및 "입력하지 않음"은 본질적으로 잘못된 플랫 브레이크아웃을 제거합니다. 또한 긴 ZZ 세그먼트의 정점 주변에서 수익성 있는 포지션을 청산하는 모델을 실험했지만 결과가 만족스럽지 않습니다. 예측 능력이 낮거나 예측자가 잘 작동하지 않거나 둘 다일 수 있으므로 반전 전략을 사용하지 않습니다. 오히려 여기에서 서로 다른 두 가지 모델을 훈련시키는 것이 더 낫다고 생각합니다. 막심 드미트리예프스키 : 더 높은 임계값을 통해 입력을 필터링할 수 있을 때. "거래 금지" 클래스는 모델에 의해 과도한 가중치가 부여될 수 있으며, 이로 인해 모델의 오류가 줄어들고 일반적으로 예측(일반화) 능력이 저하됩니다. 저는 CatBoost를 사용한 실험에서 모델의 임계값에 의해 결정되는 거래/거래하지 않기 위해 이진 분류와 함께 거의 그러한 접근 방식을 사용하지만 문제는 모델이 진공 청소기는 좋고 나쁨을 가리지 않고 모든 것을 빨아들입니다. 그리고 출력에서 나는 활발할 수 있지만 입력의 수가 적은 모델을 얻습니다. 막심 드미트리예프스키 : 두 번째 모델의 의미는 첫 번째는 첫 번째 및 두 번째 종류의 오류(가양성 및 위음성)가 있다는 것입니다. 우리는 그것들을 제거하는 데 관심이 있습니다. 이를 위해 두 번째 모델의 입력에 동일한 기능을 제공하고 첫 번째 모델의 거래 결과가 출력됩니다. 여기서 0 - 거래가 수익성이 있었고 1 - 거래가 수익성이 없었습니다. 두 번째 분류기를 훈련하고 0이 표시될 때만 거래합니다. 첫 번째 모델의 신호를 필터링합니다. 수익성이 없는 거래는 기차에서 거의 사라질 것이므로 테스트에서 테스트해야 합니다. 바로 지금입니다. 두 번째 모델은 기차에서 훈련할 수 있을 뿐만 아니라 OOS도 캡처할 수 있습니다. 그러면 새 데이터에 대한 트랜잭션이 수정됩니다. 이 두 가지입니다. 자, 그럼 테스트. 그래서 그것이 내가 한 일입니다. 연결이 끊긴 예측자를 사용하지 않고 이미 시트를 예측자로 사용했습니다. 여기서 1은 예측자에 있는 시트의 신호이지만 대상에서는 올바른 분류 답변입니다. 물론 내 방법은 새로운 예측자 관계를 찾는 것을 허용하지 않지만 기존 관계 간의 관계를 찾는 것은 허용합니다. 방법을 시도해 보겠습니다. 감사합니다. 하지만 이 개념에서는 CatBoost 모델의 형태로만 구현될 수 있는데, 분명히 시간을 절약하기 위해 모든 것을 다시 잘라낼까 두렵습니다. [삭제] 2019.09.17 10:39 #15315 알렉세이 비아즈미킨 : 내 이념은 기본 거래 전략을 개선하는 것이며 전략이 추세 이므로 처음부터 역전을 제공하지 않습니다 . 플랫에서 시장 진입 및 "입력하지 않음"은 본질적으로 잘못된 플랫 브레이크아웃을 제거합니다. 또한 긴 ZZ 세그먼트의 정점 주변에서 수익성 있는 포지션을 청산하는 모델을 실험했지만 결과가 만족스럽지 않습니다. 예측 능력이 낮거나 예측자가 잘 작동하지 않거나 둘 다일 수 있으므로 반전 전략을 사용하지 않습니다. 오히려 여기에서 서로 다른 두 가지 모델을 훈련시키는 것이 더 낫다고 생각합니다. 저는 CatBoost를 사용한 실험에서 모델의 임계값에 의해 결정되는 거래/거래하지 않기 위해 이진 분류와 함께 거의 그러한 접근 방식을 사용하지만 문제는 모델이 진공 청소기는 좋고 나쁨을 가리지 않고 모든 것을 빨아들입니다. 그리고 출력에서 나는 활발할 수 있지만 입력의 수가 적은 모델을 얻습니다. 그래서 그것이 내가 한 일입니다. 연결이 끊긴 예측자를 사용하지 않고 이미 시트를 예측자로 사용했습니다. 여기서 1은 예측자에 있는 시트의 신호이지만 대상에서는 올바른 분류 답변입니다. 물론 내 방법은 새로운 예측자 관계를 찾는 것을 허용하지 않지만 기존 관계 간의 관계를 찾는 것은 허용합니다. 방법을 시도해 보겠습니다. 감사합니다. 하지만 이 개념에서는 CatBoost 모델의 형태로만 구현될 수 있는데, 분명히 시간을 절약하기 위해 모든 것을 다시 잘라낼까 두렵습니다. 반전은 그렇게 되어서는 안 되며, 잘못된 신호는 두 번째 모델에 의해 단순히 필터링됩니다. 글쎄, 그것은 구현과 당신이 원하는 것에 달려 있습니다. 그러면 왜 잃는 거래가 많은지 이상하거나 OOS의 사진입니까? 네, 두 번째 거래 모델을 사용하려면 필터링할 항목이 많아야 합니다. 이를 위해 인위적으로 거래를 추가할 수도 있습니다(오버샘플링). 나는 또한 분류가 아닌 회귀를 시도하고 수익성이 높은 잎 조합을 선택하는 옵션을 생각합니다. 아마도 돈 측면에서 더 나은 효과가 있을 것입니다. [삭제] 2019.09.17 11:13 #15318 알렉세이 비아즈미킨 : 위의 스크린샷에는 어떤 식으로든 모델 학습에 참여하지 않은 데이터에 대한 테스트가 있었습니다. 다음은 교육 결과, 스크린샷입니다. 교육이 있었던 데이터에 대한 첫 번째 시트 라인업(1/5의 세그먼트만 가져옴) 수익성 있는 장기 거래는 52.86%입니다. 다른 시트의 답변에 기반한 트리를 추가했습니다. 그리고 결과는 개선되었고 수익성 있는 장기 거래는 이미 79.56%가 되었습니다. 결과적으로 접근 방식은 전체적으로 작동하지만 실제 응용 프로그램의 출력은 그리 크지 않습니다. 왜 그런가요? 아마도 교육이 수행된 일부 시트가 안정적인 연결을 제공하지 않거나 이러한 연결이 거의 없을 것입니다. 각 잎은 샘플에서 1%-3%의 영역에서 반응을 보입니다. 글쎄, 당신이 가진 것을 개선하려고한다면 이것은 접힌 변형이 있습니다. 그것을 여러 조각으로 나누고 일부 조각에서 첫 번째 조각을 훈련하고 나머지 조각에서 두 번째 조각을 훈련합니다. 500번까지 해봤습니다. 물론 더 적을 수도 있습니다. 약간의 개선을 제공합니다. Aleksey Vyazmikin 2019.09.17 11:17 #15319 막심 드미트리예프스키 : 글쎄, 당신이 가진 것을 개선하려고한다면 이것은 접힌 변형이 있습니다. 그것을 여러 조각으로 나누고 일부 조각에서 첫 번째 조각을 훈련하고 나머지 조각에서 두 번째 조각을 훈련합니다. 500번까지 해봤습니다. 물론 더 적을 수도 있습니다. 약간의 개선을 제공합니다. 샘플을 분할하고 여러 모델을 훈련시키거나 무엇을 하시겠습니까? 사실, 나는 약 14,000 행만 선택했습니다 ... 자, 이론부터 시작하겠습니다. 예를 들어 판매용 모델과 구매 모델을 따로 선택하는 것이 무슨 의미가 있을까요?
구매 - 판매가 아닌 모든 것, 그리고 그 반대의 경우도 마찬가지입니다.
내 이념은 기본 거래 전략을 개선하는 것이며 전략이 추세이므로 처음부터 역전을 제공하지 않습니다. 플랫에서 시장 진입 및 "입력하지 않음"은 본질적으로 잘못된 플랫 브레이크아웃을 제거합니다.
또한 긴 ZZ 세그먼트의 정점 주변에서 수익성 있는 포지션을 청산하는 모델을 실험했지만 결과가 만족스럽지 않습니다. 예측 능력이 낮거나 예측자가 잘 작동하지 않거나 둘 다일 수 있으므로 반전 전략을 사용하지 않습니다. 오히려 여기에서 서로 다른 두 가지 모델을 훈련시키는 것이 더 낫다고 생각합니다.
더 높은 임계값을 통해 입력을 필터링할 수 있을 때. "거래 금지" 클래스는 모델에 의해 과도한 가중치가 부여될 수 있으며, 이로 인해 모델의 오류가 줄어들고 일반적으로 예측(일반화) 능력이 저하됩니다.
저는 CatBoost를 사용한 실험에서 모델의 임계값에 의해 결정되는 거래/거래하지 않기 위해 이진 분류와 함께 거의 그러한 접근 방식을 사용하지만 문제는 모델이 진공 청소기는 좋고 나쁨을 가리지 않고 모든 것을 빨아들입니다. 그리고 출력에서 나는 활발할 수 있지만 입력의 수가 적은 모델을 얻습니다.
두 번째 모델의 의미는 첫 번째는 첫 번째 및 두 번째 종류의 오류(가양성 및 위음성)가 있다는 것입니다. 우리는 그것들을 제거하는 데 관심이 있습니다. 이를 위해 두 번째 모델의 입력에 동일한 기능을 제공하고 첫 번째 모델의 거래 결과가 출력됩니다. 여기서 0 - 거래가 수익성이 있었고 1 - 거래가 수익성이 없었습니다. 두 번째 분류기를 훈련하고 0이 표시될 때만 거래합니다. 첫 번째 모델의 신호를 필터링합니다. 수익성이 없는 거래는 기차에서 거의 사라질 것이므로 테스트에서 테스트해야 합니다. 바로 지금입니다.
두 번째 모델은 기차에서 훈련할 수 있을 뿐만 아니라 OOS도 캡처할 수 있습니다. 그러면 새 데이터에 대한 트랜잭션이 수정됩니다. 이 두 가지입니다. 자, 그럼 테스트.
그래서 그것이 내가 한 일입니다. 연결이 끊긴 예측자를 사용하지 않고 이미 시트를 예측자로 사용했습니다. 여기서 1은 예측자에 있는 시트의 신호이지만 대상에서는 올바른 분류 답변입니다. 물론 내 방법은 새로운 예측자 관계를 찾는 것을 허용하지 않지만 기존 관계 간의 관계를 찾는 것은 허용합니다.
방법을 시도해 보겠습니다. 감사합니다. 하지만 이 개념에서는 CatBoost 모델의 형태로만 구현될 수 있는데, 분명히 시간을 절약하기 위해 모든 것을 다시 잘라낼까 두렵습니다.
그러면 왜 잃는 거래가 많은지 이상하거나 OOS의 사진입니까? 네, 두 번째 거래 모델을 사용하려면 필터링할 항목이 많아야 합니다. 이를 위해 인위적으로 거래를 추가할 수도 있습니다(오버샘플링).
다음은 교육 결과, 스크린샷입니다. 교육이 있었던 데이터에 대한 첫 번째 시트 라인업(1/5의 세그먼트만 가져옴)
수익성 있는 장기 거래는 52.86%입니다.
다른 시트의 답변에 기반한 트리를 추가했습니다.
그리고 결과는 개선되었고 수익성 있는 장기 거래는 이미 79.56%가 되었습니다.
결과적으로 접근 방식은 전체적으로 작동하지만 실제 응용 프로그램의 출력은 그리 크지 않습니다. 왜 그런가요? 아마도 교육이 수행된 일부 시트가 안정적인 연결을 제공하지 않거나 이러한 연결이 거의 없을 것입니다. 각 잎은 샘플에서 1%-3%의 영역에서 반응을 보입니다.
글쎄, 당신이 가진 것을 개선하려고한다면 이것은 접힌 변형이 있습니다. 그것을 여러 조각으로 나누고 일부 조각에서 첫 번째 조각을 훈련하고 나머지 조각에서 두 번째 조각을 훈련합니다. 500번까지 해봤습니다. 물론 더 적을 수도 있습니다. 약간의 개선을 제공합니다.
사실, 나는 약 14,000 행만 선택했습니다 ...
위에 썼습니다. 조각의 절반은 메인 모델이고 다른 절반은 두 번째 수정 사항입니다.그런 다음 5-10 폴드로 충분합니다. 아마도 더 많을 것입니다.