트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2114

 
알렉세이 비아즈미킨 :

Maxim, 하지만 이것을 설정하는 방법은 무엇입니까?

id_tl은 무엇입니까?

모르겠어 링크가 필요해

아마도 변환된 예제의 ID는

 
알렉세이 비아즈미킨 :

고맙습니다! 모든 것이 해결되었습니다.

내 생각에 옳다고 생각합니다. 제어 장치가 테스트로 이동하기 때문에 기차를 변환하십시오. 하지만 결과가 매우 이상합니다. 테스트 샘플에서 로그 손실 오류가 1을 초과하고 커집니다. 어떻게 이것이 가능합니까? 충격.

다양한 방법으로 시도할 수 있습니다.

여기 멋진 노트북이 있습니다 https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

복사 및 확인 가능

Resampling strategies for imbalanced datasets
Resampling strategies for imbalanced datasets
  • www.kaggle.com
Explore and run machine learning code with Kaggle Notebooks | Using data from Porto Seguro’s Safe Driver Prediction
 
막심 드미트리예프스키 :

모르겠어 링크가 필요해

아마도 변환된 예제의 ID는

그것은 모두 같은 기사 입니다. 거기에 명확한 것은 없습니다.

 
알렉세이 비아즈미킨 :

같은 기사 입니다. 거기에 명확한 것은 없습니다.

이것은 모방입니다, 나는 원본에 대한 링크를 주었습니다

 
막심 드미트리예프스키 :

다양한 방법으로 시도할 수 있습니다.

여기 멋진 노트북이 있습니다. https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

복사 및 확인 가능

그래서 이것은 내가 러시아어로 본 기사의 원본입니다.

 
막심 드미트리예프스키 :

이것은 모방입니다, 나는 원본에 대한 링크를 주었습니다

그리고 감지하기 위해 - 모두 동일하게 정보가 없습니다 - 빼낸 코드.

 
알렉세이 비아즈미킨 :

그리고 감지하기 위해 - 모두 동일하게 정보가 없습니다 - 빼낸 코드.

모든 것이 잘 쓰여져 있습니다. 언밸런스한 클래스는 없지만 인위적으로 만든거라 그냥 둘러봐

 
막심 드미트리예프스키 :

모든 것이 잘 쓰여져 있습니다. 언밸런스한 클래스는 없지만 인위적으로 만든거라 그냥 둘러봐


"Tomek 링크" 방법은 단순히 선택 항목을 균등화하지 않는 것으로 나타났습니다. 0 행의 수를 4005에서 3402로 줄였기 때문에 작동하지 않는다고 생각했습니다.
 
알렉세이 비아즈미킨 :


"Tomek 링크" 방법은 단순히 선택 항목을 균등화하지 않는 것으로 나타났습니다. 0 행의 수를 4005에서 3402로 줄였기 때문에 작동하지 않는다고 생각했습니다.
네. 먼저 오버샘플링을 수행한 다음 볼륨을 수행해야 합니다.
 
막심 드미트리예프스키 :
네. 먼저 오버샘플링을 수행한 다음 볼륨을 수행해야 합니다.

오버 샘플링은 아직 아무 것도 제공하지 않지만 "볼륨"은 결과를 약간 향상 시켰습니다. 데이터에 무언가가 있음을 의미하며 가장 중요한 것은 올바르게 파는 것입니다.

시험 샘플에서 다양한 양자화 설정을 가진 모델의 히스토그램.