혼돈에 패턴이 있을까요? 찾아보겠습니다! 특정 샘플의 예에 대한 머신 러닝. - 페이지 12

 
elibrarius #:

테스트에서 가장 우수한 모델을 기준으로 이러한 모델을 선택하나요?

아니면 시험에서 가장 우수한 모델 중에서 시험에서도 가장 우수한 모델을 선택하나요?

구체적으로 시험에서 최고를 기준으로 선정했습니다.

 
Aleksey Vyazmikin #:

특히 시험에서 가장 우수한 학생을 선발하는 방식으로 진행되었습니다.

저도 시험에서 최고를 보였습니다. 실제 거래에 들어가기 전에는 시험이 없습니다. 또는 오히려 실제 돈을위한 것입니다....

이제 나는 앞으로 발킹하여 표지판을 선택했습니다 (10000에서 5000까지 그리고 당신과 같은 하나의 트레이와 하나의 테스트), 시험에서 둘 다 병합됩니다.

시험에서 어떻게 든 선택을 수행해야하므로 시험에서 학습 가능성이 보존됩니다.

 
elibrarius #:

시험에서도 최고를 보여줬습니다. 실제 거래에 들어가기 전에는 시험이 없습니다. 또는 오히려 실제 돈으로 할 것입니다....

이제 나는 앞으로 발킹하여 표지판을 선택했습니다 (10000에서 5000까지 그리고 당신과 같은 하나의 트레이와 하나의 테스트), 시험에서 둘 다 병합됩니다.

시험에서 어떻게 든 선택을 할 필요가 있으므로 시험에서 학습 가능성이 보존됩니다.

현재로서는 안타깝게도 올바른 선택의 확률 만 높일 수 있습니다. 그래서 평균 정확도가 충분하고 평균 수익을 얻을 수 있기를 바라면서 한 번에 많은 모델을 선택할 때 일괄 거래를 고려하고 있습니다.

 
수십만 개의 기능 중에서 작동하는 기능을 찾은 다음 그 기능이 작동하는 이유를 이해해야 합니다. 그런 다음 무차별 대입이 아닌 최적의 하이퍼파라미터를 선택하여 다른 TC를 작성해야 합니다.
그렇지 않으면 시험에 따라 수백 가지 모델 중에서 선택해야 할 때 여전히 적합성이 있는 것으로 판명될 것입니다.
가장 중요한 것은 적어도 대략적으로나마 기능이 작동하는 이유를 이해하는 것입니다. 그런 다음 기능을 개선하거나 레이블을 지정할 수 있습니다.

불분명한 모델을 많이 쌓아두는 것도 좋은 생각이 아닙니다. 알 수 없는 많은 것들을 다시 학습해야 하기 때문입니다.

무차별적인 기능 선택을 통해 좋은 기능을 선택한 다음 그 기능이 왜 작동하는지에 대해 숙고해야 합니다. 그러면 다음에 어디로 가야 할지 명확해질 것입니다. 무차별 대입 자체는 TC 준비에 효과적이지 않으므로 탐색적인 용도로 사용해야 합니다.
 
Maxim Dmitrievsky #:
수십만 개의 기능 중에서 작동하는 기능을 찾은 다음 그 기능이 작동하는 이유를 이해해야 합니다. 그런 다음 무차별 대입이 아닌 최적의 하이퍼파라미터를 선택하여 다른 TC를 작성해야 합니다.
그렇지 않으면 시험에 따라 수백 가지 모델 중에서 선택해야 할 때 여전히 적합성이 있는 것으로 판명될 것입니다.
가장 중요한 것은 적어도 대략적으로나마 기능이 작동하는 이유를 이해하는 것입니다. 그런 다음 기능을 개선하거나 레이블을 지정할 수 있습니다.

불분명한 모델을 많이 쌓아두는 것도 좋은 생각이 아닙니다. 알 수 없는 많은 것들을 다시 학습해야 하기 때문입니다.

무차별적인 기능 선택을 통해 좋은 기능을 선택한 다음 그 기능이 왜 작동하는지에 대해 숙고해야 합니다. 그러면 다음에 어디로 가야 할지 명확해질 것입니다. 무차별 대입 자체는 TC 준비에 효과적이지 않으며, 탐색적인 것으로 간주해야 합니다.
저도 동의합니다. 프로세스에 대한 이해는 다양한 각도에서 달성할 수 있습니다)
 
Maxim Dmitrievsky #:
수십만 개의 기능 중에서 작동하는 기능을 찾은 다음 그 기능이 작동하는 이유를 이해해야 합니다. 그런 다음 무차별 대입이 아니라 최적의 하이퍼파라미터를 선택하여 다른 TC를 작성해야 합니다.
그렇지 않으면 시험에 따라 수백 개의 모델 중에서 선택할 때 여전히 적합성이 있는 것으로 판명될 것입니다.
가장 중요한 것은 적어도 대략적으로나마 기능이 작동하는 이유를 이해하는 것입니다. 그런 다음 기능을 개선하거나 기능에 대한 레이블을 개선할 수 있습니다.

모호한 모델을 많이 넣는 것도 좋은 생각이 아닙니다. 그러면 알려지지 않은 많은 것들을 다시 교육해야 하기 때문입니다.

무차별적인 기능 선택을 통해 좋은 기능을 선택한 다음 그 기능이 왜 작동하는지에 대해 숙고해야 합니다. 그러면 다음에 어디로 가야 할지 명확해질 것입니다. 무차별 대입 자체는 TC 준비에 효과적이지 않으며, 탐색적인 것으로 간주해야 합니다.

요점은 예측기 효율성의 이유를 이해하는 작업이 매우 어렵고 시장 행동 해석 분야에 놓여 있거나 더 신뢰할 수있는 접근 방식이 있다는 것입니다. 게다가 예측자는 기본 요소이기 때문에 그룹으로 작동하며, 그룹에서 작동하는 예측자를 하나로 모으는 방법은 간단한 문제가 아니며, 지금까지는 의사 결정 트리를 사용하는 것이 분명합니다. 그리고 효과적인 의사 결정 트리를 구축하려면 샘플을 크게 줄이고 효과적인 관계를 형성하는 것으로 추정되는 예측자 만 이미 더 잘 공급해야합니다. 그리고 여기서 모델 검색 방법은 모델이 원칙적으로 예측자의 일부만 사용하기 때문에 매우 유용 할 수 있습니다.

적합성 또는 적합하지 않음 - 모든 확률에 맞는 행동은 적합하다고 생각합니다. 또 다른 한 가지는 예측자에 대한 이러한 확률 분포의 이력이 반복되거나 오랜 기간 동안 잊혀질 수 있다는 것입니다. 그리고 여기서 이러한 단계의 전환을 결정하는 방법을 갖는 것이 중요합니다.

 
Aleksey Vyazmikin #:

아래 설정을 사용하여 CatBoost로 즉시 호출되는 것을훈련하고 시드 무차별 대입으로 이 확률 분포를 제공합니다.

1. 샘플링 기차

2. 테스트 선택

3. 시험 샘플

보시다시피 이 모델은 거의 모든 것을 0으로 분류하는 것을 선호하므로 실수할 가능성이 적습니다.

알렉세이, 훈련은 본질적으로 적합하지 않나요?

 
Renat Akhtyamov #:

알렉세이, 훈련은 본질적으로 피팅이죠?

기본적으로 그렇습니다.

테스터에서의 최적화는 알고리즘이 작동하는 메트릭을 변경하는 것이고, MO 방법(트리 및 그 변형, NS)의 학습은 메트릭의 이력을 평가하고 해석하여 알고리즘을 변경하는 것입니다.

공생, 대단하겠군요.....

 
Renat Akhtyamov #:

알렉세이, 훈련은 본질적으로 피팅이죠?

학생들을 가르치는 것도 기존 지식에 지식을 맞추는 것입니다.)

 
Aleksey Vyazmikin #:

예측자 성과에 대한 이유를 이해하는 작업은 매우 어렵고, 시장 행동을 해석하는 영역에 속하며, 더 강력한 접근 방식이 있을까요? 게다가 예측자는 기본 요소이기 때문에 그룹으로 작동하며, 그룹에서 작동하는 예측자를 한데 모으는 방법은 간단한 문제가 아니며, 지금까지는 의사 결정 트리를 사용하는 것이 분명합니다. 그리고 효과적인 의사 결정 트리를 구축하려면 샘플을 크게 줄이고 효과적인 관계를 형성하는 것으로 추정되는 예측자 만 이미 더 잘 공급해야합니다. 그리고 여기서 모델 검색 방법은 모델이 규칙적으로 예측자의 일부만 사용하기 때문에 매우 유용 할 수 있습니다.

적합성 또는 적합하지 않음 - 모든 확률에 맞는 행동은 적합하다고 생각합니다. 또 다른 한 가지는 예측자에 대한 이러한 확률 분포의 이력이 반복되거나 오랜 기간 동안 잊혀질 수 있다는 것입니다. 그리고 여기서 이러한 단계의 전환을 결정하는 방법을 갖는 것이 중요합니다.

5~10명의 소규모 그룹으로 훈련합니다.

1-3이 더 좋습니다.

그들 중 누구도 아무것도 생산하지 않는다면 그들 사이의 신화적인 연결에 대해 이야기하는 요점은 무엇입니까? 쓰레기 + 쓰레기 ...

사유: