Maxim Dmitrievsky #: 규칙에 관한 글을 쓰고 싶지 않으셨나요, 아니면 마음이 바뀌었나요? 테스트 기능을 최소화하는 것보다 더 흥미로운 주제일 수도 있습니다. 아니면 OOS에서 유효성 검사에 문제가 있나요? 아니면 문제는 없지만 글쓰기가 게으른 것일 수도 있습니다.
글쎄요, 쓸 게 없네요.
나무 모델을 규칙으로 깨는 방법을 작성하겠습니다.
사실, 제 게시물에 이미 모든 것이 나와 있습니다.
아니면 제 이전 게시물을 언급하는 건가요? 그렇다면 분할에서 나는 슈퍼 치유 속성을 찾지 못했고 모델에 줄 수없는 장점이 있습니다.
1. 모델의 차원을 크게 줄일 수 있습니다.
2. 각 규칙의 통계를 알 수 있습니다 (이것은 정말 중요합니다).
예를 들어 100개의 규칙이 있는 나무 모델이 있는데 각 규칙이 100개의 규칙 내에서 한 번 작동했는지(패턴이 없음) 또는 10개의 규칙이 50번 작동했는지(패턴이 있음)를 알 수 없습니다.
Maxim Dmitrievsky #: 트리에서는 일반적으로 각 특성에 대한 각 관찰의 영향력, 예를 들어 모양 값을 통해 모델에 대한 기여도를 계산할 수 있습니다. 유용한 것만 남기고 그것에 대해서만 무언가를 훈련하면 대략적인 규칙 검색과 유사한 결과를 얻을 수 있습니다. 그런데 뉴런을 사용하는 것도 가능합니다.
규칙만이 유일한 유용한 규칙이 될 수 있는 경우는 이해하기 어렵습니다. 아마도 결과의 해석 가능성 때문일 것입니다. 모양 값도 좋은 해석 가능성을 제공하지만, 일종의.
오차가 이미 감소를 멈추었거나 0과 같으면 나머지 예제를 근접성 척도에 따라 패턴으로 나눌 수 있습니다.) 예를 들어 클러스터링입니다. 그리고 몇 개가 남았는지 세어보세요. 그리고 각 패턴/클러스터에 대한 평균 조건을 작성하면(클러스터의 중심을 취하면) 출력 규칙을 얻을 수 있습니다.
규칙에 관한 글을 쓰고 싶지 않으셨나요, 아니면 마음이 바뀌었나요? 테스트 기능을 최소화하는 것보다 더 흥미로운 주제일 수도 있습니다. 아니면 OOS에서 유효성 검사에 문제가 있나요? 아니면 문제는 없지만 글쓰기가 게으른 것일 수도 있습니다.
글쎄요, 쓸 내용이 없어요.
트리에서는 일반적으로 각 특성에 대한 각 관찰의 영향력, 예를 들어 모양 값을 통해 모델에 대한 기여도를 계산할 수 있습니다. 유용한 것만 남기고 그것에 대해서만 무언가를 훈련하면 대략적인 규칙 검색과 유사한 결과를 얻을 수 있습니다. 그런데 뉴런을 사용하는 것도 가능합니다.
각 기능의 영향, 각 관찰의 영향, 각 규칙의 영향은 모두 다릅니다.
규칙은 속성과 레이블을 연결하는 모델의 요소입니다. 신경망에는 불연속성이 없지만 인위적으로 만들 수 있다는 점만 다릅니다.
하바롭스크에서 시도해 보겠습니다...
모든 모델은 패턴의 특정 합계이며, 과장되게 말하면 패턴을 TS로 분류할 수 있습니다.
한 모델이 100개의 TC로 구성되어 있다고 가정해 봅시다.
모델 #1에서는 100개의 TC가 하나의 거래를 했을 수 있습니다.
패턴 2에서는 한 TS가 100건의 거래를 했고 나머지 99개는 단 한 건의 거래도 하지 않았을 수 있습니다.
각 TS에 대한 통계는 어떻게 계산 하나요?
모델이 규칙 모델인 경우 쉽고 명확합니다.
모델이신경 모델이라면?
하바롭스크 근처에서 시도해 볼게요.
모델이 뉴런인 경우?
뉴로닉스가 잘 예측하는 하위 샘플이 있는데, 그 하위 샘플이 하나의 패턴인지, 두 개인지, 20개인지 어떻게 알 수 있나요? 정말 그 차이를 모르시나요?
남은 예제 수로 계산합니다. 패턴의 수만큼 많은 예제가 있습니다.
예는 200개, 패턴은 5개만 있을 수 있습니다.