이해하지 못했습니까? 전송 규칙에서 결과 proebrazovaniya를 받고 싶습니까?
물론, 그렇지 않으면 나중에 모델을 어떻게 적용합니까? :)
)))))) 모든 알고리즘을 μl 단위의 P로 다시 작성하면 규칙의 모든 변환을 μl) 단위로 얻을 수 있습니다.
이러한 유형의 클러스터링은 클러스터링을 반복하지 않고 결과를 재현할 수 있는 규칙을 생성하지 않는다는 것을 깨달았습니다. 그리고 클러스터링이 너무 느립니다. 따라서 몇 가지 기준에 따라 클러스터링 결과를 해당 클래스로 나누는 트리를 구축하여 규칙을 만들어야 합니다.
질문이 있음을 의미합니다 - 각 클래스에 라인의 액세서리를 csv로 저장하는 방법은 무엇입니까?
이상하지만 이미 존재하는 데이터로 계속 클러스터링하고 클래스 중 하나에서 새 줄 을 정의할 수 없거나 가능한 이유는 무엇입니까?
k = kmeans(data, centers = 7 ) data = k$cluster
data(mtcars) mt.k <- kmeans(mtcars, centers = 4 ) mt.k$centers
결과를 특정 열로 롤링하는 방법을 이해하지 못합니까?
이 그림은 이전과 동일한 예측 변수이지만 샘플 크기가 다르며 가장 중요한 것은 새로운 예측 변수가 추가되었다는 점입니다.
그리고 여기 그것을 해석하는 방법이 있습니다 - 재훈련 경향?
클러스터링을 사용하여 모든 곡선에 적합합니다. 연락하다
도대체 왜 그런 조잡한 알고리즘이 거의 즉시 새로운 데이터에 쏟아지기 시작하는 걸까요?
나는 다시 배우는 나무를 비난한다. 부스트를 사용하고 싶지만 mql로 빠르게 전송할 수 없습니다.
Phah .. 여기에 답이 있습니다
한 기간 동안 모델을 훈련한 다음 데이터의 akuras를 차례로 살펴보면(다시 클러스터링됨) 트리의 경우 다음과 같습니다.
train은 훈련 데이터 세트 + 유효성 검사입니다.
새 날짜는 일반적으로 새 클러스터의 새 데이터입니다. 트리가 유효성 검사에서는 잘 작동했지만 새 작업에서는 실패했습니다.
동일한 데이터에 대한 catboost를 살펴봅니다.
TRAIN DATA: 0.9304589707927677 0.8916666666666667 NEW DATA: 0.8528265107212476
뭐야? 그런 차이?
모든 것을 단계별로 확인할 때까지 농담이 무엇인지 즉시 이해하지 못할 것입니다.
맞아, 나는 나무를 탓했다. 나는 그것이 그렇게 간단한 일을 할 수 있다고 생각했지만, 그렇지 않았다.
파심 컷버스트...
