알고리즘은 재학습하지 않으며 모든 검증 샘플에서 결과가 테스트 샘플보다 낫거나 훨씬 좋으며 더 나빠진 것을 보지 못했습니다....
아쿠라시는 포레스트보다 평균 2~4% 더 우수하므로 포레스트가 0.58이면 RLT는 약 0.62입니다.
어쨌든 첫 번째 테스트에 따르면 알고리즘은 가치가 있지만 배우는 데 시간이 오래 걸립니다....
그들의 이론에 따르면, 잘 작동하는 "강한"특성이 몇 가지 있어야하며 문제는 나머지 "약한"특성과 분리하는 것입니다. 그들의 분야인 유전학에서는 아마도 그럴 것입니다. 하지만 우리의 상황은 분명히 다릅니다. 특성은 강도가 거의 같고, 종종 선형적이며, 시간이 지남에 따라 그 강도가 변할 수 있습니다.
일반적으로 유익한 특성을 선택하는 것이 문제였다면 산 산치는 그의 비법을 통해 오래 전에 1조 달러의 부자가 되었을 것입니다).
그들의 이론은 잘 작동하는 '강한' 특성이 몇 가지 있으며, 유일한 문제는 나머지 '약한' 특성과 분리하는 것이라고 가정합니다. 그들의 분야인 유전학에서는 아마도 이것이 사실일 것입니다. 그러나 우리의 상황은 분명히 다릅니다. 특성은 강도가 거의 같고, 종종 선형적이며, 시간이 지남에 따라 강도가 바뀔 수 있습니다.
일반적으로 유익한 특성을 선택하는 것이 문제였다면 산 산치는 그의 비법을 통해 오래 전에 억만장자가 되었을 것입니다).
글쎄요, 알고리즘은 실제로 작동하고 더 안정적이고 아쿠라시가 더 좋고 카파가 더 좋습니다... 즉, 더 잘 작동합니다 ...
그리고 1000 개의 새로운 관찰 후와 20,000 개의 관찰 후 모두 작동하며 오류는 동일하거나 더 좋습니다.
어떻게 검색하나요? 모든 청크(예: 100개씩 5000페이지)를 살펴보고 해당 모델의 다른 50만 개의 행이 얼마나 성공적으로 예측하는지 확인하시겠습니까?
예, 연속된 청크 대신 무작위로 샘플을 가져올 수 있습니다.
너무 웃어서 눈물이 날 지경이었어요)
나는 바드에게 러시아어로 글을 써달라고 부탁했는데 그는 실수로 썼습니다. 러시아어는 제 모국어가 아니며 본질적으로 여기서만 사용합니다...
그리고 그는 저에게 대답했습니다.)
이해하셨나요?
그는 나를 괴롭히기 시작했습니다)))
정말 잔인하네요))))
그는 당신을 트롤링하지 않습니다.
러시아어는 세르비아어로 "러시아어"입니다.
그래서 세르비아어로 편지를 쓰는 거예요.
그는 당신을 트롤링하는 것이 아닙니다.
러스키라고 쓰셨죠? 세르비아어로 '러시아어'를 뜻합니다.
그래서 그가 세르비아어로 편지를 쓰는 겁니다.
Ahh))))
나무와 나무의 강화 학습에 관한 흥미로운 기사입니다.
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4760114/
시장 데이터에서 알고리즘을 테스트했습니다...
알고리즘은 Forest에 비해 새로운 데이터에서 안정적으로 실행됩니다....
알고리즘은 재훈련되지 않았으며 모든 검증 샘플에서 결과가 테스트 샘플보다 낫거나 훨씬 좋으며 더 나빠진 것을 보지 못했습니다....
아쿠라시는 포레스트보다 평균 2-4% 더 낫습니다. 포레스트가 0.58이면 RLT는 ~ 0.62입니다.
어쨌든 첫 번째 테스트에 따르면 알고리즘은 가치가 있지만 배우는 데 시간이 오래 걸립니다....
홈메이드. 실험의 가능성은 무한합니다....
네. 홈메이드에 대해 논의할 필요가 없습니다.
왜 직접 만든 것에 시간을 낭비하나요? 수백만 명의 사용자가 실제로 사용하는 알고리즘을 가진 수십 가지의 비수제 알고리즘이 있습니다.....
시장 데이터로 알고리즘을 테스트했습니다.
알고리즘은 새로운 데이터에 대해 Forest....
알고리즘은 재학습하지 않으며 모든 검증 샘플에서 결과가 테스트 샘플보다 낫거나 훨씬 좋으며 더 나빠진 것을 보지 못했습니다....
아쿠라시는 포레스트보다 평균 2~4% 더 우수하므로 포레스트가 0.58이면 RLT는 약 0.62입니다.
어쨌든 첫 번째 테스트에 따르면 알고리즘은 가치가 있지만 배우는 데 시간이 오래 걸립니다....
그들의 이론에 따르면, 잘 작동하는 "강한"특성이 몇 가지 있어야하며 문제는 나머지 "약한"특성과 분리하는 것입니다. 그들의 분야인 유전학에서는 아마도 그럴 것입니다. 하지만 우리의 상황은 분명히 다릅니다. 특성은 강도가 거의 같고, 종종 선형적이며, 시간이 지남에 따라 그 강도가 변할 수 있습니다.
일반적으로 유익한 특성을 선택하는 것이 문제였다면 산 산치는 그의 비법을 통해 오래 전에 1조 달러의 부자가 되었을 것입니다).
그들의 이론은 잘 작동하는 '강한' 특성이 몇 가지 있으며, 유일한 문제는 나머지 '약한' 특성과 분리하는 것이라고 가정합니다. 그들의 분야인 유전학에서는 아마도 이것이 사실일 것입니다. 그러나 우리의 상황은 분명히 다릅니다. 특성은 강도가 거의 같고, 종종 선형적이며, 시간이 지남에 따라 강도가 바뀔 수 있습니다.
일반적으로 유익한 특성을 선택하는 것이 문제였다면 산 산치는 그의 비법을 통해 오래 전에 억만장자가 되었을 것입니다).
글쎄요, 알고리즘은 실제로 작동하고 더 안정적이고 아쿠라시가 더 좋고 카파가 더 좋습니다... 즉, 더 잘 작동합니다 ...
그리고 1000 개의 새로운 관찰 후와 20,000 개의 관찰 후 모두 작동하며 오류는 동일하거나 더 좋습니다.
표지판의 강도는 거의 동일합니다.
글쎄요, 여기서는 동의 할 수 없습니다.
이 알고리즘의 중요성
그래... 직접 만든 것에 대해 논의할 필요가 없습니다.
왜 홈메이드에 시간을 낭비하나요? 수백만 명의 사용자가 실제로 사용하는 알고리즘을 갖춘 수십 가지의 비수제 알고리즘이 있습니다.....
저는 패키지에 대해 논의하지 않고 아이디어에 대해서만 논의할 것을 제안합니다.
이러한 알고리즘에 포함되지 않은 것들, 즉 블랙박스를 실험하고 실행할 수 있기 때문입니다.
패키지에 대해서는 논의하지 않고 아이디어에 대해서만 논의할 것을 제안합니다.