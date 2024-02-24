Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2387
Açıklamadan anlamadıysanız, tam olarak neyin net olmadığı hakkında sorular sorun - daha iyi açıklamaya çalışacağım.
Ben de birkaç yıl önce aynısını yaptım ve anlamsızlığı değil, işçilik maliyetleri nedeniyle reddettim.
Aşağıda eski deneyin sonuçlarının bir tablosu var, iş şöyle devam ediyor:
1. Tahmin edicilerin sayısı 9 parçaya bölünmüştür.
2. Parçalar arası kombinasyonlar oluşturulur - 512
3. Ardından, her bir parçanın varlığı/yokluğu ile numunelerin ortalama olarak nasıl davrandığına dair bir değerlendirme yapılır.
4. Parçanın önemi hakkında bir varsayımda bulunulur (olumlu/olumsuz).
5. Önemli parçalar daha küçük parçalara ayrılır ve daha az önemli olanlar tek parça halinde birleştirilir (düzenli olmaları gerekmez)
6. Yeni 512 kombinasyon oluşturuldu
7. Numuneyi olumsuz etkileyen küçük bir parça bulunursa, sonucun iyileşmesi durana kadar ileri numaralandırmadan çıkarılır, o zaman atılan parçaları eklemeyi deneyebilir ve sonucu aynı şekilde analiz edebilirsiniz. Olumlu etkiler, aksine, bir gruba genelleştirilir.
Aşağıda, bu tür 32 yinelemeyle göstergelerin nasıl değiştiğine dair bir örnek verilmiştir.
Yöntem elbette geliştirilebilir, ancak bunun için deneyler ve sonuçlarının sonuçları gerekir.
Evet, iyileştirme pek çok kez değil, ancak sonuçlar, hangi tahmincilerin sonuç üzerinde daha iyi veya daha kötü bir etkiye sahip olduğunu ve neden olduğunu düşünmemize izin veriyor.
Ve, daha önce kullandığım numaralandırmadan daha hızlı olabileceği için, CatBoost istatistikleriyle çalışmayı ve tahmin edicileri (ve gruplarını) kaldırmayı/eklemeyi denemek istiyorum.
Başka bir artı, fazla tahmin edicinin nadir bölünmelerin ortaya çıkmasına yol açmasıdır ve eğitim dışındaki bir örnekte yaprak aktivasyonu çok nadir olabilir (bunu daha önce ekranda göstermiştim), bu da eğitimin kalitesini ve değerlendirmesini kasıtlı olarak azaltır.
Bu, her seferinde 1 ekleyerek tüm özellikleri kontrol etmekten daha iyi nasıl olabilir?
İlk olarak, 1 özellik üzerinde 1000 kez (kontrol edilecek 1000 özellik ile) eğitim aldılar, en iyisini buldular. Daha sonra en iyi özellikte 999 kez ve kalan 999 kez ikinci en iyiyi seçtiler. Sonra en iyi 2'ye ve kalan 998'in üçüncüsüne vb.
Sadece 2 iç içe döngü.
Az sayıda özelliğe sahip modeller çok hızlı öğrenir. Makul bir sürede en iyi 20-30 parçayı toplayacaksınız. Evet ve 10-20 seçili özellikten sonra, modeller genellikle gelişmeyi durdurur, onlardan sonra yeni özellikler eklemek yalnızca sonucu kötüleştirir.
Yapıcı bir tartışma olmayacağı açıktır - özü anlama arzusu yoktur.
En iyisini değil, birbirleriyle kombinasyonlarını aramak gerekir - sorun tam olarak budur. Neden bir problem - çünkü tüm kombinasyonları sıralamak imkansız, bu yüzden buluşsal bir yönteme ihtiyaç var. Başka bir problem, farklı tahmin edicilerin ayrıldıktan sonra potansiyel güçlü benzerliğidir ve bu, topluluklarda, esasen ilişkili birçok yaprak olacağından, olasılığın olduğundan fazla tahmin edilmesine yol açacaktır.
Neden saçmalık?
Bu gelişmeyi sağlar - evet yapar.
Teorik bir gerekçe var - evet var.
Tabii ki, bu gelişme bir büyüklük sırası değildir.
Ve evet, tahmin edicileriniz için çok etkili olmayabilir - burada reddetmenin mantığını kabul edebilirim.
En iyisini değil, birbirleriyle kombinasyonlarını aramak gerekir - sorun tam olarak budur. Neden bir problem - çünkü tüm kombinasyonları sıralamak imkansız, bu yüzden buluşsal bir yönteme ihtiyaç var. Başka bir problem, farklı tahmin edicilerin ayrıldıktan sonra potansiyel güçlü benzerliğidir ve bu, topluluklarda, esasen ilişkili birçok yaprak olacağından, olasılığın olduğundan fazla tahmin edilmesine yol açacaktır.
İlk en iyi özelliği seçtikten sonra, birincisi ile birlikte en iyi etkileşime sahip ikincisi seçilecektir, vb. 10'a bastığınızda. Bir sonraki, daha önce seçilenlerden herhangi biriyle, ancak büyük olasılıkla hepsiyle en iyi etkileşim içinde seçilecektir.
modelden düşük içe aktarmaya sahip özellikleri kaldırın ve kırın, ardından parmağınızla (diğer özellikler) iyi karşılaştırın, vb. bir daire içinde