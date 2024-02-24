Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2255
Sınavda nadir görülen bir aktivasyon, daha ziyade pazarın değiştiği ve trende sık sık olanların artık olmadığı anlamına gelir. Ve trende birkaç yaprak aktivasyonunun olması gerekli değildir.
Evet, pazar değişikliği etkisinin de olduğuna katılıyorum.
Trene bakalım.
Durum biraz daha iyi, ancak nadir sayıda aktivasyona sahip yapraklar da var.
Eğitimin nasıl gerçekleştiğine dikkat edin - büyük bir ağırlığa sahip bir ağaç inşa edilir - şartlı olarak başarılı ve sonra küçük ağırlıklara sahip bir set ve sonra tekrar büyük bir - böyle bir pasta ve küçük ağırlıklarla çizgileri kaldırırsanız, sonra bir olasılık kayması elde edersiniz.
Acaba bu diyagram üzerinde yeni bir model eğitirsek ne olacak?
Genel olarak, fikir, ikinci modeli birincinin "iç kısımları" üzerinde eğitmektir.
neden bu karbüratörü seçiyorsun? iyi çalışıyor. Bununla hiçbir şeyi iyileştirmeyeceksin.
Sorunun ne olduğunu anlarsanız, bir çözüm arayabilirsiniz. Açıkçası, bu tür ağaçların dezavantajları vardır.
Ama ne yazık ki değişiklik yapmak için CatBoost kodunu anlamayacağımı kabul ediyorum.
Bununla birlikte, modeli etkilemek mümkündür, belki yapraklardaki nadir örneklerin sıfırlanması olumlu bir etki verecektir, ancak yaprakların katsayılarının daha sonra yeniden tartılması arzu edilir - bu daha zordur, ancak küresel olarak çözülebilir.
yaprakları olmayan basit bir sinir ağı alın. Güçlendirme kadar yeni veriler üzerinde de kötü çalışacak. Ne diyor?
Fazla uydurma bir etki olacağına katılıyorum, ancak farklı bir doğaya sahip - soru, bu etkilerden hangisinin daha doğru bir şekilde tanımlanıp değerlendirilebileceği ve hangisinin daha kolay ele alınabileceğidir.
özellikleri seçmek ve yorumlamak için harika bir SHAP aracı var, ancak python'da. Her şey zaten sizin için yapıldı)
Aslında bu yöntemlerin büyük çoğunluğu modellerde tahmin edicilerin kullanımından bahsetmekte, kendileri hakkında herhangi bir değerlendirme yapmamaktadır. Modelden bağımsız tahmin edici tahminlere ihtiyaç var - üzerinde çalışıyorum, mütevazı olumlu sonuçlar var.
Tabii ki, hazır çözümleri python veya R'de bükmek istiyorum, ancak yeni sözdiziminde ustalaşacağım konusunda şüpheler var.
Bu model eski tortulardan bir örnekte, şimdi modellerimde 60k yaprak var, ki bu elbette örnekleme için çok fazla. Ağaç sayısını önemli ölçüde azaltmayı denemek mümkündür. Ancak, CatBoost'un yapraklarını değerlendirdiğimi ve genetik ağacın yapraklarına kıyasla bireysel olarak özelliklerinde çok zayıf olduklarını not ediyorum.
Eğittiğim genetik ağacın yapraklarında (binlerce yaprak) - ölçümleri iyileştirebilirsiniz.
özelliklerin belirli bir modelin davranışı üzerindeki etkisini değerlendirir
1 eklemenin (veya 1 çıkarmanın) en iyisi olduğu sonucuna vardık. İşte araştırmam. Muhtemelen zaten görmüşsünüzdür.
Daha önce görmedim - baktım - genel olarak gerçek etkinin çıkarılmasıyla elde edilebileceğine katılıyorum. CatBoost, bir tahmin ediciyi kaldırmak için bir yönteme ve onsuz bir modeli yeniden ağırlıklandırmaya benzer bir yönteme sahiptir, ancak ben bunu çözemedim. Şimdiye kadar, kendimi tahmin edicileri eklemek ve hariç tutmakla sınırladım, ancak bir değil, gruplar.
Bundan bahsediyorum ve değerlendirmenin ortaya çıkan modelden geçtiğini söylüyorum.
ve bu iyi
yeni verilerde hangi işaretlerin bozulduğunu görebilirsiniz
xs ... belki deneyim yüzünden, ya da belki de yumruk attığım için ...)
ama bana öyle geliyor ki sen bundan muzdaripsin ..)