Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2215
Beklentilerini analiz etmek için CatBoost modelinin görselleştirilmesi konusuna geri döndüm.
Eğitim modeli şöyle görünür:
X ekseninde - lojistik fonksiyonun olasılığının değeri ve y ekseninde - 0,05 değer aralığı üzerindeki yüzde:
- Razdel (mavi) - seçimdeki tüm değerler.
- Hedef=1(magnetta) - hedef değerler 1
- Hedef=0(su) - hedef değerler 0
- Balans+ (açık yeşil) - tüm kar ve zararlara göre kârla sonuçlanan finansal sonuç, bu gösterge tabloya sığacak şekilde ölçeklenir
- Bakiyeler-(tuğla) - tüm kar ve zararlara göre bir kayıpla sonuçlanan mali sonuç, bu gösterge tabloya sığacak şekilde ölçeklenir
- Daireler terazinin ölçeklenmiş değeridir - x koordinatının sıfır değerinden sıfır değerine odaklanırız - netlik için yapılmıştır
Dikey çizgi aqua - maksimum değer Hedef=0
Dikey mıknatıs hattı - maksimum değer Hedef=1
Dikey çizgi kırmızıdır - netlik için CatBoost'ta varsayılan olarak 1 ve 0'a sınıflandırma için 0,5'in koşullu bölümü.
Sanırım su ve mıknatıs çizgileri kırmızı dikey çizgiden ne kadar uzaksa, model sınıfları o kadar kendinden emin bir şekilde ayırıyor. Denge çizgilerini de izlemeye değer, eğitim sırasında her iki tarafa da yayılırlar - bu özellikle kar ve zararın farklı değerlere sahip olabileceği modeller için geçerlidir, örneğin bir model küçük kayıpları iyi filtreleyebilir, ancak büyük kayıplarda kaybedebilir , ancak sınıflandırmaya göre doğruluk değeri 0,5'ten büyük olacaktır.
Ardından, test örneğine bakıyoruz
Dikey çizgilerin - kırmızı ve mıknatısın bir yakınsaması olduğu görülebilir, ancak göreceli konumları değişmedi, bu zaten iyi (mıknatıs <0.5 bölgeye giriyor). Denge çizgileri yaklaştı, bu biraz hayal kırıklığı yaratıyor. 0,5 olasılığından sonra, modelin yetersiz kalitesini gösteren bir kayıp alanı vardır.
Daha sonra sonuçları muayene örneğinde görebilirsiniz.
Sağ tarafta (olasılık 0,5'ten fazla), durum testten daha iyi görünüyor, bu, test örneğinin nadir bir olay olduğunu ve eğitim sırasında buna benzer birkaç örnek olduğunu veya modelin yeniden eğitilmediğini gösterebilir. İkinci varsayım, 0,5'ten küçük olasılık bölgesinde , olumlu finansal sonuçları gösteren Balans + denge çizgisinin , dairelere bakıldığında da görülebilen Balans- çizgisini geçtiği alanlar olduğu gerçeğiyle desteklenir, esasen belirli bir olasılık bölgesinde kâr ve zarar arasındaki deltayı gösterir.
Peki, muayene örneğindeki dengeye bir göz atalım.
Grafiğin 2/3'ünde görülebilecek şekilde pazarın doğasının değiştiği açıkça görülüyor - modeli eğitmeye devam etmelisiniz.
Ve işte açıkça kötü bir model örneği
Zaten test örneğinde, tüm vücudun güçlü bir sola kayması görülebilir, yani. model, örnek hakkında çok az şey biliyor - düşük hatırlama ve hedef 1 birikiminin zirvesi, olasılığın sol tarafının gerisinde kalıyor. Eğitimde hala bir kâr olduğunu belirtmekte fayda var.
Test ve muayene örneğine bakıyoruz
Zaten test örneğinde tüm çizgilerin 0,5 olasılığının ötesinde çok güçlü bir şekilde iç içe geçtiği görülebiliyor ve inceleme örneğinde denge çizgilerinin nasıl yer değiştirdiğini gözlemleyebiliyoruz.
Aslında boş bir ağım var (bunu yalnızca başlatılacak şekilde eğitiyorum çünkü kendi kendine yazılmış değil, bir paketten)
Herhangi bir soyutlama, herhangi bir hedef bulurum ve uygunluk yazarım. eğlence.
Sonra genetiğin ağın ağırlıklarını değiştirmesine izin verin, böylece trende ve testte (ağ) hedefime mümkün olduğunca yakın bir şey elde ederim.
Ve kendi etiketlerinizi oluşturmaktan ve regresyon veya sınıflandırmayı ayarlamaktan bin kat daha "derin".
Evet, ama sadece maksimumda denedim. kar, başka bir şey için eğitebilirsin
Dinle, eğer çok tembel değilsen, katbust'u maksimum kâr için eğitmeye çalış, orada böyle çalıştığından emin değilim.
aynı yerde hemen X - veri ve Y - hedefini göndermeniz gerekir
belki de tüm bu "özelleştirme" mevcut işlevlerde tamamen kozmetik bir değişikliktir.
Bence bu kadar büyük araştırmaları bloga atıp bir kopyasını da burada bırakmak daha iyi. Altı ay sonra, onu burada bulamazsın...
Belki - sadece blogu kullanmıyorum, bu yüzden bir şekilde böyle bir fikri ziyaret etmedim.
Tüm bu noktaları grafikten (eğri başına 20) örneğe doldurabileceğinizi ve öğrenmeye çalışabileceğinizi düşünüyorum - bu şekilde potansiyel kararlılığa sahip modelleri daha büyük bir olasılıkla tanımlamak mümkün olacaktır.
Belki - sadece blogu kullanmıyorum, bu yüzden bir şekilde böyle bir fikri ziyaret etmedim.
Tüm bu noktaları grafikten (eğri başına 20) örneğe doldurabileceğinizi ve öğrenmeye çalışabileceğinizi düşünüyorum - bu şekilde potansiyel kararlılığa sahip modelleri daha büyük bir olasılıkla tanımlamak mümkün olacaktır.
Hedef ne olacak? Örneklerin her biri nasıl etiketlenir? Yoksa kendi kendine öğretmek mi?
Hedef, inceleme örneğindeki modelin finansal sonucu olacaktır.
şimdilik yeni metrikler yazmak için çok tembel .. ve o zaman kesinlikle maksimum kâr olmayacak, ama daha anlamlı bir şey olacak
örneğin, Lyapunov kararlılığı ))
Size eşit bir alan, iyi veya yoğunluk verdi))) İşimizde bu nadirdir.
Beklentilerini analiz etmek için CatBoost modelinin görselleştirilmesi konusuna geri döndüm.
evet, dağılımlara göre genellikle her şey görünür. Bunları sadece işaretler \ hedef için destek olmadan yapabilir ve hemen görebilirsiniz