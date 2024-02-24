Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1279
Anlamak ve yayın yapmak iki farklı şeydir. Hala deneme yapıyorum. Şimdi tahmin edicileri karıştırıyorum. Belki de Ulusal Meclis'i gürültüyle baş edemediğim için terk ettiğim gibi onu da terk edeceğim.Ve bunu anlamak kolaydır. Koda birkaç saat bakmak gerekiyor ve her şey netleşecek.
Evet tabi bunlar farklı şeyler ama hünerli eller çok şeye muktedirdir! Başka birinin kodunu anlamak benim için zor, bu yüzden içeri girmiyorum bile.
Ve orman, olduğu gibi, konseptine göre, her zaman gürültü yapacaktır (aslında, beyaz gürültü, daha güvenli toplu tepkilerle gürültü ile örtüşmelidir), çünkü nitelik nedeniyle değil, nicelik nedeniyle işe yaradığını düşünüyorum. ağaçların kalitesini ve benzersizliğini bir şekilde kontrol etmek gereklidir.
Ağaçlardan yaprak toplama fikrimden neden hoşlanmadığınızı anlamıyorum - ve sonra gerçekten bir oylama düzenlemek istiyorsunuz ya da tam tersine, yaprakları dağıtmayacak şekilde dağıtmaya çalışıyorsunuz. örnekte örtüşme ... açıkça daha az gürültü var, ancak kuralın sayfada olması önemlidir, gerçek bir anlamı vardır, o zaman zamanla kararlı olacaktır.
Henüz ormanı keşfetmedim. Yani başka bir şey için zaman yok.
Açık. Anlayın, başarılarınız hakkında yazın - ilginç.
Şimdi, daha derin öğrenme için bir havuz oluşturmak ve 100-300 ağacın altında derin öğrenmede herhangi bir nokta olup olmadığını değerlendirmek için az sayıda ağaç 1-30 olan CatBoost'tan böyle garip modeller deniyorum.
Numunenin ilk kısmının (mavi renkle vurgulanmış, ancak gerekenden biraz fazla, son dengenin yüksek bir dökümünü de gösterdiğinden, uzun zaman aldığını söylüyorlar) ilginçtir, uygulandıktan sonra eğitim için çok vasat görünüyor. model ve daha sonra model tarafından kullanılmaya başlayan bir tür kalıp vardır, test örneğinde (modelin seçildiği) bu, sınav örneğindeki (eğitime katılmayan) kadar açık değildir. Belki de bu bir undertraining işaretidir, aşırı antrenmandan daha mı iyidir, soru bu.
İlgilenen varsa, benim gibi python'da ustalaşmamış olan toplu iş dosyaları, bir seçim, komut satırı aracılığıyla başlatma ayarları gönderebilirim.
Dakika başına bir seçenek veriyorum ve test cihazının işlem raporunu ekliyorum.
Gerçek performans biraz arttı.
Sharpe oranı şu an 0.29.
Son olarak, permütasyon hesaplandı ve 1 tahmin edicinin kaldırılmasıyla ormanın fiili yeniden hesaplanması. Sonuçlar hiç de benzer değil.
Permütasyonun yazarları 6 öngörücü ile deney yaptı ve ben 65 ile denedim. Belki de 6 öngörücüde gürültü girdisini ayırmak daha kolaydır. Ayrıca, orman hala rastgele, belki bu da önem listesinin rastgeleliğine eklendi.
Şimdi yine aynı veriler üzerinde çalıştıracağım ve sabah 4 önemli tabloyu karşılaştıracağım.
En benzer olanı, 2 permütasyon önemi tablosuydu (sadece aynı veriler üzerinde farklı çalışmalardan).
1 tahminci silinirken orman yeniden hesaplanarak elde edilen önem tabloları birbirine veya permütasyona benzemez.
O tektir, ancak burada yalnızca test edici kaseler bulunur ve Damatın Çırağı ve şirketi Marleson balesinden sorumludur :)
