Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1264

 

Michael Marchukajtes :

Ormanda dolanan Maksim, hala bir çıkış yolu bulamıyor mu? işler....

Uzun zamandır burada olmadığımı itiraf ediyorum, her şey iş, endişeler .... Sonra hemen içeri girmeye karar verdim. Tabiri caizse not edilecektir :-) Bu arada ....

Kutsal bir yer asla boş değildir. Maksimka Ukurok vardı, Maksimka Poludurok vardı)))


 
Sihirbaz_ :

Kutsal bir yer asla boş değildir. Maksimka Ukurok vardı, Maksimka Poludurok vardı)))


Pekala, sen sadece bir geyiksin hayatta iyi bir gün ve durumunu değiştirmiyorsun

kız sekreter
 
Maksim Dmitrievski :

Pekala, sen sadece bir geyiksin hayatta iyi bir gün ve durumunu değiştirmiyorsun

kız sekreter

OO, Öğretmen))) "Modeller" ile aynı. Geyik nerede, kız nerede, 0 nerede,
ve 1 ... hiçbir şekilde tanımlanmadığında, her şey bir yığında))) ölüyorum ...

 
Sihirbaz_ :

OO, Öğretmen))) Modellerde aynı. Geyik nerede, kız nerede, 0 nerede,
ve 1 ... hiçbir şekilde tanımlanmadığında, her şey bir yığında))) ölüyorum ...

Uzun süre nasıl cevap vereceğimi düşündüm, 10 dakikadan fazla .. başka bir sefer için özel hazırlanmış, hazırlanmış ekran görüntüleri, endişeli

Muhteşem bir görünüm için bir bok yığınından yeniden doğmanız gerektiğini anlıyorum, sonra kendinizi iyi hissediyorsunuz))

peki, hoşgeldin)))

 
Maksim Dmitrievski :

öğrenme oranı iyidir, kullanımdaki yanıt ve yapının yükleme süresi zayıftır, çünkü orman dosyaları büyüktür. 300 mb'ye kadar çıktım.

serileştirmede bir sorun var. Orman daha sonra dosyadan geri yüklendiğinden daha hızlı eğitilir ve kaydedilir.

Ormanın artık daha küçük dosyalar oluşturduğunu söylüyorsa, bu çok büyük bir ivmedir.

NS, aksine, öğrenmesi daha uzun sürer, ancak yanıt anındadır. Sınıflandırmanın kalitesinde bir fark yoktur. Her şeyi kullanabilirsiniz, ancak kutudan çıkan orman çalışır ve Ulusal Meclis'in yapılandırılması gerekir.


Güncellemenin açıklamasında orman hakkında yazılan her şey:
önceki sürüme göre 2 kattan 10 kata kadar daha hızlı olan ve büyüklük sıraları daha küçük ormanlar üreten gelişmiş rastgele orman oluşturma algoritması.

Eski sürümde veri yapısı şöyledir:

//--- düğüm bilgisi:

//--- W[K+0] - değişken sayı (yaprak modu için -1)
//--- W[K+1] - eşik (yaprak düğüm için sınıf/değer)
//--- W[K+2] - ">=" dal dizini (yaprak düğüm için yok)

Yenisinde, düğüm için aynı 3 değişken ve yaprak için 2 değişken saklanır.
Ve ağaç tamamen aynı şekilde inşa edilmiştir - 0. hata ile son örneğe kadar. Budama görmedim.
Hızlanma ile ilgili koda yapılan yorumlarda gördüğüm tek şey
SplitStrength - bölünmüş tip:
* 0 = rastgele konumda bölün, en hızlı olanı
* 1 = aralığın ortasında bölünür (ortada bölünür)
* 2 = aralığın en iyi noktasında güçlü bölünme (varsayılan) (çeyreklere bölünür)

Görünüşe göre rastgele bölme ile 2-10 katlık bir ivme elde ediliyor ve bölme için en iyi noktalar bulunup sonuç olarak daha kompakt bir ağaç elde edilebiliyor.

F-inci bölüme rastgele bir nokta seçimini basitçe ekleyebilirsiniz. 2-3 satırda düzenleme)))

 
elibrarius :

İngilizceyi çok iyi bilmiyorum.
Orman hakkında yazılanların hepsi:
önceki sürüme göre 2 kattan 10 kata kadar daha hızlı olan ve büyüklük sıraları daha küçük ormanlar üreten gelişmiş rastgele orman oluşturma algoritması.

Eski sürümde veri yapısı şöyledir:

//--- düğüm bilgisi:

//--- W[K+0] - değişken sayı (yaprak modu için -1)
//--- W[K+1] - eşik (yaprak düğüm için sınıf/değer)
//--- W[K+2] - ">=" dal dizini (yaprak düğüm için yok)

Yenisinde, aynı 3 değişken düğüm için ve 2 yaprak için saklanır.
Ve ağaç tamamen aynı şekilde inşa edilmiştir - 0. hata ile son örneğe kadar. Budama görmedim.
Hızlanma ile ilgili koda yapılan yorumlarda gördüğüm tek şey
SplitStrength - bölünmüş tip:
* 0 = rastgele konumda bölün, en hızlı olanı
* 1 = aralığın ortasında bölünür (ortada bölünür)
* 2 = aralığın en iyi noktasında güçlü bölünme (varsayılan) (çeyreklere bölünür)

Görünüşe göre rastgele bölme ile 2-10 katlık bir ivme elde ediliyor ve bölme için en iyi noktalar bulunup sonuç olarak daha kompakt bir ağaç elde edilebiliyor.

onlar. Şimdi bölümleme yöntemi yapılandırılabilir mi? Ama varsayılan hala en yavaş

Eh, o zaman kendin yeniden yapabilirsin, evet :)

 
Maksim Dmitrievski :

onlar. Şimdi bölümleme yöntemi yapılandırılabilir mi? Ama varsayılan hala en yavaş

Eh, o zaman kendin yeniden yapabilirsin, evet :)

Sadece terminal güncellenirken tüm düzenlemelerin üzerine yazılacağından korkuyorum. Forest sınıfının bir kopyasını alıp ayrı bir dosyada tutmak gerekiyor.
 
elibrarius :
Sadece terminal güncellenirken tüm düzenlemelerin üzerine yazılacağından korkuyorum. Forest sınıfının bir kopyasını alıp ayrı bir dosyada tutmak gerekiyor.

evet veya arşivleyiciyi kaydet

peki o zaman deneyelim hocam aldığınız için teşekkürler işe yarar

Belki aynı şekilde Bayes ağaçları da vidalanabilir, eğer anlarsan
 
elibrarius :

Bu yüzden burada bir şeyi değiştirmeyi deneyebileceğinizi fark ettim.

 //+------------------------------------------------------------------+
//| Makes split on attribute                                         |
//+------------------------------------------------------------------+
static void CDForest::DFSplitC( double &x[], int &c[], int &cntbuf[], const int n,
                               const int nc, const int flags, int &info,
                               double &threshold, double &e, double &sortrbuf[],
                               int &sortibuf[])
 
Maksim Dmitrievski :

Bu yüzden burada bir şeyi değiştirmeyi deneyebileceğinizi fark ettim.

Evet. Pekala, onu DFSPlitR'de çoğaltın, böylece regresyon ormanları da benzer işlevselliğe sahip olur

Neden: