Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1278

 
elibrarius :

Maxim'in bulduğu permütasyona benzer bir şey. Ancak, 0,1'den 0,2'ye değişen değerlere sahip bir tahmin edici yerine 800'den 300000'e bir değişiklikle bir tahmin ediciyi değiştirmek mantıklı mı? Değil!

Ama çizgilerini karıştırmak için - var. Sayı aralığı ve olasılık dağılımı korunacak, ancak her örnekteki değerler rastgele olacaktır.

Evet, gerçekten bir şeye benziyor, muhtemelen bu fikir ortaya çıktı. Tahmin ediciyi değiştirmek için sorunun ne olduğunu anlamadım, çünkü hattaki her tahmin edicinin kendi göstergeleri vardır, ayrıca, bu değerlerin arıza ızgarasını bir şekilde kaydetmek gerekir (bu bir 0,1 0,2 0,3 veya başka bir tek tip adım - mümkünse ağaç oluşturma algoritması çalışırken olduğu gibi farklı model oluşturucular için seçenekler vardır).

Ayrıca tüm numune için değil, önceki sayfanın etkinleştirildiği satırlar için kontrol etmeniz de önemlidir, böylece doğruluk verileri karşılaştırılabilir, yani. numuneyi önceden filtrelemek gereklidir (sırasıyla farklı yapraklar üzerinde değerlendirme için farklı filtrasyon).

 
Alexey Vyazmikin :

Evet, gerçekten bir şeye benziyor, muhtemelen bu fikir ortaya çıktı. Tahmin ediciyi değiştirmek için sorunun ne olduğunu anlamadım, çünkü hattaki her tahmin edicinin kendi göstergeleri vardır, ayrıca, bu değerlerin arıza ızgarasını bir şekilde kaydetmek gerekir (bu bir 0,1 0,2 0,3 veya başka bir tek tip adım - mümkünse ağaç oluşturma algoritması çalışırken olduğu gibi farklı model oluşturucular için seçenekler vardır).

Peki, maksimum değeri 0,2 olan bir tahmin edicinin yerine başka bir tahmin ediciden alınan değeri 800 ile 300000 arasında bir değerle değiştirelim mi? Ve her zaman doğru şubelere gideceği ortaya çıktı. Ve hem sağ hem de sol dalları kontrol etmemiz gerekiyor.
Normalleştirme, aralık içinde kalmaya yardımcı olacaktır, ancak olasılık dağılımı farklı olabilir, sonuç olarak, sağ dallar soldakilerden daha sık çalışacaktır veya bunun tersi de geçerlidir.
Ya da fikrinizi anlamadım ve farklı şeylerden bahsediyoruz.

Alexey Vyazmikin :

Ayrıca tüm numune için değil, önceki sayfanın etkinleştirildiği satırlar için kontrol etmeniz de önemlidir, böylece doğruluk verileri karşılaştırılabilir, yani. numuneyi önceden filtrelemek gereklidir (sırasıyla farklı yapraklar üzerinde değerlendirme için farklı filtrasyon).

Tahmin ediciyi kaldırarak, üzerindeki verileri ayıran düğümleri atıyoruz (ayrı bir sayfanın bununla ne ilgisi var?). Her düğümü atarken 2 dalı kontrol etmeniz gerekir. 10 düğümü atarsak, cevap olarak 11 yapraklı 11 seçenek (alt ağaç) elde ederiz. Bunun ortalaması alınmalıdır, tüm numunenin karıştırılmış bir sütunla çalıştırılması, ağacın / ormanın toplam hatasındaki değişiklikte yaklaşık olarak bunu gösterecektir.
Pemutasyonla ilgili makaleyi okuyun - orada her şey ayrıntılı olarak açıklanmaktadır.

 
elibrarius :

Peki, maksimum değeri 0,2 olan bir tahmin edicinin yerine başka bir tahmin ediciden alınan değeri 800 ile 300000 arasında bir değerle değiştirelim mi? Ve her zaman doğru şubelere gideceği ortaya çıktı. Ve hem sağ hem de sol dalları kontrol etmemiz gerekiyor.
Normalleştirme, aralık içinde kalmaya yardımcı olacaktır, ancak olasılık dağılımı farklı olabilir, sonuç olarak, sağ dallar soldakilerden daha sık çalışacaktır veya bunun tersi de geçerlidir.
Ya da fikrinizi anlamadım ve farklı şeylerden bahsediyoruz.

Tahmin ediciyi kaldırarak, üzerindeki verileri ayıran düğümleri atıyoruz (ayrı bir sayfanın bununla ne ilgisi var?). Her düğümü atarken 2 dalı kontrol etmeniz gerekir. 10 düğümü atarsak, cevap olarak 11 yapraklı 11 seçenek elde ederiz. Bunun ortalaması alınmalıdır, tüm numunenin karıştırılmış bir sütunla çalıştırılması, ağacın / ormanın toplam hatasındaki değişiklikte yaklaşık olarak bunu gösterecektir.
Pemutasyonla ilgili makaleyi okuyun - orada her şey ayrıntılı olarak açıklanmaktadır.

Benim yöntemim pemütasyon değil, bu yüzden onu yeniden üretemiyorum.

Bir başkasından yola çıkıyorum, bir yaprak zaten tamamlanmış bir kuraldır - bir tür gözlemin işaretidir ve bir ağaç yapısı olmadan zaten var olabilir. Ağaç, gözlemlerden kurallar üretmek için bir araçtır.

Tabii ki, bazı tahmin edicilerin, örneğin aynı kısmında değişen yaprak kuralını tamamen işlevsiz hale getireceğine katılıyorum, ancak amaç en iyi analogu bulmak ve sadece onunla karşılaştırmak olduğu için bu bir sorun değil - Örneği bölen bazı tahmin edicilerin kaybolması normaldir, ancak kural olarak, yalnızca tek bir tahmin edici için değer serisi ile ilgilidir. Örneğin, A>3 && B<1 && C>=20 üç öngörücüden oluşan bir sayfamız var, sırasıyla sayfanın kurallarına henüz dahil edilmemiş D ve E öngörücüleri var, her bir öngörücüyü kaldırmamız gerekiyor. önce A'yı çevirin ve orijinalin etkinleştirildiği aynı örnek alanlarda her yeni kuralı kontrol ederken ve her biri için sınıflandırma doğruluk istatistiklerini elde ederken, tahmin edici değerleri ve farklı eşitsizlik işaretlerini bölmek için bir ızgara adımıyla D ve E ile değiştirin. kural. Ve buna göre, en iyi seçenek, zaten orijinaliyle karşılaştırmak ve bu karşılaştırmaya bir değerlendirme yapmaktır. Bunu tüm yapraklar için yapın. Aynı zamanda, çoğaltılan yaprakları hariç tutun. Ağacın sonucunu bir kurallar dizisi olarak değil, paftada belirtilen her kuralı diğerlerinden ayrı olarak değerlendirmek önemlidir.

Açgözlülük ilkesine göre bir ağaç inşa etmek için öngörücünün önemini değil, model tarafından önerilen kuralın (yaprak) kararlılığı için öngörücünün önemini belirlemeye çalışıyorum.
 
Alexey Vyazmikin :

Benim yöntemim pemütasyon değil, bu yüzden onu yeniden üretemiyorum.

Bir başkasından yola çıkıyorum, bir yaprak zaten tamamlanmış bir kuraldır - bir tür gözlemin işaretidir ve bir ağaç yapısı olmadan zaten var olabilir. Ağaç, gözlemlerden kurallar üretmek için bir araçtır.

Tabii ki, bazı tahmin edicilerin, örneğin aynı kısmında değişen yaprak kuralını tamamen işlevsiz hale getireceğine katılıyorum, ancak amaç en iyi analogu bulmak ve sadece onunla karşılaştırmak olduğu için bu bir sorun değil - Örneği bölen bazı tahmin edicilerin kaybolması normaldir, ancak kural olarak, yalnızca tek bir tahmin edici için değer serisi ile ilgilidir. Örneğin, A>3 && B<1 && C>=20 üç öngörücüden oluşan bir sayfamız var, sırasıyla sayfanın kurallarına henüz dahil edilmemiş D ve E öngörücüleri var, her bir öngörücüyü kaldırmamız gerekiyor. önce A'yı çevirin ve orijinalin etkinleştirildiği aynı örnek alanlarda her yeni kuralı kontrol ederken ve her biri için sınıflandırma doğruluk istatistiklerini elde ederken, tahmin edici değerleri ve farklı eşitsizlik işaretlerini bölmek için bir ızgara adımıyla D ve E ile değiştirin. kural. Ve buna göre, en iyi seçenek, zaten orijinaliyle karşılaştırmak ve bu karşılaştırmaya bir değerlendirme yapmaktır. Bunu tüm yapraklar için yapın. Aynı zamanda, çoğaltılan yaprakları hariç tutun. Ağacın sonucunu bir kurallar dizisi olarak değil, sayfadaki her kuralı diğerlerinden ayrı olarak değerlendirmek önemlidir.

Açgözlülük ilkesine göre bir ağaç inşa etmek için öngörücünün önemini değil, model tarafından önerilen kuralın (yaprak) kararlılığı için öngörücünün önemini belirlemeye çalışıyorum.
Şu anda ormanlar üzerinde çalışıyorum. Yani MO yönünde - ne yapacağınızı daha iyi biliyorsunuz)
 
elibrarius :
Şu anda ormanda çalışıyorum. Yani MO yönünde - ne yapacağınızı daha iyi biliyorsunuz)

Demek ki herkes kendi hakkında konuşuyor :)

Söyleyin bana, aynı Alglib'de yalnızca benzersiz tahmin değerleriyle veya en azından benzersiz bölmelerle bir orman inşa etme olasılığını uygulamak mümkün mü? Elbette daha az ağaç olacak, ancak fikre göre eğitim örneğinin dışında daha fazla güvenilirlik vermesi gereken hatalarını / doğru cevaplarını tekrarlamayacaklar.

 
Alexey Vyazmikin :

Söyleyin bana, aynı Alglib'de yalnızca benzersiz tahmin değerleriyle veya en azından benzersiz bölmelerle bir orman inşa etme olasılığını uygulamak mümkün mü? Elbette daha az ağaç olacak, ancak fikre göre eğitim örneğinin dışında daha fazla güvenilirlik vermesi gereken hatalarını / doğru cevaplarını tekrarlamayacaklar.

Kesinlikle. MQL - diğer herhangi bir dil gibi herhangi bir şeyi programlamanıza izin verir. Ve Alglib, fikirlerinize uyması için tanınmayacak şekilde kürek çekilebilir.

 
elibrarius :

Kesinlikle. MQL - diğer diller gibi her şeyi programlamanıza izin verir. Ve Alglib, fikirlerinize uyması için tanınmayacak şekilde kürek çekilebilir.

"Gerçek" kelimesine "ne kadar basit" koydum ...

Ama cevaptan ruh halini anladım, teşekkür ederim, zahmet etmeyeceğim.

 
Alexey Vyazmikin :

"Gerçek" kelimesine "ne kadar basit" koydum ...

Ama cevaptan ruh halini anladım, teşekkür ederim, zahmet etmeyeceğim.

Tabii ki zor.
Ancak taban bir ağaç inşa fonksiyonu şeklindedir. İşte burada ve kendi takdirinize bağlı olarak değiştirebilirsiniz.
 
elibrarius :
Tabii ki zor.
Ancak taban bir ağaç inşa fonksiyonu şeklindedir. İşte burada ve kendi takdirinize bağlı olarak değiştirebilirsiniz.

Cevap için teşekkürler. Kod konusunda çok bilgilisiniz, ağaç oluşturma algoritmasında iyileştirmeler içeren bir genel sürüm planlamıyor musunuz? Ağaç derinliği veya yerleşik budama gibi çok sayıda kural gözlemi gibi şeyler bile orada çok yardımcı olacaktır. Alglib'i kendim kullanmadım ama çok faydalı bulabilecekler var.

 
Alexey Vyazmikin :

Cevap için teşekkürler. Kod konusunda çok bilgilisiniz, ağaç oluşturma algoritmasında iyileştirmeler içeren bir genel sürüm planlamıyor musunuz? Ağaç derinliği veya yerleşik budama gibi çok sayıda kural gözlemi gibi şeyler bile orada çok yardımcı olacaktır. Alglib'i kendim kullanmadım ama çok faydalı bulabilecekler var.

Anlamak ve yayın yapmak iki farklı şeydir. Hala deneme yapıyorum. Şimdi tahmin edicileri karıştırıyorum. Belki de Ulusal Meclis'i gürültüyle baş edemediğim için terk ettiğim gibi onu da terk edeceğim.

Ve bunu anlamak kolaydır. Koda birkaç saat bakmak gerekiyor ve her şey netleşecek.
Neden: