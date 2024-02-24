Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3355

Maxim Dmitrievsky #:
Birinin en azından ipucunu Google'da aratacağını umuyordum.

Eğitiminizde olasılık eğrileri olsa bile, hangi yeni verilerden bahsedebilirsiniz. Bousting ve Forrest bu konuda büyük günah işliyor. Busting aşırı güven, Forrest ise az güven demektir. Tabii ki eşiği kullanmayı planlıyorsanız.

Eşiği artırdığınızda, işlemlerin kalitesinin traine'de bile iyileşmediğini gözlemledim. O zaman ne getirme olasılıkları var? Hiçbir şey :)

Nedense yazılarıma dikkat etmiyorsunuz, olasılıklara odaklanıyorsunuz. Olasılığın ne olduğu önemli değil, önemli olan iyileşmezse modelin aşırı eğitilmiş, çöp kutusuna girmiş olmasıdır. OOV, OOS ve VNU'daki tahmin hatası yaklaşık olarak aynı olmalıdır.

İşte başka bir histogram

Farklı algoritma - etiketler ve tahmin ediciler aynı olmasına rağmen farklı histogram. Farklı sınıflandırma algoritmalarının aynı histogramları üreteceğini ima eden bir tür teorik olasılık arıyorsanız ... Bu benim aklıma gelmiyor, çünkü belirli algoritmalarla çalışmak zorundasınız ve tahmin edecekler ve değerlendirilmeleri gerekiyor, teorik bir ideal değil. Buradaki ana değerlendirme, olasılıkların bazı teorik ideallere yakınlığı değil, modelin aşırı uyumudur.

Kutudan çıkan bir model, herhangi bir model doğru olasılıkları vermez. Hikaye bu. Tahmin edilen etiketlerin tamamen eşleşmesini sağlayabilirsiniz, ancak olasılıklar sonucun gerçek olasılığını yansıtmaz, yansıtmayacaktır.
Beni anlıyor musunuz?
 
Yazımı ekledim. Herhangi bir model, sınıflandırma hatasının dalgalanmayacağı anlamında doğru olasılıklar verir.

Vaz mı geçtiniz? Google'da sınıflandırma olasılığı kalibrasyonunu arayın, R'de olması gerekir.

Ve modelinizin olasılık eğrisini karşılaştırma ölçütüne göre çizin.
 
Farklı şeylerden bahsediyoruz.

Ben sonuç hakkında yazıyorum, siz ise ara verilerin ideali hakkında yazıyorsunuz.

Benim için RF ve ada tarafından verilen belirli etiketlerin olasılık değerlerinin farklı olacağı açıktır, ancak belirli etiketlerin tahminleri neredeyse aynıdır. Ben olasılık değerleriyle ilgilenmiyorum, tahmin hatasıyla ilgileniyorum

Eğer teori üretirseniz, sizin anladığınız anlamda sınıf olasılığını elde etmek büyük olasılıkla imkansızdır, çünkü olasılığınızın limit teoremini karşıladığını kanıtlamanız gerekir ki bu da çok şüphelidir.

Yine de, orijinal soru oradaydı, kimse cevaplamadı. Ben tam olarak sorduğum şeyden bahsediyorum.
Yani çabalanacak bir şey var.
 
Neden mi? Eğer bir tez anlamında....

Çünkü olasılık eğrileriyle ticaret yapmak kazanç yerine kayıpları göze almak anlamına gelir. Herhangi bir sınıflandırıcı, riske duyarlı bir uygulama ise kalibrasyona ihtiyaç duyar.
Sonunda.
