Sayısallaştırmaya devam edin

Sonunda sağlam bir tavsiye!

 
Ve işte sonuç - son iki sütun

Gerçekten de sonuçlar iyileşmiştir. Örneklem ne kadar büyük olursa, eğitim sonucunun o kadar iyi olacağı varsayımını yapabiliriz.

Eğitim örneğinin 1 ve 2 parçası üzerinde eğitim yapmaya çalışmak gerekir - ve sonuçlar 2 ve 3 parçadan çok daha kötü değilse, örnek tazeliği faktörünün hacimden daha az önemli olduğu düşünülebilir.

Evet - eğitim tamamlandı, sonuçlar aşağıdaki tabloda - son iki sütun.


Geçici olarak, eğitimin başarısının örneklem büyüklüğüne bağlı olduğu sonucuna varabiliriz. Bununla birlikte, "-1p1-2" örnekleminin sonuçlarının "-1p2-3" örneklemiyle karşılaştırılabilir ve hatta bazı kriterlere göre daha iyi olduğunu,"0p1-2" örneklemi için sonuçların verilen kriteri karşılayan model sayısı açısından iki kat daha kötü olduğunu not ediyorum.

Şimdi ters kronolojiye sahip bir örnek çalıştırdım; burada eğitim örneği ilk sınav+test+eğitim_p3 örneğinden oluşuyor ve test örneği eğitim_p2, sınav ise eğitim_p1. Amaç, 10 yıl önce çalışabilecek daha yeni veriler üzerinde başarılı bir model oluşturmanın mümkün olup olmadığını görmektir.

Sizce sonuç ne olacak?

 
Biraz daha ve en önemsiz sonuç elde edilecek ... ya da belki elde edilmeyecek, ama sonra dünyamı alt üst edecek bir keşif!

Yolun açık olsun!

 
СанСаныч Фоменко #:

İki vektör arasındaki mesafe olarak hesaplanan "tahmin edicilerin tahmin gücü" hakkında birçok kez yazdım.

Mesafeyi hesaplamak için bir araç listesine rastladım:

Bu, kendi mesafeleri olan standart olanın yanı sıra

Güzel yapı
Maxim Dmitrievsky #:
Max, neden benimle dalga geçtiğini anlamıyorum.

Varsayım yoksa hiçbir şey söyleme, varsa söyle, "sonuç berbat olacak" gibi.

 
Bilmiyorum ama merak ediyorum.

 
СанСаныч Фоменко #:

Sadece biraz daha fazla ve önemsiz bir sonuç elde edilecek ... ya da belki de değil, ama sonra benim dünyamı alt üst edecek bir keşif!

Yürü be!

Yani ilk iki sütunda model sayısının karşılaştırılabilir olacağını mı düşünüyorsunuz? İki kat farklı olsalar bile. Önemsizlik konusunda daha açık olun lütfen.

Yukarıda matstat hakkında yazdım. Ondan önce kozul hakkında yazmıştım. Ondan önce de Oracle hataları (markup errors) hakkında yazmıştım, veriler anlamadığınız bir şekilde işaretlendiğinde. Bundan kesinlikle çıkan şey, farklı eğitim parçaları ve uzunluklarında sonuçların değişeceğinin farkına varılmasıdır. Bu, sağlanmayan ya da açıklanmayan verilere bağlıdır.
İşaretleme hataları sonuçları ve zaman dilimlerini etkiler. Hangi tavuğun hangi pençeyle işaretleme yaptığı tavuğun sonucu olacaktır.

Buradaki insanlar öğrenmenin temel direkleri hakkında konuşmayı severler: ön işleme, niceleme, belirleyicilerin hedeflerle ilişkisi.... Ancak işaretleme için hangi pençenin kullanıldığını yazmazlar, sol veya sağ. Yukarıdakilerin hepsinden daha fazlası buna bağlıdır.
 
Bu zaten bir profesyonelin görüşü gibi geliyor (doğru ya da yanlış olması başka bir soru).
Ve dalga geçmeye gerek yok.
