bunun kriterin minimum/maksimum değeri olduğunu mu söylüyorsunuz? Bunun modelin kendisinin küresel minimum/maksimum değeriyle hiçbir ilgisi yoktur.
Bana grafiği göster.
Lütfen.
Bu kriter grafiğinde eğitimi nerede bırakmanız gerektiğini gösterin.
Bu çok uzun bir yol,
Bir şarkı yapmaya çalışacağım.
Söylemesi zor, çoktan unuttum ve uzun, müzik, eğer öğrenirsek, uzun bir melodi:
Bana grafiği göster.
Lütfen.
Bu grafik üzerinde eğitimi durdurmanız gereken kriterleri gösterin.
tüm örneklem üzerinde minimum kriterde, sırada ne var?
Ne demek istediğimi anlıyor musun?
Gerçek bir yapay zeka uzmanının kırmızı sigaraya ve yeşil kolonyaya ihtiyacı vardır.
Brüt numunedekikriterlerin en azında, sırada ne var?
Artık her türlü öğrenmenin küresel ekstremum arayışıyla optimizasyondan başka bir şey olmadığını nihayet anladınız. Ya da belki henüz fark etmediniz ama fark edeceksiniz.
Başka türlü olamaz, öğrenmeyi durdurmak için her zaman kesin bir kritere ihtiyacınız vardır ve bu kriter her zaman küresel bir ekstremum olacak şekilde tasarlanır. Genellikle integral bir kriter tasarlanır (her zaman değil). İntegral kriterleri siz adlandırdınız.
Orijinal gönderi model karmaşıklığıyla ilgiliydi, ekstremumlarla değil. Ne yazdığımı unutarak kendi lafınızı söylüyorsunuz.
Yani, yine işemeye ya da verileri sözlerinize uydurmak için esnetmeye çalışıyorsunuz.
İşte model uydurma hatasının tipik bir grafiği.
Asimptotik olarak eksenden belli bir sapma değerine yaklaşır.
Sapma miktarı hedef-öngörücü çiftinin bir özelliğidir. Belirli bir modelin sahip olduğu parametreleri optimize ederek bazı kırıntılar elde edilebilir, ancak herhangi bir optimizasyonla "hedef-tahmin ediciler" özelliğini atlamak imkansızdır.
Eğer yanlılık hatanın %45'i ise, model parametrelerini değiştirerek %10 daha azını elde etmek mümkün değildir. Ve hiçbir optimizasyon yardımcı olmayacaktır.
Ve eğer %20 hata ile bir "hedef-tahmin ediciler" çifti bulmayı başarırsanız, ne yaparsanız yapın hata yaklaşık %20 olacaktır.
Dahası. Eğer deneme ve doğrulama sırasında hatalar %5'ten fazla farklılaşıyorsa, bu "hedef-tahmin ediciler" çifti üzerinde anlamlı bir şekilde çalışmanız gerektiği anlamına gelir. Eğer yakınsama mümkün değilse, o zaman "hedef-tahmin ediciler" çiftinin atılması gerekecektir.
Orijinal gönderi model karmaşıklığıyla ilgiliydi, aşırılıklarla değil. Siz benim ne yazdığımı unutarak kendi bildiğinizi okuyorsunuz.
Yani, yine pi-hacking yapıyorsunuz ya da verileri sözlerinize uydurmak için esnetiyorsunuz.
"Başlangıçta" derken neyi kastediyorsunuz? Model karmaşıklığını ayrıca tartıştık, o zaman model karmaşıklığını artırmanın yalnızca belirli bir noktaya kadar etkili olduğunu, daha sonra etkinlikte bir düşüş olduğunu söyledik ve bu doğru, evet, bununla tartışmadım ve bunu onaylıyorum. Daha sonra, modeli çok önemli ölçüde artırırsanız belki de verimliliğin çarpıcı bir şekilde artabileceğini önerdim, çünkü burada daha önce kimse bunu yapmadı (ve nedenini görebiliyorum).
Çok uzun zamandan beri her öğrenmenin küresel ekstremum arayışı ile optimizasyon olduğunu söyledim, ancak siz bunu (ve diğer bazılarını) bir "optimizasyoncu" olmadığınızı söyleyerek reddettiniz. Şimdi size açıkça gösterdim ki öğrenme ancak küresel bir ekstremum bulunduğunda durdurulabilir, aksi takdirde bunu başka türlü yapmanın bir yolu yoktur (öğrenmeyi ne zaman durduracağınızı bilemezsiniz, bunun için bir kritere ihtiyacınız vardır). Bu nedenle durdurma metakriteri, küresel ekstremumu öğrenirken optimizasyonun özüdür.
Bunun farkına varmak, öğrenmeye yeni açılardan bakmayı mümkün kılar.