Bu kaosun bir düzeni var mı? Hadi bulmaya çalışalım! Belirli bir örnek üzerinde makine öğrenimi. - sayfa 12

 
elibrarius #:

Bu modelleri testteki en iyi modele göre mi seçiyorsunuz?

Ya da sınavda en iyi olan birçok kişi arasında sınavda da en iyi olan var mı?

Özellikle sınavda en iyi olanın seçilmesi söz konusuydu.

 
Aleksey Vyazmikin #:

Özellikle sınavda en iyi olanın seçilmesi söz konusuydu.

Sınavda da en iyisini gösterdim. Gerçek ticarete geçmeden önce sınav olmayacak. Daha doğrusu gerçek para için olacak....

Şimdi ileriye doğru valking yaparak bir işaret seçimi yaptım (10000 ila 5000 ve sizinki gibi bir trayne ve bir test), sınavda ikisi de birleşiyor.

Seçimi bir şekilde testte yapmak gerekiyor, böylece öğrenilebilirlik sınavda korunuyor.

 
elibrarius #:

Sınavda da en iyisini gösterdim. Gerçek ticarete geçmeden önce sınav olmayacak. Daha doğrusu gerçek para için olacak....

Şimdi ileriye doğru valking yaparak bir işaret seçimi yaptım (10000'den 5000'e ve sizinki gibi bir trayne ve bir test), sınavda her ikisi de birleşiyor.

Sınavda öğrenilebilirliğin korunması için seçimi bir şekilde test üzerinde yapmak gerekir.

Şu anda ne yazık ki yalnızca doğru seçim olasılığını artırabilirsiniz. Bu nedenle, birçok model aynı anda seçildiğinde, ortalama doğruluğun yeterli olacağını ve ortalama bir kar elde edebileceğimi umarak toplu ticaret yapmayı düşünüyorum.

 
Yüz binlerce özelliğiniz arasından çalışan özellikleri bulmanız ve ardından bunların neden çalıştığını anlamanız gerekir. Ve sonra bunlar üzerinde bruteforcing ile değil, optimum hiperparametreleri seçerek farklı TC'ler yazmanız gerekir.
Aksi takdirde, sınava göre yüzlerce model arasından seçim yapmanız gerektiğinde yine fitting olduğu ortaya çıkacaktır.
En önemli şey, özelliklerin en azından yaklaşık olarak neden çalıştığını anlamaktır. Daha sonra bunlar geliştirilebilir veya bunlara etiketler eklenebilir.

Bir sürü belirsiz modeli üst üste yığmak da iyi bir fikir değildir. Çünkü bilinmeyen bir sürü şeyi yeniden eğitmeniz gerekecektir.

İyi olanları seçmek için özellik seçimi ile kaba kuvvet uygulamanız ve ardından neden işe yaradıkları üzerine düşünmeniz gerekir. Daha sonra nereye gideceğiniz netleşecektir. Bruteforce'un kendisi TC hazırlığı için etkisizdir, bir keşif olarak düşünülmelidir.
 
Maxim Dmitrievsky #:
Yüz binlerce özelliğiniz arasından çalışan özellikleri bulmanız ve ardından bunların neden çalıştığını anlamanız gerekir. Ve daha sonra bunlar üzerinde bruteforcing ile değil, optimum hiperparametreleri seçerek farklı TC'ler yazmanız gerekir.
Aksi takdirde, sınava göre yüzlerce model arasından seçim yapmanız gerektiğinde yine fitting olduğu ortaya çıkacaktır.
En önemli şey, özelliklerin en azından yaklaşık olarak neden çalıştığını anlamaktır. Daha sonra bunlar geliştirilebilir veya bunlara etiketler eklenebilir.

Bir sürü belirsiz modeli üst üste yığmak da iyi bir fikir değildir. Çünkü bilinmeyen bir sürü şeyi yeniden eğitmeniz gerekecektir.

İyi olanları seçmek için özellik seçimi ile kaba kuvvet uygulamanız ve ardından neden işe yaradıkları üzerine düşünmeniz gerekir. Daha sonra nereye gideceğiniz netleşecektir. Bruteforce'un kendisi TC hazırlığı için etkisizdir, bir keşif olarak düşünülmelidir.
Katılıyorum. Sürecin anlaşılması farklı açılardan sağlanabilir)
 
Maxim Dmitrievsky #:
Yüz binlerce özelliğiniz arasından çalışan özellikleri bulmanız ve ardından bunların neden çalıştığını anlamanız gerekir. Sonra da bunların üzerine bruteforcing ile değil, optimal hiperparametreleri seçerek farklı TC'ler yazmanız gerekir.
Aksi takdirde, sınava göre yüzlerce model arasından seçim yaptığınızda yine fitting olduğu ortaya çıkacaktır.
En önemli şey, özelliklerin en azından yaklaşık olarak neden çalıştığını anlamaktır. Daha sonra bu özellikler geliştirilebilir ya da bunlara ilişkin etiketler iyileştirilebilir.

Bir sürü belirsiz modeli paketlemek de iyi bir fikir değildir. Çünkü o zaman bir sürü bilinmeyen şeyi yeniden eğitmeniz gerekecektir.

İyi olanları seçmek için özellik seçimi ile kaba kuvvet uygulamanız ve ardından neden işe yaradıkları üzerine düşünmeniz gerekir. Daha sonra nereye gideceğiniz netleşecektir. Bruteforce'un kendisi TC hazırlığı için etkisizdir, keşif amaçlı olarak düşünülmelidir.

Mesele şu ki, öngörücü etkinliğinin nedenini anlama görevi son derece zordur ve piyasa davranışı yorumlama alanında yatmaktadır, yoksa daha güvenilir bir yaklaşımınız var mı? Ayrıca, tahmin ediciler ilkel oldukları için bir grup içinde çalışırlar ve bir grup içinde çalışan tahmin edicilerin nasıl bir araya getirileceği basit bir soru değildir - şimdiye kadar açık olan bir karar ağacı kullanmaktır. Ve etkili karar ağaçları oluşturmak için, örneği önemli ölçüde azaltmanız ve daha iyisi, yalnızca muhtemelen etkili bir ilişki oluşturan tahmin edicileri beslemeniz gerekir. Ve burada model arama yöntemi çok faydalı olabilir, çünkü model kural olarak tahmin edicilerin sadece bir kısmını kullanır.

Uydurma ya da uydurmama - bence tüm olasılık uydurma eylemleri uydurmadır. Başka bir şey de, bu olasılıkların tahmin ediciler üzerindeki dağılımının geçmişinin tekrarlanabileceği veya uzun bir süre unutulabileceğidir. Ve burada bu aşamaların geçişini belirlemek için bazı yöntemlere sahip olmak önemlidir.

 
Aleksey Vyazmikin #:

CatBoost ile kutudan çıktığı haliyle, aşağıdaki ayarlarla - Seed brute force ileeğitmek bu olasılık dağılımını verir.

1. Örnekleme treni

2. Test seçimi

3. Sınav örneği

Gördüğünüz gibi, model her şeyi neredeyse sıfıra göre sınıflandırmayı tercih ediyor, bu nedenle hata yapma şansı daha az.

Alexey, eğitim aslında uyum sağlamaktır, değil mi?

 
Renat Akhtyamov #:

Alexei, eğitim aslında uyum sağlamaktır, değil mi?

Esasen, evet.

Bir test cihazında optimizasyon, algoritmanın üzerinde çalıştığı metrikleri değiştirmekle ilgilidir ve MO yöntemlerinde (ağaçlar ve türevleri, NS) öğrenme, metriklerin geçmişini değerlendirerek ve yorumlayarak algoritmayı değiştirmekle ilgilidir.

Simbiyoz, epik olacaktır.....

 
Renat Akhtyamov #:

Alexei, eğitim aslında uyum sağlamaktır, değil mi?

Okul çocuklarına öğretmek de onların bilgilerini mevcut bilgilere uydurmaktır)

 
Aleksey Vyazmikin #:

Mesele de bu zaten, tahmincilerin performansının nedenini anlama görevi son derece zor ve piyasa davranışını yorumlama alanına giriyor, yoksa daha sağlam bir yaklaşımınız var mı? Ayrıca, tahmin ediciler bir grup halinde çalışır, çünkü bunlar ilkeldir ve bir grup halinde çalışan tahmin edicilerin nasıl bir araya getirileceği basit bir soru değildir - şimdiye kadar açık olan bir karar ağacının kullanılmasıdır. Ve etkili karar ağaçları oluşturmak için, örneği önemli ölçüde azaltmanız ve daha iyisi, yalnızca muhtemelen etkili bir ilişki oluşturan tahmin edicileri beslemeniz gerekir. Ve burada model arama yöntemi çok faydalı olabilir, çünkü model kural olarak tahmin edicilerin sadece bir kısmını kullanır.

Uydurma ya da uydurma değil - bence tüm olasılık uydurma eylemleri uydurmadır. Bir başka şey de, bu olasılıkların tahmin ediciler üzerindeki dağılımının geçmişinin tekrarlanabileceği veya uzun bir süre unutulabileceğidir. Ve burada bu aşamaların geçişini belirlemek için bazı yöntemlere sahip olmak önemlidir.

Eğitim için 5 ila 10 kişilik küçük gruplar.

1-3 daha iyi.

Hiçbiri bir şey üretmiyorsa, aralarında efsanevi bir bağlantıdan bahsetmenin ne anlamı var? saçmalık + saçmalık...

Neden: