Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1354
Arşivleri saklayın. Eki görmek.
Learn.csv - girdiler. Her satırdaki ilk hane geçmişe bir bağlantıdır, silinmesi gerekir.
Cell.scv - hedef.
Bu veriler üzerinde eğitim aldıktan sonra, bu grafik gibi bir şey elde etmelisiniz.
Filtre yaklaşık olarak ЕМА(16), tahmine karşılık gelir - 5 dak.
ZY Testi o zaman, gerektiğinde yapacağım.
Bu grafiğin sizin için hangi örnek üzerinde ortaya çıktığı tam olarak belli değil - eğitimde mi yoksa testte mi?
İşte testte CatBoost - 100 son değer.
Sapmaların histogramı
Eğitim için 4000, doğrulama için 2000 ve test için 100 satır aldım. Eğitimli 1000 ağaç derinliği 6, RMSE formülü ( Poisson ile değiştirildi).
Bir örnek ve ayarlar ekliyorum, oynatma için CB'yi indirmeniz ve Kurulum dizinine koymanız gerekiyor.
Eğitim örneğinde, dağılım da sizinkine benzemiyor.
Eklendi: Modeli doğru kullanmıyorum - olasılık grafiklerinde ortaya çıktı...
Grafiğim yalnızca tüm örnek üzerinde eğitim. Bu testi yapmadı. Eğitimle hemen hemen aynı olacak.
Evet daha önce regresyon ile ilgilenmedim, birçok belirsiz uygunluk fonksiyonu var, sınıflandırmadan farklı olarak farklı sonuçlar veriyorlar ve yanlış değer almışım.
İşte test örneğinde ortaya çıktı
Ama eğitimde - 4000 satır
Test numunesi için sapmaların histogramı
İşte 3 örnek için genel grafik
Test setinde eğitim almak için kullanılan metrik
250 yinelemede eğitimi durdurmanın mümkün olduğunu söylüyor - model yeniden eğitildi.
Tamam gibi.
Evet, istersen geliştirebilirsin - sadece regresyon modelleriyle deneyimim yok.
Yani ana öngörücüler çalışan araçlardır :)
Ayarlarla birlikte son sürüm eklendi - farklı Seed ile 10 modeli eğitir
Girişte ölçekli bir fiyat aralığı var. - 20 yakın değer, hepsi bu. Bu, tahmin edicilerle ilgili değil, sorunu belirlemeyle ilgili - çözülebilir. Ve ormanınız tahmin edicilerle gelecek.)
Evet, mesele sorunun formülasyonunda, burada katılıyorum. Sadece fiyatı turtaların yapıldığı hamur olarak düşünmüyorum ve bu turtaların şekli için tahmin edicilere ihtiyaç var.
Modeli geliştirebilecek klasik tekniklerden biri. Daha doğrusu, en uygun olanı bulun. Monte Carlo'nun orijinal uygulaması.
https://en.wikipedia.org/wiki/Importance_sampling
Oluşunuzda bu yöntemi kullanmadınız mı?
Politika dışı (politika gradyanı) RL için
https://medium.com/@jonathan_hui/rl-importance-sampling-ebfb28b4a8c6
Rusçada, kendi sözlerinle, fikrin özünün ne olduğunu açıklayabilir misin? Popüler dil, tabiri caizse :)
LPF filtresini başarıyla tahmin ettik. Şimdi bile sadece Millet Meclisi değil, orman da bir arada. Şimdi genellikle anlamsız olan fiyatı tahmin etmeye çalışalım.) Şu anda bilinmeyen (beklenti) fiyat beklentisindeki beklenen değişimin düşük frekanslı bileşenini tahmin etmek daha iyidir. Ve burada her türlü hareket, yüksek frekanslı titreşimler ve diğer her şey koşullarında.
Olan şudur: 1 m'lik bir TF'de tahmin süresi 5 m'dir.
Her zamanki gibi: x için - tahmin, y için - gerçek değer. Eh, 45 derece eğimli. dikdörtgen hatırlatıyor, daire olmadığın için teşekkürler. X'te sıfırın biraz sağına veya soluna giderseniz, %50'den biraz daha fazla bir olasılıkla bile oynayabilirsiniz (bkz. alana).
Elbette, her türlü regresyon çizgisini, dağılımı oluşturmak güzel olurdu, ancak bunun yapılması gerekiyor, en azından birkaçı - bu daha sonra.
PS Eh, biraz değiştirilmiş bir algoritma için yığın tahminine. TF 1m'de aynı 5 dakika
Zaten çok daha iyi.) x için > 2 ve < -2 tahmininden başlayarak, 5 dakika içinde aptalca kapatırsanız neredeyse hiçbir kârsız işlem öngörülmez.