Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 743
tüm verileri karıştırarak, bu kümeden gerçek potansiyeli çıkarmaya çalışıyoruz ve düzenlilik şeklinde şanslı bir tesadüf değil. Genel olarak, verileri karıştırarak, gerçekten neler yapabildiklerini görüyorsunuz, bu veriler ... Bunun gibi bir şey ....
Modelleri kullanarak tahmin edicileri değerlendirmekten bahsedersek, bence en gelişmiş paket RandomUniformForest. Çeşitli bakış açılarından tahmin edicilerin önemini ayrıntılı olarak tartışır. ders çalışmanı tavsiye ederim. Bir makalemde detaylı olarak bahsetmiştim.
Tahmin edicilerin model seçimini kullanmayı bıraktım. Kullanılan modelin özellikleri ile sınırlıdır.
İyi şanlar
Her zaman tamamen farklı bir şey hakkında yazıyorum: Bir model oluştururken bir tahmin edici kullanmanın yoğunluğuyla ilgilenmiyorum, çünkü bir model oluşturmak için en "uygun" tahmin edicinin hedefle çok az ilgisi olduğuna inanıyorum. değişken, çünkü böyle bir öngörücüde her zaman "uygun" değerler bulabilirsiniz ve sonuçta, tahmin edicilerin önemi, onu oluştururken modelin "kolaylığını" yansıtacaktır.
Her zaman tahmin gücü, bir tahmin edicinin hedef değişken üzerindeki etkisi hakkında yazarım. Fikirlerden biri yukarıda ifade edildi (karşılıklı bilgi), bu konuda fikrimi birçok kez dile getirdim. Bunlar matematiksel fikirlerdir. Ekonomik fikirler çok daha etkilidir, çünkü orada hedef değişken için hedef değişkenin önünde olan bu tür tahmin edicileri seçebilirsiniz.
Yani bir kez daha: Model için değişkenin ÖNEMİ ile ilgilenmiyorum, tahmin edicinin hedef değişken üzerindeki ETKİSİ ile ilgileniyorum
not.
Önerdiğiniz paketi kontrol ettim: sonuç hemen hemen aynı.
Sonuç olarak, treni ayırmazsanız ve zamana göre test etmezseniz model fazla sığacaktır. Abartılı, ancak örneğin özünü gösteriyor: Herhangi bir dönüşüm olmadan, tahmin ediciler olarak mutlak artışlarımız var. 15 genişliğinde bir sürgülü pencere kullanıyoruz, yani. her seferinde 15 öngörücü artışını besliyoruz ve bir değerle sağa hareket ediyoruz . Zaman içinde bitişik veri kümesi satırlarının sınıfı, farklılıktan ziyade çakışma olasılığı daha yüksektir, yani, n'inci satırın 1 sınıfı varsa, o zaman n + 1 satırının yüksek olasılıkla 1 sınıfı olacaktır. nth sadece bir değerde. Ve 14 eşleşen değer var Buna göre, böyle bir veri kümesinden trendeki ilk satırı ve testteki ikinci, trendeki üçüncü vb. alırsak, model çok iyi çalışacaktır, çünkü testte bir var aslında modelin trenle eğitildiği çizgilerle örtüşen bir grup çizgi. Yalnızca modelin OOS'u kötü olacaktır (test içermeyen gerçek OOS'u kastediyorsanız).
Çok iyi işaretlenmiş. Öğrenme testleri ve doğrulamaları için rastgele bir örnekle yukarıda yayınladığım bu şaşırtıcı, kâse sonucu tam olarak budur ve açıklar. Ve farklı kümelerde olduğu ortaya çıkan zaman içinde yakın olan gözlemleri hariç tutarsak, o zaman benimki gibi her şeyi alırız - bir felaket.
Unutma 31/01/2018 tarihinden bu güne kadar kazandıran bir model aldım diyorum ama bu model 05/03/2018 tarihinden bu güne kadar bu iki hafta bu şekilde çalışıyor. test sonucu.
40 noktada eğitilmiş ve zaten OOS'ta 1.5 aydır çalışan yaşlı bir kadın için hiç de fena değil.
İşte 31.01.2018 tarihinden itibaren tam OOC'si
Hala uygun olduğunu düşünüyor musun???? Size hatırlatmama izin verin, ekran görüntülerinde OOS sitesinde
Peki, normal geri test nerede? 3 ayda bir yükseliş trendine girdin , kırılmalar yaşayacaksın
her pazartesi satın almak gibi basit bir saçmalık yapın ve piyasa yükseldiği sürece sizinkinden daha iyi performans göstereceğine şaşırın
burada her şeyi yeniden eğitim için ve örneğin kendisinde bir hata için kontrol edersiniz, bu elbette istatistikler ve algoritmanın ne yaptığını anlamak için ilginçtir. ama nihai fikir parayı almaktır. öyleyse neden testte öngörülebilirliği hemen kontrol etmiyorsunuz?.... testimde muhtemelen 50/50 ANCAK, hedef değişkeni geyiğin kardan daha az olduğu sınıflara sürdüğüm için, Sonuç olarak, testte oldukça planlı bir büyüme elde edilir. ve bu arada, testte sadece sürekli bir ilerleme var, makine ticarete başlamadan önce veriler üzerinde eğitildi.... bu yüzden ticaretin sonuçlarını değerlendirmenin doğru olduğunu düşünüyorum. Kendi başıma, girdi tahmin edicilerinin, sayılarının ve hedefi tanımlamadaki gerçek yeteneklerinin en büyük öneme sahip olduğunu ekleyeceğim.
işte resim
Yeniden eğitim hala önemli bir andır, çünkü örneğin, güçlendirmede (gradyan ormanları) çarpıcı bir model elde edebilirsiniz, ancak ileride çürüme olacaktır, ancak kendiniz biliyorsunuz ki
peki, kimse eğitilmiş olanı sonsuza kadar kullan demiyor, yeniden eğitip tekrar yola çıkabileceğin bir dönem var)))
Tahmin edicilerin seçimi önemlidir, ancak ormanlar aralarındaki ilişki faktörlerini nasıl modelleyeceklerini bilmiyorlar, bu nedenle bu aptalca bir uyum ve değişken ilişkiler şeklindeki bir varyasyonla akıllı modelleme ne yazık ki çok zaman alıyor.
üstelik bu bağlantılar matematiksel olarak bulunamıyor, aptalca bir uyum veya pazar araştırması olarak kalıyor :)
Künt takma da harika bir şeydir, aslında genelleme kullanılıyorsa