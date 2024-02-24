Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 851
2 sınıf
1 çekirdek yüklü
Ayar rfeControl = rfeControl(sayı = 1,tekrar = 1) - süreyi 10-15 dakikaya indirdi. Sonuçlardaki değişiklikler - 2 çift tahmin edici yer değiştirdi, ancak genel olarak varsayılan olarak olduğu gibi görünüyor.
Pekala, burada, bir çekirdekte 10 dakikanız benim 2'ye 4'üm ve iki dakikayı hatırlamıyorum.
Asla saatlerce bir şey beklemem, eğer 10-15 dakika işe yaramadıysa, o zaman bir şeyler yanlış, o zaman daha fazla zaman harcamak hiçbir fayda sağlamayacaktır. Saatlerce süren bir model oluşturmadaki herhangi bir optimizasyon, modelin minimum düzeyde kaba olması ve hiçbir durumda maksimum düzeyde doğru olması gerektiğini söyleyen modelleme ideolojisinin tamamen yanlış anlaşılmasıdır.
Şimdi tahmin edicilerin seçimi hakkında.
Neden yaptın ve neden? Ne problemi çözmeye çalışıyorsun?
Seçimdeki en önemli şey, aşırı uyum sorununu çözme girişimidir. Modeliniz yeniden eğitildi mi? Değilse, seçim, daha az tahmin edici pahasına öğrenmeyi hızlandırabilir. Ancak ana bileşenleri izole ederek miktarı azaltmak çok daha verimlidir. Hiçbir şeyi etkilemezler, ancak tahmin edicilerin sayısını büyüklük sırasına göre azaltabilir ve buna bağlı olarak model uydurma hızını artırabilirler.
Öyleyse başlamak için: neden buna ihtiyacınız var?
Tahmin edicileri filtrelemek için başka bir ilginç paket buldum. Adı FSelector. Entropi kullanımı da dahil olmak üzere, tahmin edicileri ayıklamak için bir düzine yöntem sunar.
Tahmin ediciler ve hedef içeren dosya buradan alınmıştır - https://www.mql5.com/en/forum/86386/page6#comment_2534058
Sonunda, her bir yöntemle tahmin edicinin tahminini grafikte gösterdim -
Mavi iyidir, kırmızı kötüdür (düzgün için, sonuçlar [-1:1] olarak ölçeklenmiştir, doğru bir değerlendirme için, işlevlerin kendilerini çağırma sonuçlarına bakın cfs(targetFormula, trainTable), chi.squared(targetFormula, trainTable ), vb.)
X3, X4, X5, X19, X20'nin hemen hemen tüm yöntemlerle iyi değerlendirildiği görülebilir, başlangıç için bunları alabilir, daha sonra eklemeyi / çıkarmayı deneyebilirsiniz.
Ancak çıngıraktaki modeller Rat_DF2'deki bu 5 tahminci ile testi geçemedi, yine mucize gerçekleşmedi. Onlar. Kalan öngörücülerle bile, model parametrelerini seçmeniz, çapraz doğrulama yapmanız, öngörücüleri kendiniz eklemeniz/kaldırmanız gerekir.
Aynı şeyi Vladimir'in makalelerinden alınan verilerle CORElearn'de de yaptım.
Sütunların ortalamasını hesaplayın (alt sıra Ortalama) ve buna göre sıralayın. Bu, genel önemi algılamayı kolaylaştırır.
1,6 dakika sayıldı ve 37 algoritma bunu çözdü. Hız, benzer sonuçlarla, Caret'ten (16 dakika) çok daha iyidir.
Peki, sonuç nedir? Tahmin edicilerin önemi ile ilgili soruya cevap verdiler, yoksa bu resimlerden birkaçını anlamıyorum.
Benim için artık bir model oluştururken ve seçerken hiç sorun yok, tahmin edicileri birlikte seçiyorum, sonra üzerlerine 10 model kuruyorum, sonra karşılıklı bilgi ile en iyi çalışan modeli seçiyorum. Ve nasıl yapıldığını biliyorsun. Akıl bulmacası!!! Tamam, bunun iyi olduğuna kim karar veriyor !!!!!
Bakır üzerinde böyle bir model seti almayı başardım. Ve aslında vporos: Hangi model çalışıyor ve neden??????
Aksine, hepsi işçidir, ancak yalnızca biri gol atabilir. Ve nedenini açıkla???
Vtreat, tahmin edicileri çok benzer şekilde sıralar (başlangıçta önemlidir)
5 1 7 11 4 10 3 9 6 2 12 8
Ve işte CORElearn'de ortalamaya göre sıralama
5 1 7 11 9 4 3 6 10 2 8 12
Sanırım artık tahmin edicileri seçmek için paketlerle uğraşmayacağım.
Yani Vtreat oldukça yeterli. Tahmin edicilerin etkileşimi dikkate alınmadıkça. Muhtemelen CORElearn'de de vardır.
Piyasa tarihinin bazı parçaları için tahmin edicilerin önemini seçmeye devam ettiğinizi gördüğümde sadece gözyaşı döktüm. Ne için? bu bir küfür durumudur. yöntemler
Pratikte, NN'ye 2 numaralı tahminci gönderilirse, hatanın %30'dan neredeyse %50'ye yükseldiğini kontrol ettim.
ve OOS'ta hata nasıl değişir?
benzer şekilde. Vladimir'in makalelerinde olduğu gibi, veriler oradan.
ve eğer başka bir OOS'taysa?
Pratikte, NN'ye 2 numaralı tahminci gönderilirse, hatanın %30'dan neredeyse %50'ye yükseldiğini kontrol ettim.
Tahmin edicilere tükür ve NN normalleştirilmiş zaman serisine uygula. NS, tahmin edicileri kendi başına bulacaktır - +1-2 katman ve işte sizin için tahmin ediciler