Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1324

 
Alexey Vyazmikin :

Evet, özellikle hemen python üzerinde çalıştırırsanız, temel ayarlar burada iyi bir şekilde verilmiştir. Ama bu benim için yeterli değil.

cızırtılı gösteri doğru, Anna Veronika daha iyi anlatıyor, aynı zamanda daha çok dans ediyor

 
Maksim Dmitrievski :

cızırtılı gösteri doğru, Anna Veronika daha iyi anlatıyor, aynı zamanda daha çok dans ediyor

Bilmiyorum dikkat etmiyorum genelde hızlandırılmış modda izliyorum.

Her halükarda, yaratıcılardan cevap gerektiren sorular var, ancak onlara nasıl soracağımı, nereye soracağımı bilmiyorum.

 
Alexey Vyazmikin :

Bilmiyorum dikkat etmiyorum genelde hızlandırılmış modda izliyorum.

Her durumda, yaratıcılardan cevap gerektiren sorular var, ancak onlara nasıl soracağımı, nereye soracağımı bilmiyorum.

muhtemelen github'da

 
Maksim Dmitrievski :

muhtemelen github'da

Oradaki herkes çok İngilizce konuşuyor - oraya nereye gidebilirim :)

 
Alexey Vyazmikin :

Oradaki herkes çok İngilizce konuşuyor - oraya nereye gidebilirim :)

Python'u değil R'yi pompalamanız gerekiyor gibi görünüyor, Renat yakında koltuk değneği olmadan doğrudan bir bağlantı olacağını yazdı

onlar. catboost, mt5'ten 1 satırda başlatılabilir

 
Maksim Dmitrievski :

Python'u değil R'yi pompalamanız gerekiyor gibi görünüyor, Renat yakında koltuk değneği olmadan doğrudan bir bağlantı olacağını yazdı

onlar. catboost, mt5'ten 1 satırda başlatılabilir

Genel olarak, R altında bir catboost çalıştıramadım .... peki, belki ellerim çarpıktır, elbette. Bir demet varsa, o zaman bu iyidir, ancak yine de optimizasyon yapmanıza izin vermez ve yanıt hızı da söz konusudur...

 

Örnek dökümünün eğitim ve doğrulama üzerindeki etkisine ilişkin çalışmayı tamamladı (eğitimin durduğu ve modelin seçildiği).

Kullanılan örnek 2014'ten 2018'e kadardı, her %20'lik yaklaşık 1 yıla eşittir. Metodoloji şudur: Genel örneği aldım ve doğrulama örneğini yüzde 10 artırmaya başladım, eğitim örneğini aynı yüzde 10 azalttım ve 9 takım örnek aldık. Her örnek için 1'den 200'e kadar Seed ile bir model oluşturuldu, yani. numune başına toplam 200 model, toplam 1800 model.

Modeller, eğitime katılmayan sabit bir örneklem - 2018 üzerinde test edildi.

Enstrüman - yapıştırma vadeli işlem sözleşmesi Si.

Aşağıdaki tablo, model oluşturma sonuçlarını değerlendirmenize izin veren göstergeleri göstermektedir - sol taraf, terminalde görmeye alıştığımız gibi finansal göstergelerdir ve sağ taraf, hata dengesinin göstergeleridir (ben buna - I Birisi genellikle kullanırsa nasıl doğru olduğunu bilmiyorum), yani. hedef 1 doğru olarak belirlenmişse +1, doğru değilse -1, tüm örnek boyunca sınıflandırmanın kalitesini değerlendirmenize olanak tanır. Açık yeşil, ortalama olarak en iyi performansı gösterdi.

Aşağıda modellerin metrikleri bulunmaktadır.

Sonuçlar açıkça gösteriyor ki 2014 yılındaki eğitim (%80-%90) en kötü sonuçları verirken, %70'lik başarısızlık anlamlıdır ve bu daha çok örneklem boyutunun küçük olduğunu değil, 2014 yıllarının kalıplarının neredeyse olduğunu gösterir. asla bulunamadı, yani pazar önemli ölçüde değişti, bu da teorik olarak bu dönemin eğitimden tamamen kaldırılabileceği anlamına geliyor.

Şimdi test (muayene) örneğindeki modellerin seçimi için aşağıdaki kriteri kullanıyorum.

if(t==2)if (FinRez>1000 && DD_Balans_Proc_DMM < 30 && Proc_Max_Balans> 70 && Proc_Min_Balans < 30 && Pribolnost_Balans> 10 && ProfitFaktor_Balans>1.2)Filter_03=1;

İşte bu kritere uyan model sayısına ilişkin veriler

Aşağıdaki tabloda, seçilen modellerin sayısı, aşağıdaki kriterlere göre üç örneğin hepsinin göstergeleri dikkate alınmamaktadır.

if(t==0)if (FinRez>10000 && DD_Balans_Proc_DMM < 30 && Proc_Max_Balans> 70 && Proc_Min_Balans < 30 && Pribolnost_Balans> 10 && ProfitFaktor_Balans>1.2)Filter_01=1;
if(t==1)if (FinRez>3000 && DD_Balans_Proc_DMM < 30 && Proc_Max_Balans> 70 && Proc_Min_Balans < 30 && Pribolnost_Balans> 10 && ProfitFaktor_Balans>1.2)Filter_02=1;
if(t==2)if (FinRez>1000 && DD_Balans_Proc_DMM < 30 && Proc_Max_Balans> 70 && Proc_Min_Balans < 30 && Pribolnost_Balans> 10 && ProfitFaktor_Balans>1.2)Filter_03=1;


Burada kar kriterinin sabit olduğu ve bu karı elde etme süresinin farklı setler için değiştiği (belki karşılaştırmanın doğru olması için göstergelerin düşürülmesi gerektiği) dikkate alınmalıdır.

Ve sonuç ne olabilir? Optimal boyutun doğrulama örneğinin %60-70'i olduğu görülmektedir, yani. eğitim, model doğrulamasından daha küçük bir örneklem üzerinde yapılmalıdır. Ancak arızayı %30 oranında vurgulamamak mümkün değil, orada da sonuç her açıdan kötü değil ve başarısızlıklar %40 ve %50'ye çok yakın. Numune büyüklüğünden veya içeriğinden daha fazla neyin etkilendiğini ve bunun nasıl kurulacağını bile bilmiyorum ...

Ve bu deneyin sonuçları hakkında ne düşünüyorsunuz, belki sonuçları doğru yorumlamıyorum? Bu eğitim oranları ve seçim örnekleri sorununu çözmek için metodolojiyi değiştirmek için herhangi bir fikriniz veya başka herhangi bir öneriniz var mı?

Katma:

Ortalama göstergelere göre %80 - %90 arasında çok sayıda sıfır var (modeller için hiç giriş sinyali yoktu) ve bu nedenle bir bozulma var, bu StDV_K_Korrekt_Balans göstergesi örneğinde görülebilir.

StDV_K_Korrekt_Balans için histogram 90%


StDV_K_Korrekt_Balans için histogram 70%


StDV_K_Korrekt_Balans için histogram %30

Eh, grafikler böyle görünüyor (giflerin tıklanarak çalıştığı, böylece her şeyin can sıkıcı bir şekilde titrememesi)

otuz%


%40


elli%


%60

 

Ayrıca eğitimin her zaman eğitimin kontrol edildiği verilerden daha eski verilere dayandığını da not ediyorum - belki de değiştirilmeleri ve ne olduğunu görmeleri gerekir ...

Ortalama küçük Geri Çağırma dikkate değerdir - modelleri daha fazla eğitmek ve 100 ağaçtan sonra iyileştirmelerin yokluğunda eğitimi durdurmamak gerekli olabilir veya istediğimiz kadar çok kararlı kalıp yoktur.

Modellerin ne kadar kesiştiğine bakmamız gerekiyor, düşük bir Geri Çağırma göstergesi ile, biraz korelasyonlu, ancak eşit derecede karlı modeller olma şansı var, o zaman tek bir havuzda birleştirmek için idealler.

 
Alexey Vyazmikin :
Ayrıca eğitimin her zaman eğitimin kontrol edildiği verilerden daha eski verilere dayandığını da not ediyorum - belki de değiştirilmeleri ve ne olduğunu görmeleri gerekir ...

Yukarıdaki her şey harika ve çok bilgilendirici, ancak "öğrenme kontrolü" ne anlama geliyor???

Onlar. örneğin, sistemi 2014 için bir veri örneği üzerinde eğitiyorsunuz ve ardından 2015 için bir örnek veriyorsunuz ve kalıpların olasılığını görmek mi istiyorsunuz? Eğer öyleyse, hiçbir şeyin değiştirilmesine gerek yok, her şey doğru. Yalnız ben burada kontrolün beklenenden başka sonuçlar vermesi açısından bir sorun görmüyorum, bu hep böyle olacak.

 

Sizin durumunuzda MO'nun pratik uygulamasından yola çıkarsak, bence aşağıdakilerden devam etmeliyiz.

Gerçek bir sonucun %100 olasılığını elde etmek gerçekçi olmadığı için, örneğin doğrunun yanlış sonuçlara oranı gibi basit bir yöntemi izleyin, eğer 50/50 bölgesindeyse, o zaman tekrar yapmanız gerekir. %50 kâr ortalama 100 puan ve kalan %50 kayıp ortalama 50 puan ise bu sonuçların size ne kazandırdığını anlayın, o zaman sisteminizin zaten pratik kullanıma uygun olduğunu düşünüyorum.

Neden: