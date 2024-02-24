Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1292
Hacimler, trendden düz duruma bir durumdaki bir değişikliği tahmin etmeye yardımcı olur, ancak genel olarak "zorluksuz" olmaktan uzaktır, genel olarak, "trend / düz" durumunu tahmin etmek, birim başına bir sonraki artışın yönünden çok daha doğru değildir. zaman, doğrulukta %57 civarında bir yerde, bazı inanılmaz sayılar hakkında söyledikleri, açıkçası bir hatanın sonucu .
sayılar nelerdir?
Yine de, makine öğrenimi garip ve tahmin edilemez bir şeydir. CatBoost ile hata ayıklama çalışmalarına devam ederken, şu şekilde çalışan bir model elde ettim (eğitim + test + sınav)
2014-2019 arasında çok fazla işlem (346) olmayabilir, ancak diğer yandan fonların çekilmesi tüm zaman için 1299'dur ve bu %10'dan azdır. Elbette 2014'te bir daha olmayabilecek güçlü bir büyüme oldu ama sonrasında çok düzgün oldu.
Aşağıda yalnızca inceleme örneğine ilişkin bir grafik bulunmaktadır (örnek bu testten daha küçük olduğu için koşullu olarak)
Ama ben sadece grafik göstermiyorum, bu alışılmadık bir durum değil ama modelin içeriğine baktığımda çok şaşırdığımı söylemek istiyorum - orada 38 tahminciden sadece 4'ü kullanılıyor!
TimeH - saat cinsinden süre
DonProcVisota_M15 - M15'teki Donchian kanalının göreceli genişliği
LastBarPeresekD_Down_M15 - Son Donchian kanalı geçişinden bu yana çubuk sayısı
BB_PeresekN_Total_M1 - Son x çubuk için iDelta seviyelerinin fiyat geçişlerinin sayısı
Tabii ki, örneklemde çok sayıda tahmin edici var, onları böldüm, sonra onları tohumladım ve tüm bunlar, örneği açgözlülük ilkesine göre bölmenin her zaman etkili olmadığı teorime uyuyor - bu sadece bir yöntem hiçbir şeyi garanti etmez.
Benim toplayıp birleştirmek istediğim modeller bunlar.
Oturma - bu nedir? Yandex yalnızca torrentlerin dağıtımından bahseder.
Tahmin edicilerin çoğunun aslında gürültü olması veya birbiriyle ilişkili olması beklenir.
Buradaki fikir, gürültü olmaları değil, bazı tahmin edicilerin diğerleriyle örtüşmesidir - oluşturulan bağlantılar önemlidir ve oluşturulmaları gerekir.
Tohum ekiyorum, tabi ki terimi kendim için icat ettim - --random-seed bayrağını belirli bir dijital değerle kullanıyorum. Doğru, bu değerin hangi aralıklara sahip olduğunu bilmiyorum ama öğrenmenin önemli ölçüde etkilendiğini görüyorum ve bu kontrollü randomizasyon bana uygun.
Sonucu büyük ölçüde etkilememesi arzu edilir. Aksi takdirde, belirli bir rasgele sığdığı ortaya çıkıyor. Onlar. optimize edilmesi gereken (önemli ölçüde etkileyen) bir özellik daha var.
Trendler\daireler neredeyse %90 tahmin ediliyor diyen konuda yukarıda gördüğüm gibi, oradaki birinin torunu ya da öğrencisi şöyle diyor gibiydi.
ahhh
Peki, kene yoksa, görünüşe göre piyasa düzdür, %100ve eğer çok sayıda kene varsa, artık düz değildir.
Rastgeleliği düzeltin. Bu, genellikle yeniden başlatmalar arasında tekrarlanabilir sonuçlar için kullanılır.
Evet, sonucu daha sonra çoğaltmak ve genel olarak sonuç üretmek gerekiyor.
Sadece nasıl çalıştığı tam olarak belli değil, anladığım kadarıyla, bu parametre en iyi seçeneği seçerken bölme sonuçlarını hesaplamanın rastgeleliğinden sorumludur, ancak hiçbir yerde ayrıntıları bulamıyorum.
Ve uyum hakkında... her şeyin potansiyel bir uyum olduğu gerçeğinden yola çıkmalıyız ve sadece ilişkilerin istikrarını zaman içinde kontrol edebilir ve bu ilişkilerin etkinliğini kontrol edebiliriz, örneğin, bu model her biri 4 ağaçtan oluşur. ayrıca 4 derin, yani. az sayıda kombinasyon nedeniyle, buradaki uyum çok etkilidir, bu da bunun yalnızca numunenin bir açıklaması değil, bir tür desen olduğu ortaya çıkabileceği anlamına gelir.