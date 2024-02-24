Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1531
bugün python'da humnokodil ve bunu aldım
tren
Ölçek
belki eğri test cihazı yazdı, belki başka bir şey, yarın akşam iki kez kontrol edeceğim. Bunu bir makale için yapıyorum (yaklaşımımı açıklamak istiyorum), belki bir karalama bu stratejiyle bir ormandan daha iyi bir iş çıkarır
Böylece CatBoost , örnek adlandırma sistemlerine göre testte öğrenir - herhangi bir şeyi karıştırdınız mı?
genel olarak yeni veriler anlamında, başka bir tarih parçası. Trende yaklaşık olarak böyle olması gerekiyordu, ancak test utanç vericiydi. Belki bir testçi bir yere gözetliyordur
ormanım yaklaşık olarak aynı veriler üzerinde 0.6-0.7 hata ile eğitiliyor ve trende aynı şeyi gösteriyor ama test her zaman iyi değil ve neredeyse her zaman trenden daha kötü. Yükseltme hatası yaklaşık olarak aynı çıktı, ancak test acı verici bir şekilde iyi, bu olmuyornasılsın, yaprak çıkardın mı?
Öyleyse bilmiyorum - bir örnek olmadan sorunun ne olduğunu anlamak imkansız.
Sonuçlarım pek iç açıcı değil. Yaprakları terbiyeli bir şekilde topladım, ama sonra soru ortaya çıkıyor - birbirleriyle en iyi nasıl çalışacakları. Gerçek şu ki, genellikle birbirleriyle %20 - %50 veya daha fazla örtüşüyorlar ve buna göre aynı sinyali verdikleri ortaya çıkıyor ki bu çok iyi değil. Buradaki fikir, onları gruplandırmak ve her grup için bir etkinleştirme eşiği yapmaktır - bence bunu yapmanın en iyi yolu budur.
Şimdiye kadar, karşılıklı filtrelemeyi deniyorum - şu ana kadar yalnızca satın almak için olsa da, R'de bir ağacı yapraklar üzerinde eğittim.
İlk ekran ağaçsız, ikincisi ağaçlı. Cari yılın Mart-Eylül ayları.
Tabii ki, denge eğrisi çok çekici değil, ancak bu, bir trendde kazanılandan daha fazla bir düzlükte kaybetmemek olan bir trend stratejisidir ve piyasa (Si) tüm yıl boyunca nadiren yatay seyretmiştir. güçlü hareketler Ağacın eklenmesinin göreceli performansı iyileştirdiği görülebilir, aynısını daha sonra satış için yapacağım, sonuç olumluysa, o zaman bu modelin bir parçası olacak.
Yaprak seçimi konusu tam olarak çözülmedi, her 5 yılda bir iyi sonuç veren yapraklar seçilse bile, yüzde 20 - yüzde 40'ın çalışmayı bırakmasını bekleyebiliriz ki bu daha da üzücü çünkü imkansız çünkü onları kapatmaya değip değmeyeceğini anlayın - özellikle çeyrekler için bir test yaptım, sonraki çeyreklerde son çeyrekte kârsız yaprakların zararı (birçok) kapsadığı ortaya çıktı.
Sayfa seçim yönteminin kendisi umut verici görünüyor, ancak süreç son derece yavaş.
evet, böyle bir mulien'den hemen para kazanamazsın, yazıkçok az işlem var, temsili olmayan bir şekilde ortaya çıkıyor. Ve kârsız olanları filtreleyin, çünkü hepsine erken ihtiyaç duyulmaz.
Evet, buradaki sorun, her yaprak sinyali için 1 lot tahsis edilmesidir, bu nedenle çok fazla yaprak etkinleştirilirse, daha fazla lot gerekir - 71 lot vardır, ancak çok nadiren ve parayı 71 lotun altında tutarsanız tüm zaman, o zaman her şey yılda% 25 ortaya çıkacak - borsada GO büyük ve bu Si.
Karsız olanları kaldırmak hakkında - bu iki ucu keskin bir kılıçtır - bir yandan, karlı olmayan işlemlerin sayısını azaltacak filtrelerin sayısını artırabilir, ancak aynı zamanda yazdığım gibi karlı olanların sayısını azaltabilirsiniz. yukarıda, birçok yaprak yıl boyunca karlı hale gelir, bu da bu bir zaman meselesi, piyasanın durumu ile ilgili bir soru anlamına gelir. Bu yaklaşımın sorunu, çok emek yoğun olması ve yeni tahmin edicileri, sahip olduğum ve düzenli olarak ortaya çıkan fikirleri hızlı bir şekilde eklemenin bir yolu olmamasıdır - şimdi aslında bu yılın Şubat ayından bir örnekle çalışıyorum.
Performansı artırmanın bir başka yolu da kâr elde etme üzerinde çalışmaktır - şimdi kapanış, çoğunlukla durma ve bir koşulda gerçekleşir - nadir durumlarda.
Tüm eksikliklere rağmen, sistem neredeyse bir yıldır birleşmedi, bu da doğru yönü gösterebilir.
eğitilebilir 2-. aynı özelliklere sahip ilk model üzerinde. Ancak yalnızca girişleri eşitlikle düzeltir, yani. ticareti yasakla / izin ver. En azından ekstra işlem olmayacak, o zaman zaten testler var
Ya da yuvarlanan liste sistemleri portföyü gibi bir şey.
Hedefi nasıl değiştirmeyi önerdiğinizi tam olarak anlamadım - şimdi, aslında, zaten 3 hedefim var - al / sat / ticaret yapma. Ve alım / satım için sayfalar seçiyorum ve sonra bu tür her sayfa için 3 parçaya kadar “ticaret yapma” sayfalarından bir filtre arıyorum (bazıları için bu yeterli, bazıları için yeterli değil - I yapılan testler). Bu çiftlerin sonuçlarından sonra - aktivasyon sayfası + filtre sayfası, ayrıca tüm yaprakların cevaplarını ve karşılıklı dışlanmalarını dikkate alan son sinyale dayalı bir ağaç oluşturdum, yani. ekstra bir filtre.
İşte bir ağaç
Bir ağaç yerine, CB üzerinde bir model denemek istiyorum, belki orada kullanılan tüm sayfaların genelleştirilmesi daha iyi olacaktır, ancak burada doğruluk% 1 artar, ki bu elbette çok fazla değil, ancak sonuç olumlu.
Pekala, teoriyle başlayalım. Örneğin, satılık ve satın almak için ayrı ayrı model seçmenin ne anlamı var?
Alış - satış için olmayan her şey ve tam tersi. Bu nedenle, geleneksel bir ikili sınıflandırıcıya ihtiyaç vardır. Ayrıca, bunu yaparsanız, neden ayrı bir sınıf "ticaret yapmayın"? girdileri daha yüksek bir eşikten filtreleyebildiğiniz zaman. "Ticaret yapma" sınıfına model tarafından aşırı ağırlık verilebilir, bu nedenle modelin hatası azalacaktır ve genel olarak tahmin (genelleme) yeteneği düşecektir.
İkinci modelin anlamı, 1. modelin 1. ve 2. türden hatalara sahip olacağıdır - yanlış pozitif ve yanlış negatif. Onları kaldırmakla ilgileniyoruz. Bunu yapmak için, aynı özellikleri 2. modelin girişine beslersiniz ve ilk modelin ticaretinin sonucu çıktı, burada 0 - işlem karlı, 1 - işlem kârsızdı. İkinci sınıflandırıcıyı eğitir ve yalnızca 0 gösterdiğinde işlem yaparsınız, yani. 1. modelin sinyallerini filtreler. Karsız işlemler trende neredeyse kaybolacak, testte test etmeniz gerekiyor - bu tam zamanı.
İkinci modeli yalnızca trende eğitmekle kalmaz, aynı zamanda OOS'u da yakalarsınız, ardından yeni verilerdeki işlemleri düzeltir - bunlar iki tanedir. Peki, o zaman testler.Numuneyi katlara bölebilir, modelleri kareli düzende belirli parçalar üzerinden çalıştırabilirsiniz. Örneğin, 5 kat. İlk model 1,3,4 kat üzerinde hemen eğitilir. 2.5'te ikinci düzeltici model. Bu, genellemeyi daha da geliştirecektir.