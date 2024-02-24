Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3171
İlk yinelemede fiyat rastgele seçilirse test/sınav örneklerinde sonuç önemli ölçüde değişir mi?
Kendi kendime cevap vereceğim - evet, olacak.
Sinyali (dizeyi) 1000 kez dışlamak için ilk kuantum segmentini rastgele seçtim.
İşte birkaç örnek gif, sürecin farklı rastgele ilk kuantum yinelemeleri ile nasıl gittiği (bırakılabilir).
Ve işte ara yineleme anındaki statik resimler - farklı seçim ve rastgeleleştirme aşamaları.
Ne gibi sonuçlar çıkarılabilir?
1. Şansınız yaver gidebilir ve rastgele çalışan bir model bulabilirsiniz :)
2. Yanlış modellerin sayısını azaltmadan, sadece açgözlülük ilkesini kullanarak bir model oluşturmak zordur.
3. Bir kuantum segmentinde veya tabakasında gözlemlenen düzenliliği tahmin etmek için yöntemler geliştirmeniz gerekir.
4. Rastgelelik, kişinin makine öğreniminde başarılı olduğunu kanıtlamaz.
5. Başarılı olmak için mantıksal olarak geçerli bir model gereklidir.
6. Bir test örneğindeki başarı her zaman bir sınav örneğindeki başarı anlamına gelmez ve bunun tersi de geçerlidir.
Başka hangi sonuçlar çıkarılabilir?
Nasıl bir sonuç çıkarılabilir?
Konu sırasında niceleme yönteminizi gözden kaçırdım, özür dilerim, lütfen bana hatırlatın.
zaman serilerinin nicelleştirilmesi çok önemlidir, örneğin, bir fiyatı renko yöntemiyle nicelleştirirsek SB (en azından istatistiksel olarak alakalı) elde ederiz, bu nedenle "nicelleştirin, nicelleştirmeyin, yine de xxx elde edersiniz" ifadesi en azından hafife alınmış gibi görünüyor, çünkü bilgiyi yok eden nicelleştirme varsa, muhtemelen bilgiyi çıkaran nicelleştirme de vardır. Tabii ki kene akışında bilgi olması şartıyla (bunu hararetle umuyoruz, çünkü aksi takdirde MO uygulaması anlamsız olurdu).
Andrey Dik #:
renko yöntemini kullanarak fiyatı ölçtüğümüzde, SB'yi (en azından istatistiksel olarak ilgili) elde ederiz
Bence barlardan daha fazla SB yok.
Barlardan daha fazla SB olduğunu sanmıyorum.
Bence çok daha büyük bir SB, çünkü barlardaki istatistikler SB performansından çok farklı
Burada henüz kimsenin MO ile tiki'yi keşfettiğini sanmıyorum.
belki de değil, en azından seriyi sayısallaştırmak değil.
"Aksine yöntemle" hareket etmek umut verici görünüyor. yani düzenlilikleri değil, fiyat (tik) serilerinin ("zaman serileri" kullanmak istemiyorum) asla ulaşılamayan ve tarihte meydana gelmeyen durumlarını aramak.
Bu, tüccarlar için uygun bir strateji oluşturmak için sınır koşullarının kullanılmasına izin verecektir.
Konunun akışı içinde gözden kaçırmışım, özür dilerim, sizin nicelleştirme yönteminizi, lütfen bana hatırlatın.
"Nicelleştirilmiş kesme" kavramı basit bir kavramdır - örneğin her satırında sayısal bir değere sahip olan tahmin edicinin aralığıdır. Aralık içindeki her şey bir birim haline gelir.
Aralıklara bölme yöntemleri farklı olabilir ve ben hem CatBoost'ta yerleşik olan varyantları (bousting'de genellikle hem gerekli RAM'i azaltmak hem de boyutluluğu azaltmak için kullanılır) hem de kendime ait bazı varyantları, örneğin farklı sayısal dizileri kullanıyorum.
Tahmin edici, elde edilen ızgarayı bir şekilde kullanarak aralıklara bölündükten sonra, her segment sırayla alınır ve içindeki bilgi değeri için değerlendirilir.
Bir sınıfa ait olma olasılığında, örneğin ortalama değerinden %5 veya daha fazla bir kayma değerli bilgi olarak kabul edilir, ayrıca sinyallerin sayısı ve örnekteki dağılımı da dikkate alınır.
Örnek ikili bir hedefe sahipse, 0 veya 1'e isabet etme olasılığının buna göre kaydırıldığı iki grup kuantum segmenti elde ederiz.
Her kuantum segmentinin kendi sütununa sahip olduğu yeni bir örnek oluşturuyoruz - aralıkta bir sinyal varsa - "1", yoksa - "0" koyun.
Bir sınıfa ait olma olasılığının örnek ortalamasından %5 veya daha fazla kayması, sinyal sayısı ve bunların örnek üzerindeki dağılımının yanı sıra değerli bir bilgi olarak kabul edilir.
IMHO, Maxim'in yakın zamanda yazdığı pi-hacking'e benziyor. Tahsis edilen kuantumların önemini belirlemek için bazı istatistik testleri kullanılmadığı sürece, bu kesinlikle odur.
Bir keresinde SB'de alım satım için haftanın en iyi saatinin seçildiği basit bir örnek vermiştim (açıkça mevcut olmadığı halde). Sadece 5*24=120 varyant vardı, ancak böyle bir saatin her zaman bulunması oldukça yeterliydi (zaman aralığı sanırım yarım yıldı). Orada da "örnekleme istikrarı" var.
"Aksine yöntemle" hareket etmek umut verici görünüyor. yani düzenlilikleri değil, fiyat (tik) serilerinin ("zaman serileri" kullanmak istemiyorum) asla ulaşılamayan ve tarihte meydana gelmeyen durumlarını aramak.
Bu, tüccarlar için uygun bir strateji oluşturmak için sınır koşullarının kullanılmasına izin verecektir.