Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2563

 
Maksim Dmitrievski # :

o zaman daha fazla ayrıntıya ihtiyacın var

Size ne yaptığımı daha detaylı anlatacağım bir makale yazmayı düşünüyorum.

Burada benzer yaklaşımları tartışmak istedim ama ilginin olmadığı ortaya çıktı.

Kısacası, adım adım yaptığım şey:

1. CatBoost'u kullanarak, farklı sayıda "kuanta" (zorunlu ön bölmeler) içeren farklı türde kuantum tabloları kaydediyorum.

2. Her bir kuantumu, göstergenin kararlılığı ve tahmin yeteneği için bir komut dosyasıyla analiz ediyorum.

2.1. Numunenin tamamından eksiksizlik ve doğruluk eşiğini geçmek.

2.2. Örnek alandaki hedef öngörücü göstergelerinin hedeften sapma kararlılığının değerlendirilmesi - 7 puan alıyorum ve standart sapmaya göre filtreliyorum.

3. Nicelemenin gerçekleştiği aralıkların uzayında kesişmemelerini hesaba katarak, her tahminci için tüm tablolardan en iyi niceliği seçerim.

4. Kuantanın tahmin edicisinin 0 veya 1 sinyaline sahip olduğu yeni bir örnek (tüm kuantalarda birleştirilmiş ve değil) yeni bir örnek oluşturuyorum.

5. Örnekte benzer bir sinyale sahip tahmin edicileri hariç tutuyorum.

6. Modeli eğitin.

5. noktadan sonra, test ve sınav örnekleri için göstergelerin kararlılığını hala kontrol edersek ve yalnızca tatmin edici bir sonuç gösteren tahmin edicileri seçersek, öğrenme sonuçları önemli ölçüde iyileşir. Bu bir tür hiledir, ancak kullanmaya değer olup olmadığı bir deney meselesidir. Göstergeler ne kadar uzun süre sabit kalırsa, sürdürülebilir olmaya devam etme olasılıklarının o kadar yüksek olduğunu varsayıyorum.

Belirli bir aşama hakkında herhangi bir sorunuz varsa - sorun, daha fazla bilgi vermeye çalışacağım.

PS Ayrıca sadece seçilen kuantum tablosunu kaydedebilir, verimsiz tahmin edicileri ortadan kaldırabilir ve düzenli bir örnek üzerinde eğitim alabilirsiniz - bu aynı zamanda öğrenmeyi de iyileştirecektir.
 
Alexey Vyazmikin # :

Size ne yaptığımı daha detaylı anlatacağım bir makale yazmayı düşünüyorum.

Burada benzer yaklaşımları tartışmak istedim ama ilginin olmadığı ortaya çıktı.

Kısacası, adım adım yaptığım şey:

1. CatBoost'u kullanarak, farklı sayıda "kuanta" (zorunlu ön bölmeler) içeren farklı türde kuantum tabloları kaydediyorum.

2. Her bir kuantumu, göstergenin kararlılığı ve tahmin yeteneği için bir komut dosyasıyla analiz ediyorum.

2.1. Numunenin tamamından eksiksizlik ve doğruluk eşiğini geçmek.

2.2. Örnek alandaki hedef öngörücü göstergelerinin hedeften sapma kararlılığının değerlendirilmesi - 7 puan alıyorum ve standart sapmaya göre filtreliyorum.

3. Nicelemenin gerçekleştiği aralıkların uzayında kesişmemelerini hesaba katarak, her tahminci için tüm tablolardan en iyi niceliği seçerim.

4. Kuantanın tahmin edicisinin 0 veya 1 sinyaline sahip olduğu yeni bir örnek (tüm kuantalarda birleştirilmiş ve değil) yeni bir örnek oluşturuyorum.

5. Örnekte benzer bir sinyale sahip tahmin edicileri hariç tutuyorum.

6. Modeli eğitin.

5. noktadan sonra, test ve sınav örnekleri için göstergelerin kararlılığını hala kontrol edersek ve yalnızca tatmin edici bir sonuç gösteren tahmin edicileri seçersek, öğrenme sonuçları önemli ölçüde iyileşir. Bu bir tür hiledir, ancak kullanmaya değer olup olmadığı bir deney meselesidir. Performans ne kadar uzun süre istikrarlı olursa, sürdürülebilir olmaya devam etme olasılığının o kadar yüksek olduğunu varsayıyorum.

Belirli bir aşama hakkında herhangi bir sorunuz varsa - sorun, daha fazla bilgi vermeye çalışacağım.

PS Ayrıca seçilen kuantum tablosunu kaydedebilir, verimsiz tahmin edicileri ortadan kaldırabilir ve düzenli bir örnek üzerinde eğitim verebilirsiniz - bu aynı zamanda eğitimi de iyileştirecektir.

Kuantum tabloları nedir? ağaç bölme tabloları? bunu asla yapmadı

örneklerle daha iyi makale
 
Maksim Dmitrievski # :

Kuantum tabloları nedir? ağaç bölme tabloları? bunu asla yapmadı

örneklerle daha iyi makale

Kuantum tabloları, tahmin edicinin daha sonra eğitime dahil olan sınırlara / aralıklara bölünmesidir. Evet, bunu daha önce defalarca yazdım.

 
Alexey Vyazmikin # :

Kuantum tabloları, bir tahmin edicinin daha sonra eğitime dahil olan sınırlara/aralıklara bölünmesidir. Evet, bunu daha önce defalarca yazdım.

Anlıyorum. Özellik nicelemenin yalnızca öğrenmeyi hızlandırmak için kullanıldığı görülüyor. Yoksa zor olan var mı? Ben sadece klasik yaklaşımın bir destekçisiyim, artı birkaç sapıklığım
 
Vladimir Baskakov
Henüz mantıklı bir şey göstermediniz, sadece blabla. inekler

İzlemeye devam edin.

 
Alexey Vyazmikin # :

Kuantum tabloları, bir tahmin edicinin daha sonra eğitime dahil olan sınırlara/aralıklara bölünmesidir. Evet, bunu daha önce defalarca yazdım.

Bütün mesele şu ki, nasıl ve ne amaçla nicelleştiriyoruz.

 
Alexey Nikolaev # :

Bütün mesele şu ki, nasıl ve ne amaçla nicelleştiriyoruz.

Zaman yerine bir tahmin edici kullanıldığında, bir şekilde eşitlik monotonluğu alanlarıyla nicelemeyi denedim. Özellikle iyi bir şey görmedim.

 
Montyhole paradoksunu ticaret/karar verme ile ilişkilendirmeye çalışan oldu mu hiç?
 
Maksim Dmitrievski # :
Anlıyorum. Özellik nicelemenin yalnızca öğrenmeyi hızlandırmak için kullanıldığı görülüyor. Yoksa zor olan var mı? Ben sadece klasik yaklaşımın bir destekçisiyim, artı birkaç sapıklığım

Hızlandırmayı öğrenme avantajlardan biridir, ancak benzer tahmin durumlarını toplamanın etkisi de vardır. Kabaca konuşursak, bölüm bölümünü, temel öngörücüden gürültünün çıkarılmasına izin veren ayrı bir ikili öngörücü olarak görüyorum.

Eğitimi iyileştirme etkisine ek olarak, modelde benzer bir sonuç veren ağaç sayısını azalttığı ve dolayısıyla modelin gürültüsünü azalttığı ortaya çıkıyor.

Katı çerçeve tablolarıyla denemeler yapıyorum, bu, bölümün verilere değil, belirli kriterler temelinde, örneğin Fibonacci seviyelerine dayandığı zamandır...

 
Alexey Nikolaev # :

Bütün mesele şu ki, nasıl ve ne amaçla nicelleştiriyoruz.

Ben de yazdım - belirli bir alanda istatistiksel bir avantaj sağlayan istikrarlı bir model belirlemek için. Ve tahmin edicileri nicelleştiriyoruz - herhangi.

Ancak bunu "nasıl" yapmanın daha iyi olduğu açık bir sorudur - şimdiye kadar yalnızca ampirik varsayımlara göre hazırlanmış hazırlanmış tabloların numaralandırılması veya CatBoost algoritmasının istatistiksel bölümlerine göre.

Şekil 3 "kuantayı" göstermektedir - büyük olasılıkla, bir tür stat avantajı olan orta aralık seçilmiştir.

Neden: