Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 1322

 
Yuri Asaulenko :

Beyler, konu MO ile ilgili, ticaret stilleri ve duraklarla ilgili değil. Onlar niye burada?

Ben de bunu Ulusal Meclis çerçevesinde tartışmak istedim ama ortaya çıktı ki henüz kimseyle kimse yok.

 
Yuri Asaulenko :

Daha dün, konuşma sinüzoidleri tahmin etmeye döndü ve eski konumu hatırladım:

Maxim, hala bu konuya girdin. Ben haklıyım ve her şeyi yazıyorum.)

Söylemeliyim ki, boşuna geldiler ama konu kapandı ve bir türlü o noktaya gelmedi. Belki de çok iyi olmadığından. açık ifade.

Aslında, herhangi bir sorunu çözmeye gerek yok. Konudaki gibi veya daha da iyisi, daha karmaşık olan bazı işlevleri alıyoruz. Bu fonksiyonla yapay bir enstrüman oluşturuyoruz ve zaten çalışan bir strateji üzerinde test cihazında çalıştırıyoruz. Teoride, çalışan bir araçta kâr ölçeğin dışına çıkmalıdır. Evet, unuttum, önce işlevi, TS'nin ayarlandığı alete yaklaşık olarak karşılık gelecek şekilde normalleştiriyoruz. Daha sonra gürültü ekleyebilir ve ne olduğunu görebilirsiniz.

Tahmin yapmıyorum, böyle hazır bir aracım yok, bu yüzden yakın gelecekte kontrol edemiyorum. Ama uzaklarda, planlıyorum.

Şimdi tüm bunlara neden ihtiyaç duyulduğu hakkında.

NN (veya diğer MO) tahminini öğretmemiz gerektiğini varsayalım. Genellikle, NN'nin başlangıç ağırlıkları rastgele başlatılır ve NN, eğitim sırasında min-max'a girerse, bu çok iyidir. büyük soru.

Aşağıdakileri yapıyoruz.

1. TS pazarına yakın rastgele olmayan bir fonksiyon oluşturuyoruz ve bunun üzerinde rastgele başlatılmış bir NN eğitiyoruz. Kontrol ve tüm bunlar. Şimdi NS'miz ayarlarda ihtiyaç duyulana yakın, ancak henüz gerçek sorunu çözemiyoruz.

2. NN'yi (bkz. madde 1) gerçek bir VR üzerinde eğitiyoruz. Aynı zamanda, NN'nin ön ayarlarının zaten minimum-maks alanlarının yakınında bir yerde olduğuna dair bazı garantilerimiz var ve ek eğitim sırasında rastgele minimum-maksimum alanlara değil, ihtiyaç duydukları yere gidecekler. .

İlk önce bir konudaki basit problemleri çözmeyi öğreten bir okul çocuğu ile bir benzetme ve daha sonra bu problemler karmaşıktır. Bir okul çocuğuna öğretmek, sizi karmaşık sorunları hemen çözmeye zorlamaktan daha etkilidir.

Genel olarak bir yöntem, bir keşif değil, literatürde bir yerde bulundu ama çok kitap var ama bir tanesini hatırlamıyorum. Her durumda, uygulamayı düşündüm. Tamamlanmış bir TS'nin analitik bir işlevi tahmin etme girişimi olan ilk deney, genel olarak aşamalı olarak gereklidir.



bu bir sel olmasaydı, 2 sayfa önce f-her ile bir örnek görürdünüz

ölçeklerin başlatılması hakkında düşündüm ve benzerleri. Anlamadım, o zaman ek bir eğitim ızgarasına ihtiyacımız var ve tahmin edilmesi gerekenle hiç uyuşmayan bir şey üzerinde eğitim almanın anlamı nedir?

Sanırım pekiştirmeli öğrenmenin temellerini tasvir etmeye çalışıyorsunuz.

 
Maksim Dmitrievski :

ushlepok sel olmasaydı, 2 sayfa önce f-her ile bir örnek görürdünüz.

ölçeklerin başlatılması hakkında düşündüm ve benzerleri. Anlamadım, o zaman ek bir eğitim ızgarasına ihtiyacımız var ve tahmin edilmesi gerekenle hiç uyuşmayan bir şey üzerinde eğitim almanın anlamı nedir?

Sanırım pekiştirmeli öğrenmenin temellerini tasvir etmeye çalışıyorsunuz.

Hayır, bir eğitime ihtiyacınız yok.

1. Yakın ve açıkça öngörülebilir verilerle ilgili ön eğitim. Gerçek olanlardan yemek yapabilirsiniz - spline'lar, polinomlar, Fourier veya başka bir şey.

2. Madde 1'e göre bu ağın ileri eğitimi (zaten rastgele olmayan başlatma ile) halihazırda gerçek veriler üzerinde.

Tahmin için bunun nasıl yapıldığını görüyorum ve sonuçları iyileştirebileceğini düşünüyorum. Sınıflandırma için - Aklımı buna vermeyeceğim.

İşlevli bir örnek bununla ilgili değildir. Kir gibi örnekler.

 
Maksim Dmitrievski :

Alexey, bugün araştırma için en iyilerinden biri olan en kötü catboost'tan çok uzak olanı seçti. Örneğin, CERN'de kuantum rastgeleliği ile ilgilenen bir çarpıştırıcının sonuçlarını analiz etmek için kullanılır.)

Pts ilginç bilgi.) CERN XGBoost Yanlışlıkla rastladım.

Şaşırtıcı olmayan bir şekilde, CERN bunu Büyük Hadron Çarpıştırıcısından gelen sinyalleri sınıflandırmak için en iyi yaklaşım olarak kabul etti. CERN tarafından ortaya konan bu özel sorun, yılda 3 petabayt hızında üretilen verileri işlemek için ölçeklenebilir ve karmaşık bir fiziksel süreçte son derece nadir bir sinyali arka plan gürültüsünden verimli bir şekilde ayırt edecek bir çözüm gerektiriyordu. XGBoost en kullanışlı, basit ve güvenilir çözüm haline geldi. (6 EYLÜL 2018)

____________________

CatBoost, Büyük Hadron Çarpıştırıcısı'ndaki (LHC) araştırma sırasında Avrupa Nükleer Araştırma Merkezi (CERN) tarafından LHCb dedektörünün çeşitli bölümlerinden gelen bilgileri bir parçacık hakkında en doğru, toplu bilgiyle birleştirmek için uygulandı. Verileri birleştirmek için CatBoost'u kullanan bilim adamları, CatBoost'un sonuçlarının diğer yöntemlerle elde edilen sonuçlardan daha iyi olduğu ortaya çıktığında nihai çözümün niteliksel özelliklerini iyileştirmeyi başardılar[6]][7].

__________________________

Hepsi neredeyse bire bir. Peki Catboost veya XGBoost hangisi ? ) Kim kimden kopya çekti merak ediyorum? ))

 
Alexey Vyazmikin :

Gelecek tanımlı değil, kalıplar hem ortaya çıkıyor hem de kayboluyor, bu normal, ancak mutlaka kısa vadeli olmaları gerektiği gerçeği şüpheli. Bir trend stratejisi kullanımı nedeniyle örneğim çok büyük değil, bu yüzden onu daha da azaltmanın mantıksız olduğunu düşünüyorum.

Ancak, eğitimde yer alan eğitim ve test örneklerinin farklı oranları üzerinde eğitimin etkinliği üzerine bir deney yapmaya karar verdim. Adım %10 olacaktır, yani. %90'ın başında eğitim ve %10'luk test, ardından test kademeli olarak %10 artar, her sürümde 200 model olacak - bakalım ne olacak. Başka bir soru, bu kombinasyonların ortalama veya mutlak kritere göre en iyi nasıl karşılaştırılacağıdır - fikirler kabul edilir.

Kısa vadeli kalıplara göre - 10-15 dakikadan maksimum 1 saate kadar, bir şeyi değiştiren önemli olayların olasılığı çok iyi. küçük, özellikle de önemli bir olay üzerinde anlaşmaya vardığımız için. Bir saatten fazla - orada ne olacak, en azından hiç bilmiyorum. Bu size karşı değil, fikrinizi haklı çıkarmak için.)

Kendi değişikliklerim ve konuya bakış açımla senin yolunu takip etmeye karar verdim. Ayrıca, gerekli tüm öngörücüler zaten orada. XGBoost'ta denemeye karar verirken, bana bir şey gibi görünüyordu - ya CatBoost rıhtımları etkilenmedi (XGBoost, IMHO, daha net) ya da başka bir şey. Yönetmelikte neyin yanlış olduğunu henüz çözemedim. C NS, orada her şeyi normalleştirmeye şaşıracaksınız.

 
Yuri Asaulenko :

Hepsi neredeyse bire bir. Peki Catboost veya XGBoost hangisi ? ) Kim kimden kopya çekti merak ediyorum? ))

Ve bunlara dayalı modeller yaratmadan ve onları piyasa kaosuna salmadan önce bunu anlamak iyi olurdu.

Yarım yıl önce burada CatBoost'u test etmeye çalıştıklarını hatırlıyorum, o zaman XGBoost'un aksine çarpım tablosunda bile öğrenememiş.

bilmiyorum, belki Şimdi, eğer basit bir tane çekmiyorsa, hemen karmaşık bir tane üzerinde denemeniz gerektiğine karar verdiler, ya da belki de gerçekten harikadır.

Bunu belirlemek için muhtemelen yukarıda önerilen sentetik VR'yi kullanmak mümkün olacaktır.

 
Ivan Negreshniy :

Ve bunlara dayalı modeller yaratmadan ve onları piyasa kaosuna salmadan önce bunu anlamak iyi olurdu.

Yarım yıl önce burada CatBoost'u test etmeye çalıştıklarını hatırlıyorum, o zaman XGBoost'un aksine çarpım tablosunda bile öğrenememiş.

bilmiyorum, belki Şimdi, eğer basit bir tane çekmiyorsa, hemen karmaşık bir tane üzerinde denemeniz gerektiğine karar verdiler, ya da belki de gerçekten harikadır.

Bunu belirlemek için muhtemelen yukarıda önerilen sentetik VR'yi kullanmak mümkün olacaktır.

En azından XGBoost'un belgeleri çok daha iyi ve daha fazlası. CatBoost'ta Yandex'in kendi malzemelerine ek olarak, önceden hazırlanmış birkaç Pts daha var.

 
Yuri Asaulenko :

Kısa vadeli kalıplara göre - 10-15 dakikadan maksimum 1 saate kadar, bir şeyi değiştiren önemli olayların olasılığı çok iyi. küçük, özellikle de önemli bir olay üzerinde anlaşmaya vardığımız için. Bir saatten fazla - orada ne olacak, en azından hiç bilmiyorum. Bu size karşı değil, fikrinizi haklı çıkarmak için.)

Stratejimin bir parçası olarak olasılık oynaklığını bu şekilde görmüyorum. Model girmek için bir sinyal verdiyse, o zaman giriyoruz, çünkü şu anda (başka bir deyişle, eğitim sırasında elde edilen istatistiklere göre), bunun için uygun koşullar gelişti, ancak çıkışım TS'nin farklı versiyonlarında farklılık gösteriyor - ya TP / SL veya sadece SL ile. Sonuç olarak, pozisyon kapanana kadar tahmin iptal edilmez ve üç saate kadar geçerli olabilir. Onlar. Tam olarak zamanı değil, x bar önceki fiyata, başka bir deyişle yerel dairenin bitişine dönme olasılığını tahmin ediyorum.

Ama ben tamamen farklı bir şey hakkında, yani tanımlanan kalıbın zaman içinde tekrarlanma sıklığı hakkında, kalıp / işaret üç yıl boyunca bir araya geldiyse ve öngörülebilir olaylara yol açtıysa, o zaman çalışmasına devam etme şansının daha yüksek olduğunu yazdım. dördüncü yıl, eğitim süresinin küçük bir bölümünde ortaya çıkan düzenlilik, yalnızca üst zaman dilimindeki durumun bir açıklaması olabilir (haftalık grafikteki eğilim).

Her halükarda bunlar benim teorik uydurmalarım, şimdi deneyin sonuçlarını işleyeceğim ve durum daha şeffaf olacak, umarım.

Yuri Asaulenko :

Kendi değişikliklerim ve konuya bakış açımla senin yolunu takip etmeye karar verdim. Ayrıca, gerekli tüm öngörücüler zaten orada. XGBoost'ta denemeye karar verirken, bana bir şey gibi görünüyordu - ya CatBoost rıhtımları etkilenmedi (XGBoost, IMHO, daha net) ya da başka bir şey. Yönetmelikte neyin yanlış olduğunu henüz çözemedim. C NS, orada her şeyi normalleştirmeye şaşıracaksınız.

Catboost'un daha fazla ayarı vardır, XGBoost fikrinin gelişiminin bir devamıdır, ana artı ve eksi aynı zamanda sayıları büyük değilse yeniden eğitmeyi önleyen sabit boyutlu ağaçlardır.

En saf haliyle sınıflandırma için herhangi bir şeyi normalleştirmeye gerek yoktur. Ancak, tahmin edicilerde ön işleme yapıyorum , değer aralığını azaltıyorum ve aralığın kendisi ampirik olarak gruplara ayrılıyor. Belki de bu dönüşümler olmadan sonuç daha iyi olurdu - kontrol etmedi. Geliştiriciler bir yandan hiçbir şeyi kendiniz dönüştürmenize gerek olmadığını söylerken, diğer yandan sayıları algoritmaya göre dönüştürmek için farklı ayarlar var ve buna ek olarak ayrı bir dosyadan dökümünüzü kullanabilirsiniz. Bu catbust için geçerli ama bence mantık her yerde aynı.

 
Ivan Negreshniy :

Ve bunlara dayalı modeller yaratmadan ve onları piyasa kaosuna salmadan önce bunu anlamak iyi olurdu.

Yarım yıl önce burada CatBoost'u test etmeye çalıştıklarını hatırlıyorum, o zaman XGBoost'un aksine çarpım tablosunda bile öğrenememiş.

bilmiyorum, belki Şimdi, eğer basit bir tane çekmiyorsa, hemen karmaşık bir tane üzerinde denemeniz gerektiğine karar verdiler, ya da belki de gerçekten harikadır.

Bunu belirlemek için muhtemelen yukarıda önerilen sentetik VR'yi kullanmak mümkün olacaktır.

CatBoost ve XGBoost'un farklı ağaç derinlikleri var, ağaç sayısını eklerken CatBoost'un görevle başarılı bir şekilde başa çıktığını hatırlıyorum.

Ağaçları kullanarak farklı işlevleri aramaya gelince, bunları NN kullanarak aramak ve sonuçları sınıflandırma için öngörücüler olarak göndermek daha iyidir. Her durumda, fiyatları çıplak biçimde belirlemenin bir destekçisi değilim, ancak daha sık yeniden eğitim gerekli olmasına rağmen Maxim bunu başardı.

 

NN'nin işlevleri tanımlama yeteneğinden şüphe duyanlar için


Neden: