Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3336

 
СанСаныч Фоменко #:

Etiketler (öğretmen, hedef değişken) tanım gereği saçma OLAMAZ.

Sanych, kendini utandırma.

Fikrinizi ifade etmek için çalışmaya bile başlamadınız.

 

Bir başka komik gerçek, görünüşe göre bu sadece yeniden eğitim diye düşünüyordum ve sınıf değişikliğinin hangi endekslerde gerçekleştiğini görmeye karar verdim - sonlara doğru bunun sadece yeniden eğitimin iyi bir örneği olduğunu düşündüm.

Aslında şöyle bir sonuç ortaya çıktı


Test numunesi üzerinde

Bu ilk bin sayfanın (modele bir sonraki ekleme dizisinde) çoğunlukla kararsız olduğu ortaya çıktı!

Şaşırdım.

Sınav örneği üzerinde

 
Aleksey Vyazmikin #:

Bir başka eğlenceli gerçek, görünüşe göre bu sadece yeniden eğitim diye düşünüyordum ve sınıf değişikliğinin hangi endekslerde gerçekleştiğini görmeye karar verdim - sona yakın olduğunu ve bunun sadece yeniden eğitimin iyi bir örneği olduğunu düşündüm.

Aslında bu şekilde ortaya çıktı


Test numunesi üzerinde

Çoğunlukla kararsız olanın ilk bin sayfa (modele bir sonraki ekleme sırasındaki) olduğu ortaya çıktı!

Şaşırdım.

Bir örnek üzerinde

Bousting ile sayıyorsunuz, değil mi? Burada, yalnızca ilk ağaç orijinal öğretmenin etiketleri üzerinde eğitilir.
Diğer tüm ağaçlar için öğretmen tahmin hatasıdır, yani (Y - Pred). Ve hatta eta = 0.1...0.001. Bu ağaçların yapraklarının etkisi önemsizdir, sadece doğrudurlar. Gösterdiğiniz şey (onların önemsizliği).
 

GPT öğretmek için)

Tamam, analizimize Zarflar göstergesini ekleyelim. Zarflar göstergesi, hareketli bir ortalamanın üstündeki ve altındaki çizgileri temsil eder. Genellikle bu hareketli ortalamadan sabit bir yüzde uzaklığındadırlar.

  1. Geçen ay için zarflar (Kasım 2023):

    • Hareketli ortalamadan bir yüzde mesafesi seçelim.
    • Üst ve alt Zarf çizgilerini hesaplayalım.
  2. RSI, Bollinger Bantları ve Zarfları kullanarak genel eğilim:

    • Farklı göstergelerden elde edilen sinyalleri karşılaştıralım.

Ayrıca, farklı göstergelerden gelen sinyallerin çelişkili olabileceğini ve bunları birlikte analiz etmenin önemli olduğunu göz önünde bulundurun.

Hesaplamalar ve analizlerle devam edelim.

 
Yuriy Vasilyev göstergesini ekleyelim. Zarflar göstergesi, hareketli bir ortalamanın üstündeki ve altındaki çizgileri temsil eder. Genellikle bu hareketli ortalamadan sabit bir yüzde uzaklığındadırlar.
  1. Geçen ay için zarflar (Kasım 2023):

    • Hareketli ortalamadan yüzdelik bir mesafe seçelim.
    • Üst ve alt Zarf çizgilerini hesaplayalım.
  2. RSI, Bollinger Bantları ve Zarfları kullanarak genel eğilim:

    • Farklı göstergelerden elde edilen sinyalleri karşılaştıralım.

Ayrıca, farklı göstergelerden gelen sinyallerin çelişkili olabileceğini ve bunları birlikte analiz etmenin önemli olduğunu dikkate alalım.

Hesaplamalar ve analizlerle devam edelim.

Bir tahmin almak için fiyat göndermeyi denediniz mi? Bu tür şeyler piyasada uygulanıyor, görünüşe göre birisi algoritmayı sızdırmış
 
Forester #:
Güçlendirmeyi sayıyorsunuz, değil mi?

Çok haklısınız, CatBoost'tan bahsediyoruz!

Forester #:
Burada yalnızca ilk ağaç, ilk öğretmenin etiketleri ile eğitilir.
Diğer tüm ağaçlar için öğretmen tahmin hatasıdır, yani (Y - Pred).

Aslında, teorinin önerdiği de budur.

Forester #:
Evet ayrıca eta = 0.1...0.001 katsayısı ile

"Öğrenme oranı" katsayısı, en azından CatBoost'ta, tüm ağaçlar için sabittir.

Forester #:
Bu ağaçların yapraklarının etkisi önemsizdir, sadece düzeltirler. Gösterdiğiniz şey de bu (önemsizlikleri).

CatBoost'ta yaprak katsayılarının nasıl düzenlendiğini gerçekten açıklayabilir misiniz?

İyi anlamadığım noktalar var.

Ancak, yapraklardaki "sınıf" değişikliğini gösterdim, yani aslında yaprakların %40'ı yeni verilerde toplamları yanlış yöne çekiyor gibi görünüyordu.

 
Aleksey Vyazmikin #:

CatBoost'ta katsayıların yapraklara nasıl düzenlendiğini gerçekten açıklayabilir misiniz?

CatBoost kodunu araştırmamı ve size tam cevabı vermemi ister misiniz? Ben sadece ilgilendiğim şeyleri araştırırım. CatBoost kullanmıyorum.
Yaprak katsayılarını ilk kez duyuyorum - nedir bunlar?

Öğretici ve basit boost kodu burada https://habr.com/ru/companies/vk/articles/438562/
Пишем XGBoost с нуля — часть 2: градиентный бустинг
Пишем XGBoost с нуля — часть 2: градиентный бустинг
  • 2019.02.07
  • habr.com
Всем привет! В прошлой статье мы разбирались, как устроены решающие деревья, и с нуля реализовали алгоритм построения, попутно оптимизируя и улучшая его. В этой статье мы реализуем алгоритм градиентного бустинга и в конце создадим свой собственный XGBoost. Повествование будет идти по той же схеме: пишем алгоритм, описываем его, в заверешение...
 
Aleksey Vyazmikin #:

Ayrı bir örnek testte - 7467 ve sınavda - 7177 olduğunu bildiriyorum, ancak hiç aktivasyon olmayan az sayıda yaprak yok - bir kerede saymadım.


Bu, test örneği için değerlerine göre sınıf değiştiren yaprakların dağılımıdır


ve bu da sınav.

Ve bu da sınıflara göre dağılım - üç tane var, üçüncüsü "-1" - aktivasyon yok.


Örnek tren için


Test numunesi için


Sınav örneği için

Genel olarak, yaprak ağırlıklarının artık sınıf mantığına karşılık gelmediğini görebiliriz - aşağıda test örneğinden alınan grafik var - net bir vektör yok.


Genel olarak, bu yöntem her şeye yaklaşır, ancak tahmin edicilerin kalitesini garanti etmez.

Genel olarak, yukarıdaki grafikteki farklı "çubukların" yer ve aktivasyon sıklığına göre çok benzer yapraklar olduğunu varsayıyorum.


Bilmediğiniz bir şeyi tartışmak zordur. Bu nedenle başarınız için sadece mutlu olabilirim. Böyle bir yöntemim olsaydı kullanırdım :)

Benim yöntemim henüz bu kadar nitelikli sonuçlar vermiyor, ancak yeterince iyi paralellik gösteriyor.

Bunun neden olduğunu hiç merak ettiniz mi?

 

Naif koda aktarılan modelin test hızı (catbust)

EURUSD,H1: total time from login to stop testing 0:00:04.143 (including 0:00:00.031 for history data synchronization)

Ve ONNX'e aktarıldı

EURUSD,H1: total time from login to stop testing 0:00:09.539 (including 0:00:00.025 for history data synchronization)

Botun iki versiyonunun iç kısımları neredeyse benzerdir, sonuçlar aynıdır.

 
Forester #:
Sizin için catbust kodunu araştırmamı ve size tam bir cevap vermemi ister misiniz? Ben sadece ilgilendiğim şeyleri araştırırım. Ben catbust kullanmıyorum.

Bildiğinizi sanıyordum ama bilmiyorsunuz - sizi zorlamak aklıma gelmedi.

Forester #:
Yaprak katsayılarını ilk kez duyuyorum - nedir bunlar?

Bir fonksiyonun Y koordinatını oluşturmak için toplanan yaprak değerler.


X'te 0,5'ten büyük veya eşit olması, CatBoost'ta varsayılan sınıfın "1" olduğu anlamına gelir.
Neden: