Queen of Gold Ai Ucb Agents
- Uzmanlar
- Florin Tudor
- Sürüm: 1.0
- Etkinleştirmeler: 15
Queen of Gold AI UCB Agents, kural tabanlı giriş mantığını bağlamsal Üst Güven Sınırı (UCB) bandit katmanı ile birleştiren adaptif bir MQL5 Uzman Danışmanıdır (EA). Amacı yalnızca işlem fırsatlarını tespit etmek değil, aynı zamanda belirli bir piyasa bağlamında hangi işlemin en etkili olduğunu öğrenmek ve bu bilgiyi oturumlar arasında sürdürmektir.
Çalışma ŞekliEA, deterministik bir sinyal motorundan başlar. Temel tetikleyici, ardışık mum davranışlarına dayanır ve kontraryan şekilde yorumlanır:
- Ardışık düşüş baskısı bir ALIŞ (BUY) kurulumu üretebilir
- Ardışık yükseliş baskısı bir SATIŞ (SELL) kurulumu üretebilir
Bu ham kurulum daha geniş bir piyasa bağlamı modeli ile değerlendirilir. EA şunları ölçer:
- Spread koşulları
- Hacim kalitesi
- Tick akışı ve ani hareket davranışı
- Likidite mesafesi / akıllı giriş potansiyeli
- Oturum zamanlaması
- Ödül ve piyasa rejimi
- Hesap sağlığı ve düşük bakiye kısıtlamaları
Bu özellikler bağlamsal bir anahtara kodlanır ve bu anahtar, UCB bandit tarafından kullanılan durum temsilidir.
Bandit Karar KatmanıHer bağlam için bandit, birkaç eylemin değerini tahmin eder:
- HOLD
- BUY_MARKET
- SELL_MARKET
- LIMIT_FOLLOW_SIGNAL
UCB mekanizması iki şeyi dengeler:
- Exploitation (Kullanım): Benzer bağlamlarda geçmişte iyi performans göstermiş eylemleri tekrar etme
- Exploration (Keşif): Güven düşük olduğunda daha az kullanılan eylemleri de test etme
Bu, EA’nın her tespit edilen kurulumu körü körüne uygulamadığı anlamına gelir. EA şunları yapabilir:
- İşleme izin verme
- İşlemi reddetme
- Piyasa yürütmesini tercih etme
- Hassas girişin istatistiksel olarak daha iyi olduğu durumlarda limit yürütmeyi tercih etme
Zamanla, model giderek daha seçici ve bağlam farkındalığı yüksek hale gelir.
Öğrenme SüreciBir pozisyon kapandığında, EA sonucu baz alarak normalize edilmiş bir ödül hesaplar. Bu ödül yalnızca ham kâra dayanmaz; ayrıca şunları da göz önünde bulundurur:
- Tahmini risk ile karşılaştırmalı kâr
- Olumsuz sapmalar
- Pozisyon tutma süresi
- Giriş tipi
- Bağlamsal mikro yapı kalitesi
Ödül daha sonra belirli bağlam ve seçilen kol için UCB hafızasına yazılır, bu da şunları günceller:
- Çekim sayısı (pull count)
- Kümülatif ödül
- Azalan ortalama ödül
Sonuç olarak EA, belirli işlem koşulları için en iyi eylemleri sürekli olarak geliştirir.
Süreklilik ve KurtarmaSistem, yeniden başlatmalar arasında öğrenmeyi koruyacak şekilde tasarlanmıştır:
- UseUcbFilePersistence: Öğrenilen UCB durumunu yerel olarak saklar
- Başlatma sırasında EA bu durumu otomatik olarak yükler
- Öğrenilmiş durum yoksa, UseUcbWarmupFromHistory modeli geçmiş kapatılmış işlemlerden başlatır
- UseUcbJsonSnapshot öğrenilen durumu okunabilir JSON formatında çıktı verir, denetim ve tanılama için kullanılır
Bu sayede EA hem süreklilik hem de kurtarılabilirlik kazanır ve her yeniden başlatmada sıfırdan öğrenmek zorunda kalmaz.
Risk ve Yürütme KontrolleriBandit katmanı, pratik güvenlik önlemleriyle daha geniş bir yürütme çerçevesinin içinde yer alır:
- Maksimum açık işlem kontrolü
- Düşük bakiye koruması
- Zararlardan sonra isteğe bağlı bekleme süresi
- Spread ve hacim toksisite filtreleri
- DOM tabanlı isteğe bağlı onay
- Adaptif akıllı giriş davranışı
- Piyasa vs limit yürütme yönetimi
- Sepet yönetimi ve otomatik kapatma mantığı
Böylece EA yalnızca tahmine dayalı değil, operasyonel olarak da savunmacıdır.
Profesyonel ÖzetBu EA, hibrit bir adaptif yürütme sistemi olarak anlaşılmalıdır:
- Deterministik kurallar, aday işlem fırsatlarını oluşturur
- Bağlamsal UCB, ne zaman ve nasıl hareket edileceğine karar verir
- İşlem sonuçları öğrenme sinyallerine dönüştürülür
- Öğrenilen davranış, oturumlar arasında saklanır ve tekrar kullanılır
Profesyonel terimlerle, bu sabit bir stratejiye güvenmek yerine, zamanla işlem seçiciliğini, yürütme tercihlerini ve bağlamsal tutarlılığı geliştirmeyi amaçlayan kendi kendini güncelleyen bir karar çerçevesidir.
