Queen of Gold Ai Ucb Agents

Queen of Gold AI UCB Agents, kural tabanlı giriş mantığını bağlamsal Üst Güven Sınırı (UCB) bandit katmanı ile birleştiren adaptif bir MQL5 Uzman Danışmanıdır (EA). Amacı yalnızca işlem fırsatlarını tespit etmek değil, aynı zamanda belirli bir piyasa bağlamında hangi işlemin en etkili olduğunu öğrenmek ve bu bilgiyi oturumlar arasında sürdürmektir.

Çalışma Şekli

EA, deterministik bir sinyal motorundan başlar. Temel tetikleyici, ardışık mum davranışlarına dayanır ve kontraryan şekilde yorumlanır:

  • Ardışık düşüş baskısı bir ALIŞ (BUY) kurulumu üretebilir
  • Ardışık yükseliş baskısı bir SATIŞ (SELL) kurulumu üretebilir

Bu ham kurulum daha geniş bir piyasa bağlamı modeli ile değerlendirilir. EA şunları ölçer:

  • Spread koşulları
  • Hacim kalitesi
  • Tick akışı ve ani hareket davranışı
  • Likidite mesafesi / akıllı giriş potansiyeli
  • Oturum zamanlaması
  • Ödül ve piyasa rejimi
  • Hesap sağlığı ve düşük bakiye kısıtlamaları

Bu özellikler bağlamsal bir anahtara kodlanır ve bu anahtar, UCB bandit tarafından kullanılan durum temsilidir.

Bandit Karar Katmanı

Her bağlam için bandit, birkaç eylemin değerini tahmin eder:

  • HOLD
  • BUY_MARKET
  • SELL_MARKET
  • LIMIT_FOLLOW_SIGNAL

UCB mekanizması iki şeyi dengeler:

  • Exploitation (Kullanım): Benzer bağlamlarda geçmişte iyi performans göstermiş eylemleri tekrar etme
  • Exploration (Keşif): Güven düşük olduğunda daha az kullanılan eylemleri de test etme

Bu, EA’nın her tespit edilen kurulumu körü körüne uygulamadığı anlamına gelir. EA şunları yapabilir:

  • İşleme izin verme
  • İşlemi reddetme
  • Piyasa yürütmesini tercih etme
  • Hassas girişin istatistiksel olarak daha iyi olduğu durumlarda limit yürütmeyi tercih etme

Zamanla, model giderek daha seçici ve bağlam farkındalığı yüksek hale gelir.

Öğrenme Süreci

Bir pozisyon kapandığında, EA sonucu baz alarak normalize edilmiş bir ödül hesaplar. Bu ödül yalnızca ham kâra dayanmaz; ayrıca şunları da göz önünde bulundurur:

  • Tahmini risk ile karşılaştırmalı kâr
  • Olumsuz sapmalar
  • Pozisyon tutma süresi
  • Giriş tipi
  • Bağlamsal mikro yapı kalitesi

Ödül daha sonra belirli bağlam ve seçilen kol için UCB hafızasına yazılır, bu da şunları günceller:

  • Çekim sayısı (pull count)
  • Kümülatif ödül
  • Azalan ortalama ödül

Sonuç olarak EA, belirli işlem koşulları için en iyi eylemleri sürekli olarak geliştirir.

Süreklilik ve Kurtarma

Sistem, yeniden başlatmalar arasında öğrenmeyi koruyacak şekilde tasarlanmıştır:

  • UseUcbFilePersistence: Öğrenilen UCB durumunu yerel olarak saklar
  • Başlatma sırasında EA bu durumu otomatik olarak yükler
  • Öğrenilmiş durum yoksa, UseUcbWarmupFromHistory modeli geçmiş kapatılmış işlemlerden başlatır
  • UseUcbJsonSnapshot öğrenilen durumu okunabilir JSON formatında çıktı verir, denetim ve tanılama için kullanılır

Bu sayede EA hem süreklilik hem de kurtarılabilirlik kazanır ve her yeniden başlatmada sıfırdan öğrenmek zorunda kalmaz.

Risk ve Yürütme Kontrolleri

Bandit katmanı, pratik güvenlik önlemleriyle daha geniş bir yürütme çerçevesinin içinde yer alır:

  • Maksimum açık işlem kontrolü
  • Düşük bakiye koruması
  • Zararlardan sonra isteğe bağlı bekleme süresi
  • Spread ve hacim toksisite filtreleri
  • DOM tabanlı isteğe bağlı onay
  • Adaptif akıllı giriş davranışı
  • Piyasa vs limit yürütme yönetimi
  • Sepet yönetimi ve otomatik kapatma mantığı

Böylece EA yalnızca tahmine dayalı değil, operasyonel olarak da savunmacıdır.

Profesyonel Özet

Bu EA, hibrit bir adaptif yürütme sistemi olarak anlaşılmalıdır:

  • Deterministik kurallar, aday işlem fırsatlarını oluşturur
  • Bağlamsal UCB, ne zaman ve nasıl hareket edileceğine karar verir
  • İşlem sonuçları öğrenme sinyallerine dönüştürülür
  • Öğrenilen davranış, oturumlar arasında saklanır ve tekrar kullanılır

Profesyonel terimlerle, bu sabit bir stratejiye güvenmek yerine, zamanla işlem seçiciliğini, yürütme tercihlerini ve bağlamsal tutarlılığı geliştirmeyi amaçlayan kendi kendini güncelleyen bir karar çerçevesidir.


Yazarın diğer ürünleri
Little Queen – Momentum ve Likidite Scalper Lansman Teklifi İlk 100 müşteri bugünden itibaren özel lansman fiyatından yararlanır. Daha sonra fiyat artırılacaktır. Özel Bonus Satın alma işleminden 7 gün sonra WhatsApp üzerinden iletişime geçin. Bu sürümü satın aldığınızda ek bir AI sistemi alacaksınız: Multi-Armed Bandit Agent EA (bonus olarak verilir). XAUUSD M1 için SET dosyası yorumlarda mevcuttur. LITTLE QUEEN NE YAPAR Little Queen, hacim ile doğrulanan yapılandırılmış fiyat hareketlerini kul
Gold Trader Scalper – Multi-Asset Expert Advisor (XAUUSD • Forex • Indices • Crypto • Stocks) What it is Gold Trader Scalper is a automated advance algorithm EA designed for momentum exhaustion entries (consecutive candles) combined with smart entry into liquidity/volume zones and adaptive risk control. Works on multiple instruments including XAUUSD (Gold), Forex pairs, Indices, Crypto and Stocks/CFDs (depending on your broker’s symbol availability). Key Features 1) Smart Signals & Entries Conse
. Stock Trader Scalper v7.0 – Smart Momentum & Liquidity Execution EA Stock Trader Scalper is a semi-automatic / fully automated Expert Advisor designed for traders who want precision entries, adaptive risk control, and intelligent capital protection. - New  SET.FILE XAUUSD M1 IN THE COMMENTS ! this set file is made for actual price on xauusd if you back test from 6 years a go you must make your set file !!! - it has everythink for day scalping ,in a few days i will put a price on him so tes
FTMO Maximum Scalper – Disciplined Gold Execution System Trade Gold with Precision. Execute with Control. Protect Risk First. Prop Firm Ready FTMO Maximum Scalper is a specialized MetaTrader 5 Expert Advisor for XAUUSD M1, Forex, Indices, and Stocks, designed for traders who prefer structured execution, controlled risk flow, and a disciplined scalping approach in active gold market conditions. This EA is focused and practical, built around: Short-term momentum behavior Entry filtering for precis
Multi-Arm Bandit AI Ajanı – Adaptif Öğrenme ve Karar Verme Motoru Piyasa koşullarına sürekli uyum sağlayan ve öğrenen bir multi-arm bandit algoritması ile çalışan gelişmiş bir işlem sistemi. Ajan, performans geri bildirimi temelinde işlem yürütme, pozisyon boyutu ve karar verme süreçlerini gerçek zamanlı olarak optimize eder. Karar Verme Mantığı UCB formülü kullanır: exploit + explore, burada exploration = C * sqrt(log(totalPulls + 1) / armPulls) Bağlama dayalı öncelikler, geçmiş performansa gör
King of Gold AI UCB Ajanı, adaptif öğrenme ve olasılıksal seçim yoluyla ticaret kararlarını optimize etmek için tasarlanmış gelişmiş bir makine öğrenimi algoritmasıdır. Ana Özellikler: Bağlamsal filtreleme ve sinyal optimizasyonu ile UCB Karar Banditi Üçlü Bandit Mimarisi (Karar, Yürütme, Profil katmanları) Adaptif risk yönetimi ile dinamik lot boyutu Kalıcı bağlam depolama ve işlem geçmişi başlatma Entegre öğrenme telemetri ve performans takibi Adaptif çok rejimli ticaret sistemi Dinamik risk
Filtrele:
Değerlendirme yok
Değerlendirmeye yanıt