В задаче прогнозирования EURUSD мы добавили бинарный столбец "labels", указывающий, превысило ли следующее изменение цены спред и комиссию.
Bu arada, 700.000'den fazla veri arasından, fiyat sadece 70.000 durumda spread'den daha fazla değişti.
EURUSD zamanın %90'ında ~0 spread'e sahiptir. H1 verileri ile çalışıyorsunuz. Bu sonucu nasıl elde ettiniz?
Фича инжиниринг — преобразование исходных данных в набор признаков для обучения моделей машинного обучения. Цель — найти наиболее информативные признаки. Есть ручной подход (человек выбирает признаки) и автоматический (с помощью алгоритмов).
Otomatik bir yaklaşım kullanacağız. Verilerimizden en iyi özellikleri otomatik olarak çıkarmak için yeni özellik oluşturma yöntemini uygulayacağız. Daha sonra ortaya çıkan setten en bilgilendirici olanları seçeceğiz.
Fiyat tahmini için en iyi özelliğin açılış fiyatının kendisi olduğu ortaya çıktı. Hareketli ortalamalara, fiyat artışlarına, standart sapmaya, günlük ve aylık fiyat değişikliklerine dayalı işaretler en üstte yer aldı. Otomatik olarak oluşturulan işaretlerin bilgilendirici olmadığı ortaya çıktı.Özellik oluşturma algoritmalarının kalitesi veya daha doğrusu tamamen yokluğu hakkında bir soru var.
Bir kişi OHLCT verilerinden tüm özellikleri oluşturdu - toplamda beş sütun. Özellik oluşturma algoritmasını çok daha fazla sayıda orijinal özelliğe zorluyorsunuz. Çip oluşturma algoritmasının en basit MA çipini yeniden üretemeyeceğini hayal etmek zor.
Özellik kümeleme, özellik sayısını azaltmak için benzer özellikleri gruplar halinde birleştirir. Bu, gereksiz verilerden kurtulmaya, korelasyonu azaltmaya ve aşırı uyum sağlamadan modeli basitleştirmeye yardımcı olur. Fiyat tahmini için en iyi özelliğin açılış fiyatının kendisi olduğu ortaya çıktı.
Kümeleme, HLC fiyatlarını O-fiyatı ile aynı kümeye düştüğü için mi dışarı attı?
Fiyatın tahmin için en iyi işaret olduğu ortaya çıktıysa (ve diğer işaretler onun türevleriyse), bu diğer işaretleri unutmamız gerektiği ve daha düşük bir zaman dilimine geçerek ve diğer sembollerin fiyatlarını işaret olarak alarak daha fazla girdi verisi eklemenin makul olduğu anlamına mı geliyor?
MO yeni veriler üzerinde, özellikle de eğitim aralığının dışında kalırlarsa, yeterli performans göstermeyeceğinden, fiyatlar elbette eğitim örneğinden çıkarılmalıdır.
Fiyatların yüksek bilgilendiriciliği, değerlerinin benzersizliğinden kaynaklanmaktadır, yani algoritmanın fiyatları hatırlaması veya etiketlerle eşleştirmesi daha kolaydır.
MO uygulamasında, yalnızca bilgilendirici olmayan özellikler değil, aynı zamanda ham fiyatlar olan şüpheli derecede aşırı bilgilendirici özellikler de kaldırılır.
İdeal bir senaryoda, +- eşit derecede bilgilendirici olan birkaç özellik olmalıdır. Yani, açık bir lider ya da dışlayıcı yoktur. Bu, hiçbir özelliğin eğitimi kirletmediği ve battaniyeyi kendi üzerine çekmediği anlamına gelir.MO yeni veriler üzerinde, özellikle de eğitim aralığının dışında kalırlarsa, yeterli performans göstermeyeceğinden, fiyatlar elbette eğitim örneğinden çıkarılmalıdır.
Geri dönüşlere gidersek, özellik oluşturma algoritması aynı fiyatlar olacak şekilde kümülatif bir toplam oluşturmakla yükümlüdür. Aynı zamanda, bunların fiyatlar olduğu bilinmeyecektir.
- Ücretsiz alım-satım uygulamaları
- İşlem kopyalama için 8.000'den fazla sinyal
- Finansal piyasaları keşfetmek için ekonomik haberler
Gizlilik ve Veri Koruma Politikasını ve MQL5.com Kullanım Şartlarını kabul edersiniz
Yeni makaleye göz atın: Python ve MQL5'te bir robot geliştirme (Bölüm 1): Veri ön işleme.
Piyasa giderek daha karmaşık hale geliyor. Bugün bu bir algoritma savaşına dönüşmüştür. İşlem hacminin %95'inden fazlası robotlar tarafından üretilmektedir.
Bir sonraki adım makine öğrenimidir. Bunlar güçlü yapay zeka değildir, ancak basit doğrusal algoritmalar da değildir. Makine öğrenimi modeli zor koşullarda kar elde etme yeteneğine sahiptir. Alım-satım sistemleri oluşturmak için makine öğrenimini uygulamak ilginç bir fikirdir. Sinir ağları sayesinde, alım-satım robotu büyük verileri analiz edecek, formasyonları bulacak ve fiyat hareketlerini tahmin edecektir.
Bir alım-satım robotunun geliştirme döngüsüne bakacağız: veri toplama, işleme, örneklem genişletme, özellik mühendisliği, model seçimi ve eğitimi, Python aracılığıyla bir alım-satım sistemi oluşturma ve işlemleri izleme.
Python'da çalışmanın kendine özgü avantajları vardır: makine öğrenimi alanında hızın yanı sıra özellikleri seçme ve oluşturma yeteneği. Modelleri ONNX'e aktarmak, Python'dakiyle tamamen aynı özellik oluşturma mantığını gerektirir ki bu kolay değildir. Bu yüzden Python üzerinden çevrimiçi alım-satımı seçtim.
Yazar: Yevgeniy Koshtenko