Bu konuyu gündeme getirdiğiniz için teşekkür ederiz.
Lütfen makalenin iki bölümünden alıntı yaparak biraz çelişkili bilgiler hakkında yorum yapın:
"
Entropi denklemini sürekli değişkenlere uygulamak için gösterge değerlerini ayrıştırmamız gerekir. Bu, değer aralığını eşit büyüklükteki aralıklara bölerek ve ardından her bir aralığa düşen değerlerin sayısını sayarak yapılır. Bu yöntem kullanılarak, tüm gösterge değerlerinin maksimum aralığını numaralandıran orijinal küme, her biri seçilen aralıkları temsil eden alt kümelerle değiştirilir.
...
Aralıklar - örneklenecek aralıkların sayısı. TTMTS'nin yazarı, birkaç bin örneklem büyüklüğü için 20 aralık belirtir ve 2 zor bir minimum değerdir. Örneklem boyutuna göre aralık sayısını değiştirme yeteneğini uygulayarak, özellikle her 1000 örnek için 51 olmak üzere, uygun bir değere kendi yaklaşımımı ekledim. Bu seçenek, kullanıcı 2'den küçük herhangi bir değer girerse kullanılabilir. Dolayısıyla, Aralık 2'den küçük herhangi bir sayı olarak ayarlandığında, kullanılan aralık sayısı analiz edilen çubuk sayısına bağlı olarak değişecektir.
"
Soru, bu aynı şeyle mi ilgili? Evet ise, gösterge değer aralığının ayırıcı sayısı neden çubuk sayısına bağlıdır? Buradaki mantık nedir? Şimdiye kadar, bunun yalnızca herhangi bir birikimli bileşene sahip göstergeler için yararlı olduğunu varsayabilirim.
Değilse, aralık bölücülerinin sayısı neye eşittir?
Makalede, gösterge değerlerini dönüştürmenin faydasını açıkça gösterecek bir tablo yok.
Merhaba Francis.
EntrophyAnalysis için Özel bir Göstergenin nasıl test edileceğini açıklayabilir misiniz?
Aşağıdaki gibi kullanmaya çalışıyorum:
input ENUM_TIMEFRAMES Timeframe=PERIOD_H1;
input ENUM_INDICATOR IndicatorType=IND_CUSTOM;
input string CustomIndicatorName="Indicators\\NKGold\\Regression\\iNonLinRegress.ex5";
input bool UseDefaults=true;
input string IndicatorParameterTypes="int,CENUM_APPLIED_PRICE";
input string IndicatorParameterValues="34,priceHA_WEIGHTED";
ve aşağıdaki gibi hata alıyorum
2025.03.26 19:53:11.282 EntropyIndicatorAnalysis (XAUUSD,H1) özel gösterge 'Indicators\NKGold\Regression\iNonLinRegress.ex5' yüklenemiyor [4802]
2025.03.26 19:53:11.282 EntropyIndicatorAnalysis (XAUUSD,H1) Geçersiz gösterge tanıtıcısı, hata kodu: 4802
Neden bu kadar çok harf var? Yazar geçerli bir gösterge mi tespit etti? Başka bir deyişle, para için bir şey buldu mu? Soru basit: Yüksek kâr olasılığı ile para kazanmak için bir araç var mı? Yoksa hepsi aynı mı, rulet gibi: ya işe yarar ya da yaramaz.
Makale, banknotları kesin olarak basacak bir Kutsal Kase keşfettiğini iddia etmiyor. Amacı daha mütevazı: bir göstergenin bir öğrenme modeline getirdiği bilgi zenginliğinin nasıl ölçüleceğini göstermek.
-
Yüksek bir entropi puanı yalnızca değişkenin önemsiz olmadığı anlamına gelir (algoritmanın öğrenmesi için yeterince değişkenlik gösterir). Yön, zamanlama veya kazanan para yönetimini garanti etmez.
-
Piyasa seçilen ufukta zaten verimliyse, işlem maliyetleri sinyali emiyorsa veya model kötü tasarlanmışsa, oldukça bilgilendirici bir göstergenin bile öngörücü olmadığı kanıtlanabilir.
-
Pratikte birkaç yapı taşı üst üste konur: iyi entropiye sahip göstergelerin seçimi, sıkı örneklem dışı testler, risk yönetimi, sağlam uygulama ve gerçek zamanlı izleme. Yalnızca tüm bu adımları birleştirerek küçük bir avantaj elde etmeyi umuyoruz ve piyasa uyum sağladıkça bu sürekli olarak yeniden kontrol edilmelidir.
-
Yazar akademik bir teşhis aracı sunmaktadır. Başarıyı garanti etmez. Herkes kendi özelliklerini iyileştirmek ya da tam tersine, favori bir göstergenin yeni bir şey katmadığını fark etmek için bunu kullanmakta özgürdür.
Kısacası, entropi bir iksir değil, bir termometredir. Ölü ya da az kullanılan değişkenleri hızlı bir şekilde tespit etmenize yardımcı olur. Strateji ya da risk kontrolünün yerine geçmez.
...
Aralıklar - örneklenecek aralıkların sayısı. TTMTS'nin yazarı, birkaç bin kişilik bir örneklem için 20 aralık belirtir ve 2 mutlak minimumdur. Örneklem büyüklüğüne göre aralık sayısını değiştirme özelliğini uygulayarak uygun bir değere kendi yaklaşımımı ekledim, özellikle 1000 örnek için 51. Bu seçenek, kullanıcı 2'den küçük bir değer girerse kullanılabilir. Böylece, Aralık 2'den küçük bir sayıya ayarlandığında, kullanılan aralıkların sayısı analiz edilen çubuk sayısına göre değişecektir.
"
Soru: Bu aynı şey mi? Eğer öyleyse, gösterge değerleri aralığındaki ayırıcıların sayısı neden çubuk sayısına bağlıdır? Bunun arkasındaki mantık nedir? Şimdiye kadar, bunun yalnızca birikimli bir bileşene sahip göstergeler için yararlı olduğunu varsayabilirim.
Eğer durum böyle değilse, aralıktaki bölenlerin sayısı neye karşılık gelir?
Makalede, gösterge değerlerini dönüştürmenin faydasını açıkça gösteren bir tablo bulunmamaktadır.
Sürekli bir değişkenin entropisini tahmin etmek için, değer aralığını eşit aralıklara böleriz ve her aralıktaki gözlemleri sayarız. Kod,aralık sayısını seçmenize izin verir. < 2 girerseniz (veya varsayılan değeri bırakırsanız), komut dosyası kendi sezgiselini tetikler: 1.000 gözlem başına 51 aralık, yani örneklem boyutuyla orantılı bir sayı. Eğer > 2 değerini girerseniz, olduğu gibi kullanır, yani bunlar birbiriyle yarışan iki yöntem değildir. Biri kavramı açıklıyor, diğeri ise parametreyi kendiniz ayarlamadığınızda kodun nasıl seçtiğini açıklıyor.
Çok az aralığa sahip olduğunuzda, değerleri yapay olarak birbirine yapıştırırsınız. Entropi düşük tahmin edilir (yanlılık). Küçük bir örnek için çok fazla aralığa sahip olduğunuzda, çok sayıda boş kutu veya 1 gözlemli kutu vardır. Entropi çok gürültülüdür (varyans). Histogramlar için çeşitli otomatik kurallar mevcuttur: Sturges, karekök, Freedman-Diaconis, Scott, vb.) Hepsinin fikri aynı: Daha fazla veriye sahip olduğunuzda çözünürlüğü artırın, çünkü o zaman varyansı patlatmadan daha ince olasılıkları tahmin edebilirsiniz.
1.000 çubuk için, 51 aralık => dağılım tekdüze olsaydı kutu başına 20 puan. Bu oran (15 ila 30 gözlem / sınıf arasında) yazarın literatürden aldığı klasik bir uzlaşmadır. Bunun bir göstergenin birikimli olup olmamasıyla hiçbir ilgisi yoktur. Mantık tamamen istatistikseldir. Izgaranın inceliği, mevcut bilgi miktarına göre uyarlanır.
-
göstergenin ince dağılımı daha görünür hale gelir,
-
entropi hesaplaması ne kadar çok ayrıntı (tepe ve çukurlar) yakalayabilirse,
-
ancak bu frekansların kararlı olması için daha fazla veri gereklidir.
Makalenin, örneğin dönüşümlerden önce ve sonra aynı göstergenin entropisini göstermekten fayda sağlayacağı doğrudur. Ancak gösterimi kendiniz yapmak kolaydır. Kodda ApplyTransform=true seçeneğini işaretleyin ve çift çıktıyı okuyun: önce / sonra. Kod, herkesin kendi varlıklarını ve ufuklarını test edebilmesi için bu kısmı kasıtlı olarak etkileşimli bırakmıştır.
Histogramda ne kadar çok dikey çubuk varsa:
-
endeksin dağılımındaki incelik daha da dikkat çekicidir,
-
entropi hesaplaması ne kadar çok ayrıntı (tepe ve çukurlar) yakalayabilirse,
-
ancak bu frekansları istikrarlı hale getirmek için daha fazla veriye ihtiyaç vardır.
Anladığım kadarıyla, bir örneklemdeki gösterge puanlarının bir histogram aracılığıyla görselleştirilmesinin yazarın veri dönüştürme yöntemleriyle hiçbir ilgisi yok. Doğru mu anlıyorum?
Ben daha çok bu dönüşümlerin eğitim etkisi sorusuyla ilgileniyorum. Sinir ağları için bunu varsayabilirim, ancak ağaç yöntemleri için değil.
Doğru anladıysam, bir örneklemdeki gösterge puanlarının bir histogram kullanılarak görselleştirilmesinin yazarın veri dönüştürme yöntemleriyle hiçbir ilgisi yoktur. Haksız mıyım?
Ben daha çok bu dönüşümlerin zincirleme etkisi sorusuyla ilgileniyorum. Bunu sinir ağları için varsayabilirim, ancak ağaç yöntemleri için değil.
Kod tarafından çizilen histogram sadece görsel bir teşhis aracıdır. Bir göstergenin değerlerinin dönüşümden önce veya sonra örnekte nasıl dağıldığını gösterir. Sqrt, log, tanh vb. fonksiyonlar veriler üzerinde işlem yapar. Histogram sadece sonucu gösterir. Bu nedenle iki aşama birbirinden bağımsızdır. Önce seri dönüştürülür (ya da dönüştürülmez), ardından entropinin değişip değişmediğini görmek için histogramı çizilir.
Oldukça monoton hale gelen bir göstergeyi dönüştürmek (log, sqrt) genellikle skoru değiştirmez. Öte yandan, monotonik olmayan dönüşümler (doygunluğa ulaşan tanh) belirli noktaların sırasını değiştirir. Bu, belirli dönüşümlerin doğrusal olmayan etkileşimler oluşturmak için daha iyi zemin hazırladığı anlamına gelir.
Kod tarafından oluşturulan histogram sadece görsel bir tanı aracıdır. Gösterge değerlerinin dönüşümden önce veya sonra örnekte nasıl dağıldığını gösterir. Sqrt, log, tanh vb. fonksiyonlar verileri etkiler. Histogram sadece sonucu gösterir. Dolayısıyla, iki adım birbirinden bağımsızdır. Önce seri dönüştürülür (ya da dönüştürülmez), ardından entropinin değişip değişmediğini görmek için histogramı çizilir.
Tamam, şimdi konuyu anladım. Ben aslında başka bir şey düşünüyordum.
Oldukça monotonik hale gelen bir üssü dönüştürmek (log, sqrt) genellikle sonucu değiştirmez. Öte yandan, monotonik olmayan dönüşümler (tanh, saturates) belirli noktaların sırasını değiştirir. Bu, belirli dönüşümlerin doğrusal olmayan etkileşimler yaratmak için daha iyi zemin hazırladığı anlamına gelir.
Bu, noktaların sırasını nasıl değiştirir? Böyle bir dönüşüme örnek verebilir misiniz? Şimdiye kadar söylenenleri, özdeğerleri artan sırada olan ABC noktaları olduğu ve dönüşümden sonra artan sıradaki sıranın alternatif olarak BAC olduğu şeklinde anladım.
Tamam, şimdi anladım. Aslında başka bir şey düşünüyordum.
Noktaların sırasını nasıl değiştirir? Böyle bir dönüşüme örnek verebilir misiniz? Şimdiye kadar özdeğerleri artan sırada ABC noktaları olduğunu ve dönüşümden sonra artan sıranın dönüşümlü olarak BAC haline geldiğini anladım.
Koddaki fonksiyonların (root, log, tanh, vb.) hepsi monoton olarak artmaktadır. Hepsi noktaların sırasını korur. Önceki cümlem muğlaktı. Sıralama yalnızca monotonik olmayan bir dönüşüm kullanılırsa ABC'den BAC'ye değişir. Örneğin, yanılmıyorsam, f(x)=∣x-50∣ fonksiyonu monotonik değildir çünkü ekseni x= 50 etrafında katlar. Bu nedenle, düzen BAC olur. Makalenin yazarı giriş bölümünde biziTimothy Masters'ın "Testing and Tuning Market Trading Systems (TTMTS)" kitabına yönlendiriyor. Bana kalırsa, kitabı elime almayı planlıyorum çünkü sizin gibi benim de hala birkaç sorum var. Dahası, öğrenme modellerine ya da sinir ağlarına pek aşina değilim. Görünüşe göre, çevrimiçi satış sitelerinde bulmak oldukça kolay. İçeriği bize çok yardımcı olacaktır, çünkü makale ne kadar ilginç olursa olsun şüphesiz eksik ve/veya her durumda oldukça sentetik.
- Ücretsiz alım-satım uygulamaları
- İşlem kopyalama için 8.000'den fazla sinyal
- Finansal piyasaları keşfetmek için ekonomik haberler
Gizlilik ve Veri Koruma Politikasını ve MQL5.com Kullanım Şartlarını kabul edersiniz
Yeni makaleye göz atın: Gösterge Bilgisinin Ölçülmesi.
Örnek olarak yukarıda analiz edilen iki göstergenin bazı istatistiksel özelliklerini inceleyelim.
William's Percent Range göstergesinin dağılımı, neredeyse tüm değerlerin tüm aralığa nasıl yayıldığını ortaya koymaktadır, çok modlu olmanın yanı sıra dağılım oldukça tekdüzedir. Böyle bir dağılım idealdir ve entropi değerine yansır.
Bu, uzun bir kuyruğa sahip olan Market Facilitation Index dağılımından farklıdır. Böyle bir gösterge çoğu öğrenme algoritması için sorunlu olacaktır ve değerlerin dönüştürülmesini gerektirir. Değerlerin dönüştürülmesi, göstergenin göreceli entropisinde bir iyileşmeye yol açmalıdır.
Yazar: Francis Dube