Alıntılardaki bağımlılık istatistikleri (bilgi teorisi, korelasyon ve diğer özellik seçim yöntemleri) - sayfa 13

 

Hayır, görev değişmedi. Bu sadece atomik bir görev, bölünemez. Genel resmi elde etmek için ayrıca Gecikme değişkenine göre tarama yapmanız gerekir.

Birkaç ay önce elde ettiğim sonuçlarımdan alıntılar gönderebilirim (ancak metin biçiminde var). Konu başlatıcıda olduğu gibi karşılıklı bilgi değil, Matrix'in frekansları var. "Değişkenlerin bağımsızlığı için ki-kare testi" istatistiklerini hesaplamanın sonuçları da burada verilmiştir (o zaman karşılıklı bilginin ne olduğundan şüphelenmedim, ancak zaten değişkenlerin bağımlılığının genel bir ölçüsüyle meşguldüm ve denedim farklı kriterlerle). Bununla birlikte, bu rakamlar hiç de sıkıcı değil.

Yarın yayınlayacağım (yani bugün, ama daha sonra), çünkü hesaplamaların yapıldığı bilgisayara erişim yoktur.

Not: "evrensel regresyon, vb." yapacak bir şeyi yok: (18) - bu fiyata kabaca mekanik bir yaklaşım, ama burada temelde istatistiksel.

 
Mathemat :

Hayır, görev değişmedi. Bu sadece atomik bir görev, bölünemez. Genel resmi elde etmek için ayrıca Gecikme değişkenine göre tarama yapmanız gerekir.

Birkaç ay önce elde ettiğim sonuçlarımdan alıntılar gönderebilirim (ancak metin biçiminde var). Konu başlatıcıda olduğu gibi karşılıklı bilgi değil, Matrix'in frekansları var. "Değişkenlerin bağımsızlığı için ki-kare testi" istatistiklerini hesaplamanın sonuçları da burada verilmiştir (o zaman karşılıklı bilginin ne olduğundan şüphelenmedim, ancak zaten değişkenlerin bağımlılığının genel bir ölçüsüyle meşguldüm ve denedim farklı kriterlerle). Bununla birlikte, bu rakamlar hiç de sıkıcı değil.

Yarın yayınlayacağım (yani bugün, ama sonra), çünkü hesaplamaların yapıldığı bilgisayara erişim yoktur.

Not: "evrensel regresyon, vb." yapacak bir şeyi yok: (18) - bu fiyata kabaca mekanik bir yaklaşım, ama burada temelde istatistiksel.

(18) ATC modunda kötü de olsa veriyor ama sonuç, stop ve TP kullanmadan ve ince istatistiksel yaklaşımınızı bu seviyeye getirin, o zaman karşılaştıracağız.

11/25/2009 ile 09/02/2011 arası altın, H4, lot 0.1, maks. %10.32 düşüş, MO 27.6

ׂ

 
Mathemat :

Tartışmıyorum, her şey mantıklı. 1. nokta ile başlayalım.

1. "ne alacağımızı kesin olarak belirle": İlk olarak - görev hücresi, o zaman zaten bölünemez.

Bir tamsayı gecikmesini düzeltiriz. Bu, "çubuklar arasındaki mesafe" olacaktır, yani. MT4'te belirli bir zaman diliminde endeksleri arasındaki farkın modülü.

Amaç: aşağıdaki iki rastgele değişken arasında istatistiksel bir ilişki olup olmadığını belirlemek: 1) sh indeksli "öndeki" çubuğun dönüşü ve 2) sh+Lag indeksli "takip eden" çubuğun dönüşü.

Aldığımız şey bu: aralarında Lag'a eşit bir mesafe olan tüm çubuk çiftleri. Son derece doğru.

Nerede ve şüphe duyulacak ne var? Önce ilk noktayı ele alalım. Görünüşe göre - ikinciye geçelim.

Bu neredeyse ACF'dir, ancak formül farklıdır. ACF, istatistiklerin ayrılmaz bir parçasıdır. Her türlü bağımlılığı aramak için harika. Bu, ARIMA'nın ortaya çıkışından bu yana hem teoride hem de pratikte çok yaygın olarak kullanılmaktadır.Her yeni şey, iyi bilinen ve iyi bilinen benzer şeylerle benzerlik ve farklılıkların bir göstergesi ile başlamalıdır. Bu yapılmazsa, o zaman Londra'nın en pis evlerinde fikir tartışmaya açık değildir. Bütün konu hakkında konuştuğum şey bu. Her zaman bir literatür taraması ile başlamalısınız. Obvor yok - yazınızdan bir alıntıda pazar yok.

Daha ileri. sh görüyorum, ACF'nin rastgele bir yerden değil sh = 1'den hesaplandığını anlıyorum. Ama CHAKF var. Teklifiniz buna ne kadar benziyor veya bundan farklı. Sadece özü (VR'deki bağımlılıklar) TI'den gelen kelimelerle karartmayın.

 
faa1947 : Neredeyse ACF'dir, ancak formül farklıdır. ACF, istatistiklerin ayrılmaz bir parçasıdır. Her türlü bağımlılığı aramak için harika.

Hiç ACF olmak zorunda değil. Ve ACF'nin çeşitli türden bağımlılıklar aradığı konusunda büyük ölçüde yanılıyorsunuz. Korelasyona bakın. Orada, makalenin sonuna doğru, resmin olduğu yerde , korelasyon analizinin sınırlamaları vardır. AKF'yi bu yüzden terk ettim. Pearson korelasyonu ile tespit edilen çubuklar arasındaki doğrusal ilişkiler çok zayıf ve kısa ömürlüdür.

Her zaman bir literatür taraması ile başlamalısınız. Obvor yok - yazınızdan bir alıntıda pazar yok.

Uzun bir süre hareket etmeyeceğiz. Ancak genel olarak size katılıyorum: hala bir tür tartışmaya ihtiyaç var. Bunu düşüneceğim - önceki paragrafın doğrusal bağımlılıklarla ilgili son cümlesini beğenmediyseniz.

Sadece özü (VR'deki bağımlılıklar) TI'den gelen kelimelerle karartmayın.

Onlar. Bağımlılıkları aramak için TI kullanmamı yasaklamaya mı karar verdiniz?

2 yosuf: Seninle rekabet etmeyeceğim. İndükleyicinizi geliştirmeye devam edin, ancak lütfen bu konuya girmeyin. İşte offtopik.

 
Mathemat :

Bilgisel entropi hakkında bir makale buldum (Wiki). Oradan 1 alıntı:

Bu entropi, sıradan entropi. Bu tanımdan mı bahsediyorsunuz?

Evet, fazlalık ve bağımlılık olmaması için alfabedeki harflerin istatistiksel olarak bağımsız olması gerektiğine katılmaya hazırım. Arşivleyicinin yaptığı tam olarak budur, metni oluşturmak için kullanılan alfabeden açıkça farklı bir alfabe oluşturur.

Ama biz öyle düşünmüyoruz! Ne düşündüğümüz hakkında daha fazlası.


Topicstarter'ın konuşması (ve benimki de) bilgi entropisi hakkında değil, kahretsin, karşılıklı bilgi hakkındaydı (yine Wiki)!!

Karşılıklı bilgi , bir rastgele değişkende bulunan bilgi miktarını diğerine göre tanımlayan iki rastgele değişkenin istatistiksel bir fonksiyonudur.

Karşılıklı bilgi, iki rastgele değişkenin entropisi ve koşullu entropisi cinsinden [I(X,Y) formülü aşağıdaki gibi] tanımlanır.

Sadece aynı pediwiki'den karşılıklı bilgileri hesaplama formülünün aşağıdaki gibi olabileceği gerçeğine dikkatinizi çekiyorum:

Karşılıklı bilgi (X ile Y arasında) = Entropi (X) - Koşullu entropi (X ile Y arasında)

Bu, Amerikan kaynaklarından korkunç görünen formüller yazmaz, ancak tanımları gözden geçirirseniz.

Burada X ve Y iki farklı sistemdir ve aralarında X ve Y'ye bir bağımlılık vardır.

Tam karşılıklı bilgi istiyorsak, konu başlatıcı gibi olacaktır:

Tam karşılıklı bilgi (X ve Y arasında) = Entropi (X) + Entropi (Y) - Birleşik sistemin entropisi (X ve Y)

Neden "koşullu entropi" değil de "birleşik sistemin entropisi" yazılmıştır, çünkü aslında iki sistemden oluşan bir sistemin toplam entropisi bağımsız veya koşullu olabilir. Açıktır ki, X ve Y birbirine bağlı ve bağımsız değilse, o zaman ortak olasılıklar (entropi toplama teoremi) olarak ve eğer bir bağlantı varsa, o zaman koşullu olarak düşünülmelidir.


Şimdi çıkarlarımız hakkında. Bütün bu kano piyasaya nasıl uygulanabilir? Aşağıdaki modeli varsayalım. X sistemi vardır - piyasa (alfabe), belirli bir frekansta (sembol olasılıkları) ortaya çıkan sonlu ve belirli sayıda duruma (sembollere) sahiptir. İkinci bir sistem Y var - alıntıları kaydediyor. Alıntılar (alfabe) ayrıca belirli frekanslarla sınırlı bir karakter kümesine sahiptir. Bütün bunlardan ne öğrenilebilir?

1. Piyasanın alfabesini bilmeniz gerekir. Orada sürekli bir şeyler oluyor, alıp satıyor, biri iflas ediyor, biri yeni parayla geliyor, bir tür toplu histeri oluyor, vb. Onlar. alfabe çok kapsamlıdır ve onu bu kadar basit bir şekilde tanımlamanın mümkün olması pek mümkün değildir.

2. Piyasanın alfabesini tanımlamak mümkün olsa bile piyasada gerçekleşen süreçlerin durağanlığı sorunu ortaya çıkmaktadır. TI'nin kesinlikle özelliklerin sabitliğine odaklandığını anlamalısınız.

3. İkinci sistemin alfabesi, alıntılar. Piyasanın alfabesinden farklıdır. Muhtemelen zaten öyledir. Ve hangisi olduğunu bilmeniz gerekiyor. Zaman çerçevesindeki tırnak değişiklikleri aralığını niceliklere böler ve onlardan bir alfabe çıkarırsak, ne elde ederiz. Daha doğrusu, öyle değil, piyasa alfabesinden alıntı alfabesindeki bilgilerin tam veya kısmi bir görüntüsünü alıyor muyuz? Bilginin hangi kısmı kaybolur? ya da belki hiçbir şey kaybolmaz ve piyasa alfabesi basitçe gereksizdir. Vb.

 
Mathemat :

Bu AKF'nin neredeyse tamamı değil, hatta hiç değil. Ve ACF'nin her türlü bağımlılığı aradığı konusunda yanılıyorsunuz. Korelasyona bakın. Orada, makalenin sonuna doğru, resmin olduğu yerde , korelasyon analizinin sınırlamaları vardır. AKF'yi bu yüzden terk ettim. Pearson korelasyonuyla tespit edilen çubuklar arasındaki doğrusal ilişkiler beni ilgilendirmiyor çünkü çok zayıf ve kısa ömürlüdürler.


Korelasyonun detaylandırılması, onun güçlü yanıdır, ancak aynı zamanda, korelasyon hakkında bilinen sınırlamaları zayıf tarafa bağladınız. Ancak, "ACF" olarak adlandırılan değer, bu değere güvenme olasılığı, bu güvenin hesaplanması için koşullar hakkında anlamlı bir şekilde akıl yürütmemize ve genel olarak bu değerler hakkında herhangi bir akıl yürütmenin kabul edilebilirliğini değerlendirmemize izin veren tam olarak bu kısıtlamalardır. korelasyon kısıtlamalarının yerine getirilmesi. Her şeye hakim olsanız bile, bir aletle donanmış olsanız bile, pratikte ciddi zorluklar var ve sürekli zinaya düşüyorsunuz.

Konunun konusu hakkında aynı şeyi yazmaya çalışın.

ACF, eğilimleri çok özel bir şekilde gösterir ve CHAF ile birlikte döngüleri arar. Peki "bilgi bağımlılığı" ne arıyor, bu nasıl bir hayvan ve tırnak içinde kendini nasıl gösteriyor? Yoksa artışlarla mı? Trendlerin ve döngülerin oluşumu için bir açıklama bulabileceğiniz piyasanın psikolojisi hakkında birçok yayın var ve "bilgi bağımlılığı" nın psikolojik temeli nedir, hangi yayınlarda yazılmıştır? Ve alıntıları etkiler mi? Alınan resimlere neye dayanarak güvenebilirsiniz? Sonuca güvenme olasılığı nerede? Bütün bunların uygulanabilirliği için koşullar nerede? Bazı sorular. Bu konu bana, bağımlılıklar konusuna da eğilen neşeli hfenklerle (doğru hatırlıyorsam) konuyu daha fazla hatırlatıyor.

Bir tez bakış açısından, yalnızca ön hazırlık olarak, bilimsel yeniliğin işaretleri var, ancak korelasyonla karşılaştırılmadan, tüm bunlar boş gevezelik (afedersiniz).

 
HideYourRichess :

Sadece aynı pedwiki'den, karşılıklı bilgileri hesaplama formülünün aşağıdaki gibi olabileceğine dikkat çekiyorum: [...]

Neden "koşullu entropi" değil de "birleşik sistemin entropisi" yazılmıştır, çünkü aslında iki sistemden oluşan bir sistemin toplam entropisi bağımsız veya koşullu olabilir. Açıktır ki, eğer X ve Y birbirine bağlı ve bağımsız değilse, o zaman birleşik olasılıklar (entropi toplama teoremi) olarak ve eğer bir bağlantı varsa, o zaman şartlı olarak düşünülmelidir.

Belirteceğinden şüphelendim. Neyse ki, her durumda, olasılıklar (entropiler değil) cinsinden yazılan formüller, neyin neye bağlı olduğuna bakılmaksızın aynı kalır. Dolayısıyla bu argümanlar yeni bir şey eklemiyor.

X sistemi vardır - piyasa (alfabe), belirli bir frekansta (sembol olasılıkları) ortaya çıkan sonlu ve belirli sayıda duruma (sembollere) sahiptir. İkinci bir sistem Y var - alıntıları kaydediyor. Alıntılar (alfabe) ayrıca belirli frekanslarla sınırlı bir karakter kümesine sahiptir. Bütün bunlardan ne öğrenilebilir?

Bunun artık topikstarter tarafından düşünülen sistem olmadığına dikkatinizi çekiyorum. Cidden piyasanın alfabesini öğrenebilirsin diyecek kadar saf değilim. Ve gerçekçi hedefler belirlemeye çalışıyorum.
 
faa1947 : onun güçlü yanıdır, ancak aynı zamanda, korelasyon hakkında bilinen sınırlamaları zayıf tarafa bağladınız. Ancak, "ACF" olarak adlandırılan değer, bu değere güvenme olasılığı, bu güvenin hesaplanması için koşullar hakkında anlamlı bir şekilde akıl yürütmemize ve genel olarak bu değerler hakkında herhangi bir akıl yürütmenin kabul edilebilirliğini değerlendirmemize izin veren tam olarak bu kısıtlamalardır. korelasyon kısıtlamalarının yerine getirilmesi.

Kesinlikle doğru. Terver/matstat'ın yarısı, özellikle normal dağılımı ilgilendiren merkezi limit teoremleri ve bunların sonuçlarından bahseder. Bu güzel bir şekilde "çözümlenmiş" bir dağıtımdır. Bununla birlikte, limitte bile buna uymayan rastgele değişkenler vardır. Sırf çok iyi yapıldığı için neden özellikle Pearson'ın korelasyonu ile ilgileneyim?

ACF oldukça spesifik olarak eğilimleri gösterir ve CHAKF ile birlikte döngüleri arar.

Veri madenciliği aşamasında ne döngüler ne de eğilimler henüz ilgi çekici değildir. Ilgi konusu olan, prensipte ACF tarafından tespit edilmeyen bağımlılıklardır.

Peki "bilgi bağımlılığı" ne arıyor, bu nasıl bir hayvan ve tırnak içinde kendini nasıl gösteriyor? Yoksa artışlarla mı? Trendlerin ve döngülerin oluşumu için bir açıklama bulabileceğiniz piyasanın psikolojisi hakkında birçok yayın var ve "bilgi bağımlılığı" nın psikolojik temeli nedir, hangi yayınlarda yazılmıştır? Ve alıntıları etkiler mi? Alınan resimlere neye dayanarak güvenebilirsiniz? Sonuca güvenme olasılığı nerede? Bütün bunların uygulanabilirliği için koşullar nerede? Bazı sorular. Bu konu bana, bağımlılıklar konusuna da eğilen neşeli hfenklerle (doğru hatırlıyorsam) konuyu daha fazla hatırlatıyor.

Çok fazla soru soruyorsun. Ayrıca size şunu da soracağım: Çok yeni ve çok tuhaf bir şeye başlamadan önce, bu yenisinin uygulanabilirliğini ilk önce tam ve %100 gerekçelendiren ve sonra sonuçları elde etmeye devam eden en az bir araştırmacı tanıyor musunuz? Bir saniye içinde kafasında hangi ipucu parladı? Genellikle, her şey tam tersi olur: ilk önce, yeni, gerekçelere ve her türlü titizliğe bakılmaksızın uygulanır ve ancak o zaman, ilginç bir şey ortaya çıkarsa, gerekçeler başlar. Beni anlıyor musun?

Ve bu arada, hrenfx hakkında: ayrıca Pearson korelasyonuna dayalı bir analiz yaptı.

Bir tez bakış açısından, yalnızca ön hazırlık olarak, bilimsel yeniliğin işaretleri var, ancak korelasyonla karşılaştırılmadan, tüm bunlar boş gevezelik (afedersiniz).

Tamam. Pekala, burada bir tezi tartışmıyoruz, sadece gelecekte bir şeylerin yanabileceği ilginç bir fikirden bahsediyoruz. Yanmayacağını çok iyi anlıyorum. O halde neden gergin gerekçelerle zaman kaybedelim?

 
Mathemat :

Kesinlikle doğru. Terver/matstat'ın yarısı, özellikle normal dağılımı ilgilendiren merkezi limit teoremleri ve bunların sonuçlarından bahseder. Bu güzel bir şekilde "çözümlenmiş" bir dağıtımdır. Bununla birlikte, limitte bile buna uymayan rastgele değişkenler vardır. Sırf çok iyi yapıldığı için neden Pearson'ın korelasyonuyla özellikle ilgileneyim?

Veri madenciliği aşamasında ne döngüler ne de eğilimler henüz ilgi çekici değildir. İlgi çekici olan, prensipte ACF tarafından tespit edilmeyen bağımlılıklardır.

Çok fazla soru soruyorsun. Ayrıca size şunu da soracağım: Çok yeni ve çok tuhaf bir şeye başlamadan önce, bu yenisinin uygulanabilirliğini ilk önce tam ve %100 gerekçelendiren ve sonra sonuçları elde etmeye devam eden en az bir araştırmacı tanıyor musunuz? Bir saniye içinde kafasında hangi ipucu parladı? Genellikle, her şey tam tersi olur: ilk önce, yeni, gerekçelere ve her türlü titizliğe bakılmaksızın uygulanır ve ancak o zaman, ilginç bir şey ortaya çıkarsa, gerekçeler başlar. Beni anlıyor musun?

Ve bu arada, hrenfx hakkında: ayrıca Pearson korelasyonuna dayalı bir analiz yaptı.

Tamam. Pekala, burada bir tezi tartışmıyoruz, sadece gelecekte bir şeylerin yanabileceği ilginç bir fikirden bahsediyoruz. Yanmayacağını çok iyi anlıyorum. O halde neden gergin gerekçelerle zaman kaybedelim?

Sırf çok iyi yapıldığı için neden Pearson'ın korelasyonuyla özellikle ilgileneyim?

Pratik olarak değerli. Ve bilinmeyen dağılımlarla durağan olmayan rastgele süreçleri işlemek mümkündür.

Genellikle, her şey tam tersi olur: ilk önce, yeni, gerekçelere ve her türlü titizliğe bakılmaksızın uygulanır ve ancak o zaman, ilginç bir şey ortaya çıkarsa, gerekçeler başlar. Beni anlıyor musun?

Numara. Önce ford'u, sonra diğer her şeyi ölçerler. Benim zamanımda katıldığım tüm bilim kurullarında böyle bir konuşmanız sonsuza kadar son olurdu.

O halde neden gergin gerekçelerle zaman kaybedelim?

Gerilmiş gerekli değildir. Ancak, mevcut olanla karşılaştırma düzeyinde neyin tartışıldığını anlamanız gerekir.

 
Mathemat :

Belirteceğinden şüphelendim. Neyse ki, her durumda, olasılıklar (entropiler değil) cinsinden yazılan formüller, neyin neye bağlı olduğuna bakılmaksızın aynı kalır. Dolayısıyla bu argümanlar yeni bir şey eklemiyor.

Bana göre, yanlış da olsa, başka sembollerle yazılmış olmasından, formülün özü ve uygulanabilirlik koşulları değişemez.

matematik :
Bunun artık topikstarter tarafından düşünülen sistem olmadığına dikkatinizi çekiyorum. Cidden piyasanın alfabesini öğrenebilirsin diyecek kadar saf değilim. Ve gerçekçi hedefler belirlemeye çalışıyorum.
Daha eksiksiz bir sistem şuna benzer: piyasa alfabesi <-> alfabeden alıntılar -> görev alfabesi. Topikstarter sadece son çift olarak kabul edilir, alıntı bir görevdir.
Neden: