"Yatırımcının İstatistiksel Yemek Kitabı: Hipotezler" makalesi için tartışma

 

Yeni makale Yatırımcının İstatistiksel Yemek Kitabı: Hipotezler yayınlandı:

Bu makale, matematiksel istatistiklerin temel fikirlerinden biri olan hipotezi ele almaktadır. Çeşitli hipotezler, matematiksel istatistik yöntemleri kullanılarak örneklerle incelenir ve doğrulanır. Gerçek veriler parametrik olmayan yöntemler kullanılarak genelleştirilir. Verileri işlemek için, Statistica paketi ve taşınan ALGLIB MQL5 sayısal analiz kitaplığı kullanılır.

Şimdi önem seviyesi değeri belirtilecektir. Gerçek hipotez boş (üçüncü değişken) iken, alternatif hipotezin kabul edilme olasılığıdır. Bu olasılığın minimize edilmesi tercih edilir.

Bizim durumumuzda böyle bir hata gerçekte öyle olmasına rağmen, Zarar Durdur'un ortalamada 30 puana eşit olmadığını varsayarsak ortaya çıkacaktır.

Genellikle önem seviyesi (α) 0,05'e eşittir. Bu, boş hipotezin test istatistik değerinin kritik bölgeyi 100'den fazla 5 durumda dolduramayacağı anlamına gelir.

Bizim durumumuzda test istatistik değeri klasik bir grafik üzerinde değerlendirilecektir (Şekil 1).

Fig.1 Normal olasılık yasasına göre test istatistik değer dağılımı

Şek.1. Normal olasılık yasasına göre test istatistik değer dağılımı

Yazar: Denis Kirichenko

 
  1. Üç tür yalan vardır: masum, küstah ve istatistiksel © Mark Twain
  2. "Bleek Paradoksu: Birkaç deney yaparız ve her biri için sıfır hipotezinin olasılığını hesaplarız. Bireysel deneylerin tüm istatistiksel sonuçları "başarılı" olmasına rağmen, yani her biri için sıfır hipotezi p < n olasılıkla reddedilmiş olmasına rağmen, meta-analizden sonra tam tersi bir sonuç elde ederiz: p > n.
  3. Belirli bir alanda istatistik uygulamadan önce, ergodik ortamla uğraştığımızdan emin olmamız gerekir. Aksi takdirde, akıllıca bir yüzü olan bir sayı oyununa dönüşecektir.
 
Reshetov:
  1. "Bleck Paradoksu: Birkaç deney yaparız ve her biri için sıfır hipotezinin olasılığını hesaplarız. Bireysel deneylerin tüm istatistiksel sonuçları "başarılı" olmasına rağmen, yani her biri için sıfır hipotezi p < n olasılıkla reddedilmiş olmasına rağmen, meta-analizden sonra tam tersi bir sonuç elde ederiz: p > n.

Bu ilginç bir paradoks. Bu konuda daha fazla bilgiyi nereden edinebilirim?

2. Belirli bir alanda istatistik uygulamadan önce, ergodik bir ortamla uğraştığımızdan emin olmamız gerekir. Aksi takdirde yüzümüzde zeki bir yüzle bir sayı oyunu elde ederiz.
Ergodik ortam ile ne kastettiğinizi açıklayın.
 
denkir:

İlginç bir paradoks. Bu konuda daha fazla bilgiyi nereden bulabilirim?

Ergodik ortam ile ne demek istediğinizi açıklayın.

Makaleniz bana çifte izlenim veriyor.

Artı. Bu forumda, sonuçların varsayımsal değerlendirmesi hakkında soru sorma eylemi çok önemlidir. Forum, aralıktaki bir mashka yerine bir mashka çizen ve durumun böyle olduğunu varsayan insanlarla dolu.

Eksi.

Reshetov'a tamamen katılıyorum. Söylediğiniz her şey - bu, durağan veya onlara yakın serilere atıfta bulunur - yani zaman içinde mo ve varyansın çok az değiştiği seriler. Ancak finansal piyasalarda böyle seriler yoktur ve finansal piyasalardaki tüm istatistik uygulamaları zaman serilerinin durağanlığı etrafında döner. En ünlü örnekler ARIMA, ARCH ve diğerleridir.

Histogramı Şekil 2'de gösterilen rastgele seriniz, serinin durağan olanla zayıf bir ilişkisi olduğunu, çarpık olduğunu ve önemli ölçüde farklı kuyruklara sahip olduğunu göstermektedir. Bu durum özellikle sizin tarafınızdan çizilen mükemmel normal eğriye göre daha iyi görülmektedir. Bu nedenle, gerekçeniz sizin örneğiniz için hiç geçerli değildir. Bu sadece Reshetov'un düşüncelerinin bir örneğidir.

NOT. İstatistikteki en tehlikeli ve aşağılık kavram korelasyondur. Bundan hiç bahsetmemek daha iyidir.

 
faa1947:
...Tüm bu anlattıklarınız durağan ya da durağanlığa yakın seriler için geçerlidir - yani zaman içinde mo ve varyansı çok az değişen seriler. Finansal piyasalarda böyle seriler yoktur ve finansal piyasalarda istatistiğin tüm uygulaması zaman serilerinin durağanlığı etrafında döner. En ünlü örnekler ARIMA, ARCH ve diğerleridir.

Histogramı Şekil 2'de gösterilen rastgele seriniz, serinin durağan olanla zayıf bir ilişkisi olduğunu, çarpık olduğunu ve önemli ölçüde farklı kuyruklara sahip olduğunu göstermektedir. Bu durum özellikle sizin tarafınızdan çizilen mükemmel normal eğriye göre daha iyi görülmektedir. Bu nedenle, gerekçeniz sizin örneğiniz için hiç geçerli değildir. Bu, Reshetov'un düşüncelerinin bir örneğidir.

Görüşünüz için teşekkür ederim!

Ben de karşı argümanlarımı sunacağım.

Durağanlık bir zaman serisinin özelliğidir. Şekil 2 bir varyasyon serisidir. Makale zaman serilerinden bahsetmiyor! Zamanın yararlı bir özellik olduğuna katılmama rağmen.....

Anladığım kadarıyla ergodiklik.... incelenen sistemin belirli bir kararlılığı anlamına geliyor.

Bu yüzden önemli bir noktaya dikkat çekmek istiyorum. Eğer sistem, finansal bir zaman serisinden bahsedelim, durağan değilse, modelin davranışını açıklayan istikrarlı bir model (örneğin GARCH) bulmak için yine de ekonometriyi kullanabiliriz. Ve bunda sistemin sabitliğini görüyorum - modele göre davranış.... ancak sistemin modeli "bozma" olasılığı olması koşuluyla...

 
denkir:

Görüşünüz için teşekkür ederim!

İşte benim karşı argümanlarım.

Durağanlık bir zaman serisinin özelliğidir. Şekil 2 bir varyasyon serisidir. Makale zaman serileri hakkında konuşmuyor! Zamanın yararlı bir özellik olduğuna katılmama rağmen.....

Anladığım kadarıyla ergodiklik.... incelenen sistemin belirli bir kararlılığı anlamına geliyor.

Bu yüzden önemli bir noktaya dikkat çekmek istiyorum. Eğer sistem, finansal bir zaman serisinden bahsedelim, durağan değilse, modelin davranışını açıklayan istikrarlı bir model (örneğin GARCH) bulmak için yine de ekonometriyi kullanabiliriz. Ve bunda sistemin sabitliğini görüyorum - modele göre davranış.... ancak sistemin modeli "bozma" olasılığının bir miktar olması koşuluyla.....

Birkaç yıl önce burada, çoğu insan için tamamen kabul edilemez olan bir fikri kanıtladığım bir makale yayınladım. Şöyle ki.

Çok sayıda gösterge var. Herkes bir gösterge çizilirse bunun aynı olduğunu düşünür - sonuçta biz de bunu görüyoruz. Aynı zamanda, gerçekte gördüğümüz şeyin var olmayabileceği çoğu insanın aklına gelmez! Nedeni çok sıradan. Göstergeye karşılık gelen regresyonu alırsak, bazı katsayılarının o kadar geniş güven aralıklarına sahip olduğu kolayca ortaya çıkabilir ki, böyle bir katsayının değeri hakkında konuşmak imkansızdır ve böyle kusurlu bir katsayıyı atarsak, gösterge modeli tamamen farklı olacaktır. Doğru var, yanlış var ve istatistik var dediklerinde, bu üzücü ve çok alışılmadık durumu kastediyorlar - güven aralıkları da dahil olmak üzere hiçbir şeye güvenilemez.

Bu yüzden parametrik modelleri bıraktım ve makine öğrenimi tabanlı modellerle ilgilenmeye başladım. Orada durağanlıkla ilgili hiçbir sorun yok, ancak aşırı eğitimle ilgili sorunlar tüm ihtişamıyla ortada.

 

Ve makaleyi beğendim.

Evet, San Sanych ve Reshetov'un açıklamaları haklı - karşılaştırılan sistem (veya sistem) parametrelerini değiştirirse, test sonuçları işe yaramaz.

Ancak yöntemlerin uygulanmasının gösterilmesi sevindiricidir. Forex için nadirdir!

Benzer yöntemleri tam olarak fiyat teklifleri için uygulayan biri olarak başka bir şey söyleyebilirim. Ortamın homojen olup olmadığını önceden kontrol etmek (iki bağımsız büyük örneklem üzerinde) ve ardından hipotez testinin sonuçlarına belirli bir sakinlikle güvenmek mümkündür. Bu da aynı testler sayesinde yapılabilir.