Alıntılardaki bağımlılık istatistikleri (bilgi teorisi, korelasyon ve diğer özellik seçim yöntemleri) - sayfa 7

 
TheXpert :

Göreceli artışlarla çalışıyorsanız, bunlar nasıl ayrık olabilir?

Ve ikinci soru -- kaç karakter ) ?


Ve onları ayrıştırıyoruz. İki ana şema vardır: nicelikler (PDF'yi tek tip yap) ve eşit aralıklar (PDF, ham verilerdeki sonuca çok benzer).

Karakter sayısı araştırmacı tarafından belirlenir.

 
Mathemat : Ve benim için bu görevde TI öncelikle bir veri madenciliği aracıdır. Bu verilerle ne yapılacağı başka bir sorudur. Çıplak gözle görülmeyen bir şeyi gerçekten görmemiz önemlidir. Ve başka hangi bilimlerden bahsediyorsun?

İSTATİSTİK paketinde "veri madenciliği" sekmesini açıyorum - yaklaşık 20 bölüm adı ve bireysel prosedür. Bütün bunlar, bu alandaki ders kitapları ve monograflarla mükemmel bir uyum içindedir, ancak veri madenciliği için TI hakkında hiçbir şey yoktur .

 
alexeymosc :
Açıkçası, süreci yorumladığımızda, bunların ayrık getiri değerleri olduğu görülüyor.

"Ekonomik ve diğer anlamları" içermiyorsan, hangi süreçlerden bahsediyorsun? Süreç "fiziksel" bir olgudur, nedenleri ve sonuçları vardır. Örneğin, Newton'un kafasına düşen bir elma süreci. Piyasalara bağlı, alım satım süreci. Geri dönüşlerde hepsi nerede?

Sonraki an. Ter.inf.'nin dayandığı ter.ver., dikkate alınan olayların veya sembollerin bağımsızlığını gerektirir. Aksi takdirde bu matematiksel cihazların kullanımı yanlıştır. Geri dönüşlerin bağımsızlığı nerede? Diyelim ki spekülatif nedenlerle birkaç hisse aldım (DC'den değil gerçek piyasadan bahsediyoruz) ve fiyatlarda geri dönüşler oldu. Bir süre sonra, birkaç iadeden sonra bu hisseleri satmaya karar verdim, bir dönüş daha oldu. Bu iki olay benim spekülatif güdülerim aracılığıyla oldukça açık bir şekilde birbiriyle bağlantılıdır. Piyasada benim gibi bir sürü aptal olduğu ve hepsi aynı şekilde alıp sattıkları için tüm getiriler birbirine bağlı, bağımlı hale geliyor. Öyleyse neden bağımsız olaylardan bağımlı olaylara matematiksel aparat uygulamaya çalışıyorsunuz? Bu doğru mu?

Bu nedenle, açık olmaktan uzaktır.

 
faa1947 :

İSTATİSTİK paketinde "veri madenciliği" sekmesini açıyorum - yaklaşık 20 bölüm adı ve bireysel prosedür. Bütün bunlar, bu alandaki ders kitapları ve monograflarla mükemmel bir uyum içindedir, ancak veri madenciliği için TI hakkında hiçbir şey yoktur .


Bu istatistiklerde bir kusurdur. Bu arada kendim kullanıyorum.
 
alexeymosc :

Ve onları ayrıştırıyoruz. İki ana şema vardır: nicelikler (PDF'yi tek tip yapın) ve eşit aralıklar (PDF, ham verilerdeki sonuca çok benzer).

Karakter sayısı araştırmacı tarafından belirlenir.

Onlar. Eğer piyasanın alfabesini bilmiyorsak kendimiz icat edelim ve onu inceleyeceğiz.

Elbette yanılıyor olabilirim ve bunu sık sık yapmıyorum ama bu yaklaşım bana pek başarılı gelmiyor.

 
HideYourRichess :

Onlar. Eğer piyasanın alfabesini bilmiyorsak kendimiz icat edelim ve onu inceleyeceğiz.

Elbette yanılıyor olabilirim ve bunu sık sık yapmıyorum ama bu yaklaşım bana pek başarılı gelmiyor.


Görüyorsunuz, tartışmak istemiyorum ve bundan hoşlanmıyorum ama araştırmacılar bunu sürekli değişkenler için yapıyor, ayrıklaştırıyorlar. Başka bir yol yoktur, alternatif TI'yi sürekli değişkenlere hiç uygulamamaktır.

Ama nasıl yapılır o ayrı bir konu. Sürekli bir değerin dağılımının analizi ile alfabenin karakter sayısını belirlemek için bir yöntem var (Parzen Windows - Google kuralları ... olarak adlandırılır), ancak bu durumda kullanmadım ve sanırım kaybettim bir miktar.

 
Söylenenleri hiç anlamamış gibisin. İyi şanslar.
 
HideYourRichess :
Söylenenleri hiç anlamamış gibisin. İyi şanslar.

Artışların bağımsızlığı konusundaki mantığınızı anladım. Tam olarak aynı fikirde olabileceğimden emin değilim. Bu konuda Mathemat'a da danışırdım.
 
HideYourRichess :

"Ekonomik ve diğer anlamları" dahil etmiyorsanız, hangi süreçlerden bahsediyorsunuz? Süreç "fiziksel" bir olgudur, nedenleri ve sonuçları vardır. Örneğin, Newton'un kafasına düşen bir elma süreci. Piyasalara bağlı, alım satım süreci. Geri dönüşlerde hepsi nerede?

Sonraki an. Ter.inf.'nin dayandığı ter.ver., dikkate alınan olayların veya sembollerin bağımsızlığını gerektirir. Aksi takdirde bu matematiksel cihazların kullanımı yanlıştır. Geri dönüşlerin bağımsızlığı nerede? Diyelim ki spekülatif nedenlerle birkaç hisse aldım (DC'den değil gerçek piyasadan bahsediyoruz) ve fiyatlarda geri dönüşler oldu. Bir süre sonra, birkaç iadeden sonra bu hisseleri satmaya karar verdim, bir dönüş daha oldu. Bu iki olay benim spekülatif güdülerim aracılığıyla oldukça açık bir şekilde birbiriyle bağlantılıdır. Piyasada benim gibi bir sürü aptal olduğu ve hepsi aynı şekilde alıp sattıkları için, tüm getiriler birbirine bağlı - bağımlı hale geliyor. Öyleyse neden bağımsız olaylardan bağımlı olaylara matematiksel aparat uygulamaya çalışıyorsunuz? Bu doğru mu?

Bu nedenle, açık olmaktan uzaktır.


Bu durumda, anladığım kadarıyla bağımsızlık gerekli değil, sadece değerlendirme konusu.
 
Rusça'da TI kullanımına ilişkin birçok örnek, Rusça ve diğer dillerin alfabetik alfabesinin analizinin yanı sıra kelimelerin ve deyimlerin (kelime dizileri) analizi ile ilgilidir. Ancak tüm bu semboller a priori istatistiksel olarak bağımsız değildir ve bu örnekler karşılıklı bilgiyi değerlendirmek için kullanılır, bu bağımlılık miktarını gösteren bir değerdir. Bu nedenle, incelenen miktarların önsel bağımsızlığı, TI'nin doğru uygulanması için gerekli bir koşul değildir.
Neden: