Makroekonomik göstergelere dayalı piyasa tahmini - sayfa 9

 
transcendreamer :


Hâlâ katılmıyorum - regresyon, herhangi bir veriyle harika çalışıyor, diğer yöntemlerden mutlaka daha iyi değil, ancak yine de oldukça iyi, özellikle de bilgi işlem kaynaklarının aşırı derecede iddiasız olduğu düşünüldüğünde


Regresyon hiçbir veriyle ÇALIŞMAZ. Bu, özellikle bu konunun başında bahsedilen lineer regresyon için geçerlidir.

Doğrusal regresyon uygulama problemi iki seviyeye ayrılabilir.

1. Regresyon katsayılarının ilk tahmini. DEĞERLENDİRME. Eğer y \u003d a + yazarsak, o zaman burada artık doğruluk olmaz, çünkü regresyon bir denklem değildir ve doğru gösterim y ~ a + in'dir, burada tilde işareti katsayıların sabit olmadığını, ancak tahmin olduğunu vurgular. rasgele değişkenlerin bir miktar doğrulukla , ve bu nedenle gönderinizde önerdiğiniz gibi bunları eklemek imkansızdır.

Buna uygun olarak, herhangi bir regresyon uydurma paketi kullanıldığında, her katsayı, katsayının belirtilen değerini rastgele bir değişken olarak karakterize eden belirli bir sayı kümesiyle ilişkilendirilir. Toplam sonuç, yıldız şeklinde en sağdaki sütunda görüntülenir. Üç yıldız, katsayı değerini bir sabit olarak veya daha doğrusu küçük bir hata ve küçük bir yayılma ile rastgele bir değişkenin tahmini olarak algılayabileceğiniz anlamına gelir. Yıldız işareti yoksa verilen değer genellikle boş bir alandır ve hiçbir şekilde kullanılamaz.

Ama bütün sorun bu değil. Ve ana sıkıntılar aşağıdaki gibidir.

2. Doğrusal regresyon YALNIZCA durağan verilere uygulanabilir, yani. yaklaşık olarak sabit mo ve sabit dağılıma sahiptir. Trendin ortadan kaldırılmasına yol açan bahsettiğiniz dönüşüm, onu durağan hale getirme girişimidir. Bütün bunlar ARIMA modelleri şeklinde özetlenmiştir, ancak bu tür finansal seriler vardır ve bunların çoğu, ARIMA modelleri sorunları çözmediğinde.

Tüm bu incelikleri ayırt etmezseniz, doğrusal regresyon kullanılarak elde edilen sonuçlar boş bir sayı oyunudur.

 
faa1947 :

Regresyon hiçbir veriyle ÇALIŞMAZ. Bu, özellikle bu konunun başında bahsedilen lineer regresyon için geçerlidir.

Doğrusal regresyon uygulama problemi iki seviyeye ayrılabilir.

1. Regresyon katsayılarının ilk tahmini. DEĞERLENDİRME. Eğer y \u003d a + yazarsak, o zaman burada artık doğruluk olmaz, çünkü regresyon bir denklem değildir ve doğru gösterim y ~ a + in'dir, burada tilde işareti katsayıların sabit olmadığını, ancak tahmin olduğunu vurgular. rasgele değişkenlerin bir miktar doğrulukla , ve bu nedenle gönderinizde önerdiğiniz gibi bunları eklemek imkansızdır.

Buna uygun olarak, herhangi bir regresyon uydurma paketi kullanıldığında, her katsayı, katsayının belirtilen değerini rastgele bir değişken olarak karakterize eden belirli bir sayı kümesiyle ilişkilendirilir. Toplam sonuç, yıldız şeklinde en sağdaki sütunda görüntülenir. Üç yıldız, katsayı değerini bir sabit olarak veya daha doğrusu küçük bir hata ve küçük bir yayılma ile rastgele bir değişkenin tahmini olarak algılayabileceğiniz anlamına gelir. Yıldız işareti yoksa verilen değer genellikle boş bir alandır ve hiçbir şekilde kullanılamaz.

Ama bütün sorun bu değil. Ve ana sıkıntılar aşağıdaki gibidir.

2. Doğrusal regresyon YALNIZCA durağan verilere uygulanabilir, yani. yaklaşık olarak sabit mo ve sabit dağılıma sahiptir. Trendin ortadan kaldırılmasına yol açan bahsettiğiniz dönüşüm, onu durağan hale getirme girişimidir. Bütün bunlar ARIMA modelleri şeklinde özetlenmiştir, ancak bu tür finansal seriler vardır ve bunların çoğu, ARIMA modelleri sorunları çözmediğinde.

Tüm bu incelikleri ayırt etmezseniz, doğrusal regresyon kullanılarak elde edilen sonuçlar boş bir sayı oyunudur.

benim için iyi çalışıyor))) ve sadece doğrusal regresyon

katsayıları toplamak kaba bir yöntem, katılıyorum

Katsayıların öneminin analizini ve sapmaların analizini yapmaya çalıştım, ancak pratikte bana göründüğü gibi çok az faydası var.

son eğrinin nasıl davrandığını ve teorik değerleri ilk verilere ne kadar iyi bağladığını grafik üzerinde görsel olarak görmek çok daha kolay ve kullanışlıdır.

bu yüzden karar vektörünü olduğu gibi alıyorum ve çoğu durumda bu yeterli

ortaya çıkan grafik verilerle iyi uyuyorsa, her şey yolunda demektir

Başka yöntemlerle daha iyi çözümler bulmaya çalıştım - sonuç, gerilemenin verdiğinden çok farklı değil

aynı zamanda, bazı katsayıların belirli sınırlar içinde yüzebildiğini ve bunun nihai eğriyi büyük ölçüde etkilemediğini fark ettim.

ama bu korkutucu değil, yine de bu katsayılar kararsız, zamanla yavaş yavaş değişecek, onları değerlendirmenin ne anlamı var

durağanlık hakkında - elbette piyasada yok, o zaman ne yapmalı?

muhtemelen benim yaptığım gibi yapmak akademik değil

ama sonra yerine ne almalı?

 
transcendreamer :

.....

ama sonra yerine ne almalı?

Kendinizi lineer regresyonla sınırladınız, ancak soruyu şu şekilde sorabilirsiniz: sahip olduğunuz görevlere bağlı olarak en uygun regresyon türünü seçin. Tüm büyük regresyon setinin (sadece lineer olanlar değil) bir grup kara kutu olarak kabul edilebileceğini ve sonuçların değerlendirilmesinde anlamlı problemlere odaklanılabileceğini unutmayın.

Kısa pantolonlar gibi lineer regresyondan çıkmak için zaman anlamında para harcamanız gerekir.

Ardından, tahmin ettiğiniz şeyin türüne karar verin, yani: örneğin bir döviz çiftinin fiyatı gibi bir değer mi tahmin edeceksiniz yoksa fiyat hareketinin yönünü, "uzun kısa" veya diğerlerinin bazı niteliksel özelliklerini mi tahmin edeceksiniz? terminal siparişleri.

Ve şimdi bazı zaman maliyetlerine karar vermemiz gerekiyor.

İlk etapta 100'den fazla modelin dünyasına bir kapı olarak Rattle'ı herkese tavsiye ediyorum. Doğrusal regresyon hakkındaki muhakeme seviyenize bakılırsa, bu bir veya iki gün zamanınız. Sonuç olarak, 6 tür model elde edeceksiniz, bunlardan biri neredeyse favoriniz, sadece "genelleştirilmiş doğrusal" olarak adlandırılıyor, ancak geri kalanı çok daha ilginç, bununla gerçekten tahmin modelleri yapabilirsiniz.

 
faa1947 :

Kendinizi lineer regresyonla sınırladınız, ancak soruyu şu şekilde sorabilirsiniz: sahip olduğunuz görevlere bağlı olarak en uygun regresyon türünü seçin. Tüm büyük regresyon setinin (sadece lineer olanlar değil) bir grup kara kutu olarak kabul edilebileceğini ve sonuçların değerlendirilmesinde anlamlı problemlere odaklanılabileceğini unutmayın.

Kısa pantolonlar gibi lineer regresyondan çıkmak için zaman anlamında para harcamanız gerekir.

Ardından, tahmin ettiğiniz şeyin türüne karar verin, yani: örneğin bir döviz çiftinin fiyatı gibi bir değer mi tahmin edeceksiniz yoksa fiyat hareketinin yönünü mi, "uzun-kısa" veya diğer terminal siparişleri.

Ve şimdi bazı zaman maliyetlerine karar vermemiz gerekiyor.

İlk etapta 100'den fazla modelin dünyasına bir kapı olarak Rattle'ı herkese tavsiye ediyorum. Doğrusal regresyon hakkındaki muhakeme seviyenize bakılırsa, bu bir veya iki gün zamanınız. Sonuç olarak, 6 tür model elde edeceksiniz, bunlardan biri neredeyse favoriniz, sadece "genelleştirilmiş doğrusal" olarak adlandırılıyor, ancak geri kalanı çok daha ilginç, bununla gerçekten tahmin modelleri yapabilirsiniz.

ne yazık ki, söylediğim gibi, diğer optimize ediciler, doğrusal regresyona kıyasla önemli ölçüde daha iyi sonuçlar göstermedi

belki bilimsel olarak uygulanan bazı görevlerde avantaj sağlarlar, ancak ticaret için doğru bir tahmin bir yanılsamadır

aynı GLM sigortacılar için icat edildi, yanılmıyorsam, SVM ve ADA çok dar bilenmiş, lojistik regresyon bariz nedenlerle uygun değil

sinir ağları ve rastgele ormanlar evrenseldir ve daha faydalıdır çünkü sıfır kök sorununu atlarlar ve herhangi bir amaç fonksiyonunu ayarlayabilirsiniz.

ama orada gerçekten kafanı kırabilirsin, en azından benim için beşeri bilimler için

benim için bir keşifti - temel bileşenler yöntemi, ancak bunu görevime (portföyler) uygulamak işe yaramadı

rastgele ormanlar kesinlikle bir göz atmaya değer, bir süre sonra onları daha yakından denemeyi planlıyorum ama gerçekten büyük bir etki olacağını beklemiyorum

çıngırakta GA olmaması üzücü ya da bulamadım

 

"Zavallı" lineer regresyon, demezdim. Ayrıca bir sürü başka model denemediğimi varsaymama da gerek yok.

Herhangi bir doğrusal olmayan modelin y = f(x1,x2,...) bir Taylor serisine genişletilebileceğini herkes bilir:

y = a0 + a11*df/dx1*x1 + a12*df/dx2*x2 + ... + a21*d^2f/dx1^2*x1^2 + a22*d^2f/dx2^2*x2^ 2 + b11*d^2f/dx1/dx2*x1*x2 + ...

Matematik konusunda deneyimli olanlar bunun f(x1,x2,...) fonksiyonunun x, x^2, x^3, vb. polinom (daha doğrusu tek terimli) tabanlarına ayrıştırılması olduğunu bilirler. Doğrusal regresyon, bu genişlemenin yalnızca doğrusal terimlerini korur, bu nedenle birinci dereceden bir yaklaşımdır. Doğrusal olmayan bazlar, Chebyshev, Hermite, Legendre, vb. gibi iyi bilinen çeşitli polinomlardan seçilebilir. Ancak polinomları seçmenin doğru yöntemi, QR ayrıştırmasıdır veya daha genel olarak, istatistiksel özelliklerini dikkate alarak ortogonal polinomları seçmektir. x1, x2, ... girdileri, aynı genişletmeyi yapmaya çalışır, ancak Kolmogorov teoremine göre girdi fonksiyonunun exp'inde. Girdilerin üstel fonksiyonları birbirine dik olmadığından, bu oldukça uygunsuz bir açılımdır, bu da bir dizi sayısal probleme ve çözüme yol açar. Her durumda, doğrusal olmayan fonksiyonumuzun tüm bu açılımları, birinci dereceden bir yaklaşım olarak doğrusal bir modele sahip olacaktır. Dolayısıyla, doğrusal yaklaşım (regresyon) bize beklenen sonucu vermiyorsa, daha yüksek doğrusal olmama derecelerine gitmenin bir anlamı yoktur. Lineer regresyon bile, hepsini denediğim farklı yöntemlerle (RMS, MHM ve diğer keyfi hata işlevleri) çözülebilir.

Bu arada, tüm ekonometrik ARMA, ARIMA ve diğer modeller, yukarıdaki modelin y[n] = f(x1[n-d1],x2[n-d2],...) girişler gecikmeli çıkışlardır, t .e. y[n-1], y[n-2], bu nedenle "otoregresif" modeller adı. COEX yöntemi veya MIM kullanarak otoregresif modelleri çözmek sağlıksız olsa da. elde edilen katsayılar salınımlı modellere yol açar. Burg'un yöntemlerine, Değiştirilmiş Kovaryans'a vb. ihtiyacımız var. Ama bu "otoregresyon" bölümünü uzun zaman önce geçtim ve geri dönmek istemiyorum. Her ne kadar piyasa modelim girişlerden biri olarak gecikmeli bir çıkış seçimine izin veriyor. Ancak şimdiye kadar, hiçbir zaman böyle bir "otoregresif" girişi seçmedi; bu, ekonomik göstergelerin fiyat tahmini için geçmişteki fiyatın kendisinden daha uygun olduğu anlamına gelir (bu analizlere dayalı ticaret yöntemlerinin büyük çoğunluğunun temelini oluşturur)

 
faa1947 :

Bir teklifim var.

Sütunların adlarını içeren tsv.file dosyasını bırakın. Hedef değişkenler olarak kullanılacak sütunları belirtin. Doğal olarak, bir tablo satırı zaman içinde bir noktaya atıfta bulunmalıdır.

Rattle'a gideceğim ve izninizle 6 çok iyi modelin sonucunu burada yayınlayacağım.


Teklifi kabul ediyorum. Geçerli bir veri dosyası biçimi belirtin. mat sığacak mı? Çok fazla veri, CSV tüm diski yakar. MAT sadece 6MB.

Ancak bir şartım var: 2000'den 2015'e kadar olan bölgede tahminler yapılır, ancak yalnızca tahmin tarihinden önce mevcut olan verilere dayanarak. Yani, Q1 2000 için bir tahmin yaparsanız, o zaman Q1 2000'e kadar olan veriler üzerinde çalışırsınız. 2015 dahil tüm mevcut veriler için tahmin ediciler seçmek ve ardından bunları, modelin katsayıları hesaplanmış olsa bile, Q1 2000'i tahmin etmek için kullanmak 2000 yılının ilk çeyreğinden önceki verilerden, bu ileriye dönük. Geçmişte bu hatayı yaşadım ve sahip olduğum model şaşırtıcı derecede öngörülü. Kısacası benim durumum: tahminciler seçilir ve tahmin edilen modelin kendisi tahmin edilen tarihten ÖNCE verilere göre hesaplanır.

 
gpwr :

Teklifi kabul ediyorum. Geçerli bir veri dosyası biçimi belirtin. mat sığacak mı? Çok fazla veri, CSV tüm diski yakar. MAT sadece 6MB.


İlk sorun dosyadır. Düşünmek gerek. Eminim MAT R - R alır ve MATLAB çok arkadaş canlısıdır, ama nasıl yapacağımı bilmiyorum. Hazır olunca yayınlayacağım.

 
gpwr :

"Zavallı" lineer regresyon, demezdim.



Durağan olmayan veriler için "Kötü".

Ve kısaca benim gönderilerim: araç soruna karşılık gelmelidir.

Regresyonlar için finansal serilerin durağan olmaması temel bir problemdir. Bu nedenle bir araç takımı seçerken, seçilen aracın durağan olmama sorununu nasıl çözdüğüne bakmak gerekir. Bahsettiğim ARIMA durağan olmama problemini bir yere kadar çözüyor ama Taylor serisinin durağan olmama problemini çözdüğünü duymadım. Regresyonlar çerçevesinde, ABD hükümet yapılarında hala kullanılmasına ve en gelişmiş olmamasına rağmen, ARIMA tek araç değildir. Yaygın olarak bilinenlerden, bir dizi değişiklikle ARCH'den bahsedeceğim.

Durağan olmamanın sonucu, modelin aşırı uyumudur. Olağanüstü doğrulukta bir model inşa etmenin mümkün olduğu gerçeğinde kendini gösterir, ancak eğitim örneği dışında çalışmaz ve aşağılık bir şekilde: bazen çalışır, bazen çalışmaz. Basit modellerin karmaşık olanlara üstünlüğü hakkındaki sözleriniz iyi bilinen bir gerçektir ve karmaşık bir modelin basit bir modele göre çok daha kolay giyilmesi gerçeğine dayanmaktadır.

 
gpwr :

"Zavallı" lineer regresyon, demezdim. Ayrıca bir sürü başka model denemediğimi varsaymama da gerek yok.

Herhangi bir doğrusal olmayan modelin y = f(x1,x2,...) bir Taylor serisine genişletilebileceğini herkes bilir:

y = a0 + a11*df/dx1*x1 + a12*df/dx2*x2 + ... + a21*d^2f/dx1^2*x1^2 + a22*d^2f/dx2^2*x2^ 2 + b11*d^2f/dx1/dx2*x1*x2 + ...

Matematik konusunda deneyimli olanlar bunun f(x1,x2,...) fonksiyonunun x, x^2, x^3, vb. polinom (daha doğrusu tek terimli) tabanlarına ayrıştırılması olduğunu bilirler. Doğrusal regresyon, bu genişlemenin yalnızca doğrusal terimlerini korur, bu nedenle birinci dereceden bir yaklaşımdır. Doğrusal olmayan bazlar, Chebyshev, Hermite, Legendre, vb. Gibi iyi bilinen çeşitli polinomlardan seçilebilir. Ancak polinomları seçmenin doğru yöntemi, QR ayrıştırmasıdır veya daha genel olarak, istatistiksel özellikleri dikkate alarak ortogonal polinomları seçmektir. x1, x2, ... girdileri, aynı genişletmeyi yapmaya çalışır, ancak Kolmogorov teoremine göre girdi fonksiyonunun exp'inde. Girdilerin üstel fonksiyonları birbirine dik olmadığından, bu oldukça uygunsuz bir açılımdır, bu da bir dizi sayısal probleme ve çözüme yol açar. Her durumda, doğrusal olmayan fonksiyonumuzun tüm bu açılımları, birinci dereceden bir yaklaşım olarak doğrusal bir modele sahip olacaktır. Dolayısıyla, doğrusal yaklaşım (regresyon) bize beklenen sonucu vermiyorsa, daha yüksek doğrusal olmama derecelerine gitmenin bir anlamı yoktur. Lineer regresyon bile, hepsini denediğim farklı yöntemlerle (RMS, MHM ve diğer keyfi hata işlevleri) çözülebilir.

Bu arada, tüm ekonometrik ARMA, ARIMA ve diğer modeller, yukarıdaki modelin y[n] = f(x1[n-d1],x2[n-d2],...) girişler gecikmeli çıkışlardır, t .e. y[n-1], y[n-2], bu nedenle "otoregresif" modeller adı. COEX yöntemi veya MIM kullanarak otoregresif modelleri çözmek sağlıksız olsa da. elde edilen katsayılar salınımlı modellere yol açar. Burg'un yöntemlerine, Değiştirilmiş Kovaryans'a vb. ihtiyacımız var. Ama bu "otoregresyon" bölümünü uzun zaman önce geçtim ve geri dönmek istemiyorum. Her ne kadar piyasa modelim girişlerden biri olarak gecikmeli bir çıkış seçimine izin veriyor. Ancak şimdiye kadar, asla böyle bir "otoregresif" girişi seçmedi; bu, ekonomik göstergelerin fiyat tahmini için geçmişteki fiyatın kendisinden daha uygun olduğu anlamına gelir (bu analizlere dayalı ticaret yöntemlerinin büyük çoğunluğunun temelini oluşturur)

Sanırım demek istediğim buydu :)

örneğin, bir veri kümesi üzerinde bir regresyon oluştururum, bir "şöyle" bir model elde ederim ve neredeyse her zaman diğer yöntemler de "şöyle" bir model verir

ve eğer doğrusal regresyon "az ya da çok" bir model verirse, o zaman diğer yöntemlerin onu biraz iyileştirebileceğini fark ettim.

 
"Öngörü", "tahmin" vb. ile ne kastedildiğine dair net bir tanım veya en azından bir açıklama vermekten zarar gelmez. "Tahmin" ufku nedir? Bu olmadan, "tahminler" anlamlarını kaybeder. Çünkü ufka bağlı olarak aynı "tahmin" bir ufuk için doğru, başka bir ufuk için yanlış çıkabilir. Ayrıca, bu tür bölümler birçok kez değişebilir.
Neden: