Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 92

 
Sihirbaz_ :
Tamam))) ama koşulları dikkatlice okuyun -
"her iki örnek için sonuçları % (başarıyla tahmin edilen durumlar) olarak düzenleyin (tren = %xx, test = %xx). Yöntem ve modellerin dile getirilmesine gerek yok, sadece rakamlara gerek yok"
Daha fazla sonuç bekliyoruz. Mihail Marchukajtes'in ne gibi sonuçlar çıkarabileceğini merak ediyorum.

sonucum (isterseniz yöntemi de seslendireceğim):

# predict with best models

glm_predict_train <- as.data.frame(predict(glm_obj

, newx = training

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_train$observed <- train_y

table(glm_predict_train[, 2], glm_predict_train[, 1])

table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

# validate with best models

glm_predict_validate <- as.data.frame(predict(glm_obj

, newx = validating

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_validate$observed <- validate_y

table(glm_predict_validate[, 2], glm_predict_validate[, 1])

table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

eğitimde %56:

> table(glm_predict_train[, 2], glm_predict_train[, 1])

      

       down  up

  down  333 181

  up    256 230

> table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

      

        down    up

  down 0.333 0.181

  up   0.256 0.230

%52 testte:

> table(glm_predict_validate[, 2], glm_predict_validate[, 1])

      

       down  up

  down  332 173

  up    309 186

> table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

      

        down    up

  down 0.332 0.173

  up   0.309 0.186

 
Eh, genel olarak, maksimum veri genelleme seviyesi yaklaşık% 53'tür, yani ..... Çöpteki çöp ara sıra sürünür, bu çöp .... Uzun formüller olduğu için testi kontrol etmenin bir yolu yoktur. Excel'de desteklenmez. Bu durumda MKUL'a yazmak istemiyorum, model normal kalitede olsaydı kafam karışırdı ve böyle bir genelleme yüzdesi ile testteki sonucun çok fazla olmayacağını düşünüyorum ...
 
mytarmailS :
Bu “öngörülebilirliğin” nasıl hesaplandığını anlamıyorum ve hedef dikkate alınmazsa bunun bir anlamı var mı?

Orada, bazı formüllerin yardımıyla, sinyalin ne kadar gürültülü olduğu veya bunun tersinin düzenli olduğu tahmin edilir. Bir yazar tarafından nasıl ve hangi formüllerin hesaplandığı biliniyor, ona sadece ne yaptığını anladığına güvenebilirsiniz.
Özü oldukça basittir - tahmin edicilerin kendileri "gürültü" değilse, onlar hakkında bir şey tahmin etmek daha kolaydır. Ve bir şekilde işlenirlerse, daha da kararlı bir sinyal alabilirsiniz. Kararlı bir sinyal, tahmin için iyi bir temeldir.

Hatta bu paketteki Omega() işleviyle, tahmin edicileri kendiniz de hızlı bir şekilde değerlendirebilirsiniz, ona belirli bir tahmin edicinin değerlerini (eğitim tablosundan bir sütun) beslemeniz gerekir. sonuç %0 - gürültü ve tahmin edici işe yaramaz. %100 - her şey yolunda, tahmin edici kullanılabilir.
Fonksiyonun saf gösterge değerleriyle değil, örneğin hareketli bir ortalama için büyümeleriyle beslenmesi gerektiğine inanıyorum - c(MA[0]-MA[1], MA[1]-MA[2], MA[2] ]-MA[ 3], vb.).

Hedef değerlere gelince - evet, pakette kullanılmazlar. Bu paket hiçbir şeyi tahmin edemez. Sadece bir şekilde hangi tahmincilere güvenilebileceğini ve hangilerinin güvenilmeyeceğini belirler ve bunlara dayalı olarak birkaç yeni tahmin daha yaratır. Hedef değişkenin seçimi ve tahmine dayalı modelin eğitimi farklı şekilde ele alınmalıdır. Bazı hedef değişkenlerin daha iyi, bazılarının daha kötü tahmin edilmesi mantıklıdır.
Hedef değişken genellikle herhangi bir paket için bir sorundur. Kullanılan hedef değişkenin, mevcut tahmin ediciler kullanılarak hiç tahmin edilebileceği kesin değildir. Örneğin, hedef değişken için "bir sonraki çubuk için fiyat artışı/düşüş" veya "zikzak yükseliş/düşüş" kullanabilirim. Mevcut tahmin edicilere en iyi şekilde uymaları için yeni hedef değişkenlerin nasıl oluşturulacağını öğrenmek istiyorum. Kim bilir, belki tahmincilerimle bir daireyi mükemmel bir şekilde tahmin edebilirim, ama bunu asla bilemeyeceğim çünkü denemedim.

 
Anladığım kadarıyla kimse koşulları okumuyor (herhangi bir veri manipülasyonunu kullanmasına izin veriliyor), bu yüzden eziyet etmeyeceğim. Aslında, her şey basit.
Sadece A6'dan gecikmeleri almanız, yedinci basit formülü beşten az uygulamanız ve her iki örnekte de %100 almanız gerekiyor. Herkese teşekkürler. İyi şanlar...
 
Sihirbaz_ :
Anladığım kadarıyla kimse koşulları okumuyor (herhangi bir veri manipülasyonunu kullanmasına izin veriliyor), bu yüzden eziyet etmeyeceğim. Aslında, her şey basit.
Sadece A6'dan gecikmeleri almanız, yedinci basit formülü beşten az uygulamanız ve her iki örnekte de %100 almanız gerekiyor. Herkese teşekkürler. İyi şanlar...
Peki, ne var??? Ayrıca çıktı değişkenini girdi çöp yığınında bu şekilde kodlayabilirim. Ne olur tahmin et. Bunun amacı ne hala anlamadım?
 
Michael Marchukajtes :
Peki, ne var??? Ayrıca çıktı değişkenini girdi çöp yığınında bu şekilde kodlayabilirim. Ne saçmalıyorsun. Bunun amacı ne hala anlamadım?
Dikkatimizi, kullanılan veri miktarının bir tahmin için her zaman yeterli olmadığına çekti. Örneğin, kendimizi 9 çubukla sınırlayarak, daha uzak çubuklardan önemli bilgileri kaçırıyor olabiliriz. Ayrıca, diğer tahmin edicilerle olan etkileşimlerini hesaba katmadan bir tahmin ediciyi derecelendirmenin imkansız olduğunu da.
 
Michael Marchukajtes :
Peki, ne var??? Ayrıca çıktı değişkenini girdi çöp yığınında bu şekilde kodlayabilirim . Ne olur tahmin et. Bunun anlamı neydi hala anlamadım??
Gopher'ın görünmediği gerçeği, ama orada)))
Hadi deneyelim. Sadece basit.
 
Sihirbaz_ :
Gopher'ın görünmediği gerçeği, ama orada)))
Hadi deneyelim. Sadece basit.
Hadi, bir şey düşüneyim...
 
Örneğin, bu dosya. Chitso treninin herhangi bir test yapmasına gerek yoktur. Optimize edicide, Reshetov %56 çöp siltini gösteriyor, ancak orada bir sincap da var. Kim bulabilir....??? Doğru, bu oyunlardaki noktayı görmüyorum, girdi dönüşümünden çıktı yapıldığında, o zaman ağa ihtiyaç kalmayacak .... öyleyse ....
 
Michael Marchukajtes :
Örneğin, bu dosya. Chitso treninin herhangi bir test yapmasına gerek yoktur. Optimize edicide, Reshetov %56 çöp siltini gösteriyor, ancak orada bir sincap da var. Kim bulabilir....??? Doğru, bu oyunlardaki noktayı görmüyorum, girdi dönüşümünden çıktı yapıldığında, o zaman ağa ihtiyaç kalmayacak .... öyleyse ....
Testere, peki, bu forum basit bir Rarovsky arşivinin eklenemeyeceğini çileden çıkarıyor .... Tek kelimeyle sefalet ....
Dosyalar:
Neden: