Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 87

 
San Sanych Fomenko :

Tüm paketler (modeller) iki kategoriye ayrılabilir:

  • temelde uygun
  • temelde uygun değil.

"Prensip olarak uygun" olan paketlerin etkinliği yaklaşık olarak aynıdır, farklar önemli değildir.

Tüm problemler modelde değil, tahmin ediciler setinde ve ön hazırlıklarındadır. Belirli bir tahmin ediciler seti alırsak, fazla UYMAYAN bir model oluşturma yeteneği ve hatanın büyüklüğü, modeldeki değişime çok az bağlıdır. Bu nedenle, “prensipte uygun” olanlardan en basit ve en hızlı modeli almak gerekir.

not.

Kendi deneyimimden. Benim için, bir TS oluşturmadaki karmaşıklığın %75'inden fazlası, belirli bir hedef değişken için böyle bir set seçmek mümkünse, tahmin edicilerin seçimidir.

San Sanych, merhaba

Ancak, yönteminize göre, eğitim sırasında kesişmeyen 3 veri segmentinde, tahmin edicilerin farklı önemleri varsa, o zaman durağan değiller (gürültüler, vb.) olmalılar mı?

 
San Sanych Fomenko :

Tüm paketler (modeller) iki kategoriye ayrılabilir:

  • temelde uygun
  • temelde uygun değil.

"Prensip olarak uygun" olan paketlerin etkinliği yaklaşık olarak aynıdır, farklar önemli değildir.

Tüm problemler modelde değil, tahmin ediciler setinde ve ön hazırlıklarındadır. Belirli bir tahmin ediciler seti alırsak, fazla UYMAYAN bir model oluşturma yeteneği ve hatanın büyüklüğü, modeldeki değişime çok az bağlıdır. Bu nedenle, “prensipte uygun” olanlardan en basit ve en hızlı modeli almak gerekir.

not.

Kendi deneyimimden. Benim için, bir TS oluşturmadaki karmaşıklığın %75'inden fazlası, belirli bir hedef değişken için böyle bir set seçmek mümkünse, tahmin edicilerin seçimidir.

hangi modellerden, neyden bahsediyorsun ... sanki biri soruyor - "saat kaç?" , ve ona "Senin için ne dans etmemi istersin?" diye cevap verirler. :)

asla, sana yalvarıyorum, hayır, sana yalvarıyorum, bunu bir daha asla yapma, bir sorunun iki satırını okumaktan 10 satırlık metin yazmak senin için gerçekten daha mı kolay?

 
mytarmailS :

Belki birisi ilgilenir, ticareti simüle edebileceğiniz ve quantstrat adlı ticaret sistemleri oluşturabileceğiniz bir paket buldum.

http://www.rinfinance.com/agenda/2013/workshop/Humme+Peterson.pdf

yeniden yayınlamak
 
Alexey Burnakov :

San Sanych, merhaba

Ancak, yönteminize göre, eğitim sırasında kesişmeyen 3 veri segmentinde, tahmin edicilerin farklı önemleri varsa, o zaman durağan değiller (gürültüler, vb.) olmalılar mı?

Tahmin edicilerin önemi yalnızca bir kez elde edilir - modeli eğitirken. O halde bu model öğrenilmez, UYGULANIR.
 
San Sanych Fomenko :
Tahmin edicilerin önemi yalnızca bir kez elde edilir - modeli eğitirken. O halde bu model öğrenilmez, UYGULANIR.
Hatırladığım kadarıyla orada birkaç kez antrenman yapman gerekiyor mu?
 
Alexey Burnakov :
Hatırladığım kadarıyla orada birkaç kez antrenman yapman gerekiyor mu?

Evet, hiçbir durumda değil!

Tekrar.

1. Büyük bir tahmin zaman serisi parçası alıyoruz, örneğin 10.000 gözlem (satır)

2. Kesinlikle mekanik olarak iki kısma ayırıyoruz: 7000 birinci kısım ve 3000 ikinci kısım

3. İlk bölüm rastgele üç bölüme ayrılmıştır: eğitim, test ve doğrulama için

4. Modeli eğitim için örnek üzerinde öğretiyoruz (ayarlıyoruz - uyuyoruz).

5. Eğitimli modeli test örneklerine, doğrulamaya uygularız.

6. Üç örneğin hepsinde - eğitim, test ve doğrulama, hata yaklaşık olarak eşitse, o zaman madde 7'dir.

7. Model modelini, zaman dizisinde kırılmayan zaman serisi olan ikinci kısımda uyguluyoruz.

8. Bu bölümdeki hata yaklaşık olarak önceki üçe eşitse, o zaman:

  • bu tahmin ediciler seti, modelin yeniden eğitilmesine yol açmaz.
  • tüm DÖRT kümede (üç rastgele ve bir ardışık) elde edilen ve modele uydurarak azaltılması çok zor olan bir hatadır.
Model verimliliğim yanlışlıkla şu şekildedir: ada, randomforest, SVM ve bunların birçok çeşidi. nnet çok daha kötü.

 
San Sanych Fomenko :

Evet, hiçbir şekilde değil!

Tekrar.

1. Büyük bir tahmin zaman serisi parçası alıyoruz, örneğin 10.000 gözlem (satır)

2. Kesinlikle mekanik olarak iki kısma ayırıyoruz: 7000 birinci kısım ve 3000 ikinci kısım

3. İlk bölüm rastgele üç bölüme ayrılmıştır: eğitim, test ve doğrulama için

4. Modeli eğitim için örnek üzerinde öğretiriz (ayarlarız - sığdırırız).

5. Eğitimli modeli test örneklerine, doğrulamaya uygularız.

6. Üç örneğin hepsinde - eğitim, test ve doğrulama, hata yaklaşık olarak eşitse, o zaman madde 7'dir.

7. Model modelini, zaman dizisinde kırılmayan zaman serisi olan ikinci kısımda uyguluyoruz.

8. Bu bölümdeki hata yaklaşık olarak önceki üçe eşitse, o zaman:

  • bu tahmin ediciler seti, modelin yeniden eğitilmesine yol açmaz
  • tüm DÖRT kümede (üç rastgele ve bir ardışık) elde edilen ve modele uydurarak azaltılması çok zor olan bir hatadır.
Model verimliliğim yanlışlıkla şu şekildedir: ada, randomforest, SVM ve bunların birçok çeşidi. nnet çok daha kötü.

Burada. Teşekkür ederim.

Eğitimde diğer örneklere göre çok daha iyi bir sonuç elde ettim. Ve çapraz doğrulamada, sonuç, numunenin son haline çok daha yakındır.

Bence tüm örneklerdeki hataların eşitliği konusundaki teziniz modelin yetersiz olduğunu gösteriyor. Yani her yerde aynıdır.
 
Alexey Burnakov :
.... Yani, her yer eşit derecede böyledir.

So-so - sadece yeterli beyin ve zaman yok.

Hedef değişkenle başlamanız ve ardından bunun için öngörücüleri seçmeniz gerekir, üstelik anlama göre ve ardından matematikle iki kez kontrol edin, bunun gibi bir şey. Her durumda, süreç kasvetli ve benim için resmileşmedi.

 
San Sanych Fomenko :

So-so - sadece yeterli beyin ve zaman yok.

Hedef değişkenle başlamanız ve ardından bunun için öngörücüleri seçmeniz gerekir, üstelik anlama göre ve ardından matematikle iki kez kontrol edin, bunun gibi bir şey. Her durumda, süreç kasvetli ve benim için resmileşmedi.

Özellikle anlam açısından kasvetli. Bunu kastetmiyorum.

Her yerde eşit derecede iyiyseniz, bu bir başarıdır. Ancak çoğu zaman, zayıf bir modelin başarmasına izin verdiği eşit derecede kötü olacaktır.
 
ip yolda öldü...
Neden: