"Rastgele Ormanlar Öngörü Trendleri" makalesi için tartışma - sayfa 13

 
MetaQuotes Software Corp.:

Random Forests ile Trendleri Tahmin Etmek adlı yeni makale yayınlandı:

Yazan: СанСаныч Фоменко


Bu model tahmin konusunda çok kolaydır, ancak pratikte bununla ilgili birçok sorun vardır.

1. Zikzak sinyali hedef olarak seçildiğinden, en basit değişkenlerden biri ondan tahmin edilebilir, örneğin, son 20 döngü için PRICE sıralaması, açıkça hedef tasarımdan, mover_price_20 = 1 olduğunda zikzak sinyali yukarı doğrudur ve mover_price_20 > 1 olduğunda zikzak sinyali yukarı doğrudur. Zikzaktan gelen sinyalin aşağı yönlü olma olasılığı %90'dan fazladır; bu türden birçok değişken oluşturulabilir, bu nedenle model tahmininde başarılı olmak kolaydır; ancak buradaki a priori koşullardan biri, bu noktanın zikzak noktası olduğunu bilmeniz gerektiğidir. Eğer zikzak noktası değil de zaman içinde başka noktalar söz konusuysa, yukarıdaki değişkenler tahmin kabiliyetinde mevcut değildir.

2. Dolayısıyla, uygularken büyük bir sorun olacaktır, çünkü zikzağın başlangıç noktasının ne olduğunu bilmiyorsunuz, bu nedenle tüm verileri hesaplamanız gerekiyor, bu sefer moverank_price_20 = 1 olduğunda, bunun zikzağın başlangıç noktası olduğunu düşünmeyin ve bu nedenle trendin arkasındaki noktanın yukarı olduğunu tahmin edemezsiniz.

3. Dolayısıyla zikzağın hedef belirleme yönteminin çalışması zordur.

 
Lütfen bana Windows altında oraya ne koyacağımı söyler misiniz? Eğer yapabilirseniz Rusça olarak, çünkü burada bir şeyler karışmış https://rattle.togaware.com/rattle-install-mswindows.html.
 

Makalede bir tablo var



01OrtalamaAzalmaDoğruluk OrtalamaAzalmaGini
MA_eur.5.dif142.9741.8554.86 321,86
EUR.dif337.2146.3851.80177.34
RSI_eur.1437.7040.1150.75254.61
EUR.dif2 24.6631.6438.24110.83
MA_eur.10.dif122.9425.3931.48193.08
CHF.dif3 22.9123.4230.1573.36
MA_chf.5.dif1 21.8123.2429.56135.34


Ancak rakamların kendi başlarına ne anlama geldiği hakkında hiçbir şey söylenmiyor, diğer rakamlarla ilişkileri anlaşılabilir - daha iyi - daha iyi, ancak değerlerin kendileri, ne olmalılar ve neye bağlılar? Burada makalede MeanDecreaseGini'nin maksimum değeri 321.86 ve bende 1876 var - bu tahmin edicilerin sayısına mı bağlı yoksa neye bağlı? Ve 140,22'lik bir MeanDecreaseAccuracy değerim var - bunu nasıl yorumlayabilirim? Belki de tüm değerleri en büyük değerin yüzdesine dönüştürmeliyim?

 
Aleksey Vyazmikin:

Makalede bir tablo var



01OrtalamaAzalmaDoğruluk OrtalamaAzalmaGini
MA_eur.5.dif142.9741.8554.86 321,86
EUR.dif337.2146.3851.80177.34
RSI_eur.1437.7040.1150.75254.61
EUR.dif2 24.6631.6438.24110.83
MA_eur.10.dif122.9425.3931.48193.08
CHF.dif3 22.9123.4230.1573.36
MA_chf.5.dif1 21.8123.2429.56135.34


Ancak rakamların kendi başlarına ne anlama geldiği hakkında hiçbir şey söylenmiyor, diğer rakamlarla ilişkileri anlaşılabilir - daha iyi daha iyidir, ancak değerlerin kendileri ne olmalı ve neye bağlılar? Burada makalede MeanDecreaseGini'nin maksimum değeri 321.86 ve bende 1876 var - bu tahmin edicilerin sayısına mı bağlı yoksa neye bağlı? Ve 140,22'lik bir MeanDecreaseAccuracy değerim var - bunu nasıl yorumlayabilirim? Belki de tüm değerleri en yüksek değerin yüzdesine dönüştürmeliyim?

Bu, hepsi birlikte randoForest olarak adlandırılan bir grup ağaç oluştururken tahmin edicileri kullanmanın dahili istatistiğidir. Farklı modelleri karşılaştırmak hiç mantıklı değil. Aynı model içinde bile karşılaştırma yapamadım. Tahmin edicileri seçmek istiyorsanız, başka araçlar kullanmanız gerekir. Makine öğrenimi başlığında birçok kez yazdım ve tek ben değilim.

 
СанСаныч Фоменко:

Bu, hepsi birlikte randoForest olarak adlandırılan bir grup ağaç oluştururken tahmin edicileri kullanmanın dahili istatistikleridir. Farklı modelleri karşılaştırmak hiç mantıklı değil. Aynı model içinde bile karşılaştırma yapamadım. Tahmin edicileri seçmek istiyorsanız, başka araçlar kullanmanız gerekir. Makine öğrenimi başlığında birçok kez yazdım ve tek ben değilim.

Anlıyorum, yani bir model içinde bir tahmin edici, ancak mutlak değil....

Belki, elbette, ve forumda yazdım, ama o hacim ile başa çıkmak için.... - Forumun yarısını okuyucum aracılığıyla okudum. Beni doğru yöne yönlendirebilirseniz minnettar olurum.

 
Aleksey Vyazmikin:

Anlıyorum, yani model içinde bir tahmincidir, ancak mutlak değildir....

Belki, elbette, ve foruma yazdım, ama o hacim başa çıkmak için... - Forumun yarısını okuyucum aracılığıyla okudum. Burnunuzu sokarsanız, minnettar olurum.

1. Kısa bir cevabım yok, çünkü bu, modelleme ile karşılaştırılabilecek veri inceleme adı verilen bütün bir endüstridir.

2. Veri inceleme sınıflandırma modelleri için standart şema aşağıdaki gibidir:

  • bir hedef değişken tanımlamak
  • BU hedef değişken için tahmin ediciler arayın.
  • Tahmin edicilerin tahmin gücünü belirleyin, yani tahmin edicinin bir kısmı bir sınıfı tahmin etmeli, diğer kısmı başka bir sınıfı tahmin etmelidir, örtüşme ne kadar küçükse tahmin ediciler o kadar iyidir
  • Tahmin edicilerin önemini belirlemek için paketleri alıyoruz. Bunlardan birçoğu var, dosyayı genel bir bakışla zincirliyorum

3. Modeli tercihen çapraz doğrulama ile dosyanın ilk yarısına sığdırın

4. Dosyanın ikinci yarısını kontrol edin. Sonuçlar eşleşmelidir


Tüm bunlar için çok sayıda DONE aracına ihtiyacınız var. En iyisi caret. İhtiyacınız olan her şeye sahiptir. Ama yeterli değil.


NOT.

Bu R. Bunun dışında, anlaşılmaz bebek gevezeliğinden öteye gidemezsiniz.

Dosyalar:
 
СанСаныч Фоменко:

1. Kısa bir cevabım yok çünkü bu, modelleme ile karşılaştırılabilecek veri inceleme adı verilen bir sektör.

2. Veri inceleme sınıflandırma modelleri için standart şema aşağıdaki gibidir:

  • bir hedef değişken tanımlayın
  • BU hedef değişken için tahmin ediciler bulun
  • Tahmin edicilerin tahmin gücünü belirleyin, yani tahmin edicinin bir kısmı bir sınıfı tahmin etmeli, diğer kısmı başka bir sınıfı tahmin etmelidir, örtüşme ne kadar küçükse tahmin ediciler o kadar iyidir
  • Tahmin edicilerin önemini belirlemek için paketleri alıyoruz. Bunlardan çok sayıda var, genel bir bakış içeren bir dosya ekliyorum

3. Tercihen çapraz doğrulama ile dosyanın ilk yarısına modelin uydurulması

4. Dosyanın ikinci yarısını kontrol edin. Sonuçlar eşleşmelidir


Tüm bunlar için çok sayıda DONE aracına ihtiyacınız var. En iyisi caret. İhtiyaç duyulan her şeye sahiptir. Ama yeterli değil.


PS.

Bu R. Bunun dışında, anlaşılmaz bebek gevezeliğinden öteye gidemezsin.

Teşekkürler, aramaya devam edeceğim!

 
RStudio'yu kurdum, Boruta paketini indirdim , ancak nasıl etkinleştirebilirim, onunla nasıl çalışabilirim?
 
Aleksey Vyazmikin:
RStudio'yu kurdum, Boruta paketini indirdim , ancak nasıl etkinleştirebilirim, onunla nasıl çalışabilirim?

Her zaman tüm paketler için belgeleri okuyun. RStudio'da Paketler sekmesini açın, aramaya paket adını yazın ve açılan paket adına tıklayın, Yardım açılacaktır. Ya da burada paket adına göre daha iyi, ilgili materyallere bağlantılar olabilir.

İdeoloji ile ilgileniyorsanız, pakete dahil olan fonksiyonlarda teorik bir makaleye bağlantı bulacaksınız.

CRAN Packages By Name
  • cran.r-project.org
The package will formally test two curves represented by discrete data sets to be statistically equal or not when the errors of the two curves were assumed either equal or not using the tube formula to calculate the tail probabilities
 
СанСаныч Фоменко:

Her zaman tüm paketler için belgeleri okuyun. RStudio'da Paketler sekmesini açın, aramaya paket adını yazın ve açılan paket adına tıklayın, Yardım açılacaktır. Ya da daha iyisi, buraya paketin adına tıklayın, ilgili materyallere bağlantılar olabilir.

Eğer ideoloji ilginçse, pakete dahil olan fonksiyonlarda teorik makaleye bir bağlantı olacaktır.

Teşekkürler!

Bu yüzden pdf'yi açıklamayla birlikte açtım ve burada ayarlar şaşkına döndü - o kadar çok şey gerekiyor ki yarısının ne anlama geldiğini bilmiyorum.

Daha basit, daha az güvenilir olsa bile ve tercihen GUI ile bir şey var mı?

Genel olarak, bu konuda nerede ve nasıl yapılacağına dair ayrıntılar içeren makaleler hazırlamanız çok faydalı olacaktır!