Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 486

 
Kimsenin nasıl saydığını bilmiyorum, tahmin edilmeyen seçeneklerin yüzdesini sayıyorum.
örneğin, bu seçeneğe göre, 600'ü artıda (tahmin edildi), 400'ü ekside çalıştı (tahmin etmedi) olmak üzere 1000 girdi vardı. ve dolayısıyla hata, tüm seçeneklerle ilgili olarak tahmin edilmeyen seçeneklerin sayısıdır, bu örnekte hata = 400/1000 = 0,4

Samimi olarak.
 
Andrey Kisselev :
Kimsenin nasıl saydığını bilmiyorum, tahmin edilmeyen seçeneklerin yüzdesini sayıyorum.
örneğin, bu seçeneğe göre, 600'ü artıda (tahmin edildi), 400'ü ekside çalıştı (tahmin etmedi) olmak üzere 1000 girdi vardı. ve dolayısıyla hata, tüm seçeneklerle ilgili olarak tahmin edilmeyen seçeneklerin sayısıdır, bu örnekte hata = 400/1000 = 0,4

Samimi olarak.

Burada, anladığım kadarıyla, bunu kaldırırsanız, son hata, herhangi bir nedenle giriş sayısıyla çarpılan örnek sayısına bölünür:

 return (result/(npoints*df.m_nclasses));

tekrar çarparsanız gayet anlaşılır bir sonuç çıkacaktır mesela 0.5578064232767638 :)


 
Maksim Dmitrievski :

Burada, anladığım kadarıyla, bunu kaldırırsanız, son hata, herhangi bir nedenle giriş sayısıyla çarpılan örnek sayısına bölünür:

geriye doğru çarparsanız gayet anlaşılır bir sonuç çıkacaktır mesela 0.5578064232767638 :)


büyük olasılıkla
 return (result/( npoints *df.m_nclasses));
_Point(points) türünden tahmin edilen noktalar anlamına gelir ... veya tam tersi.

Samimi olarak.
 
Andrey Kisselev :
büyük olasılıkla
_Point(points) türünden tahmin edilen noktalar anlamına gelir ... veya tam tersi.

Samimi olarak.

hayır, burada npoints, giriş vektörünün uzunluğu anlamına gelir :)

ve nclasses çıktıların sayısıdır, nasıl olsa bile

 //+------------------------------------------------------------------+
//| This subroutine builds random decision forest.                   |
//| INPUT PARAMETERS:                                                |
//|     XY          -   training set                                 |
//|     NPoints     -   training set size, NPoints>=1                 |
//|     NVars       -   number of independent variables, NVars>=1    |
//|     NClasses    -   task type:                                    |
//|                     * NClasses=1 - regression task with one      |
//|                                    dependent variable            |
//|                     * NClasses>1 - classification task with      |
//|                                    NClasses classes.             |
//|     NTrees      -   number of trees in a forest, NTrees>=1.      |
//|                     recommended values: 50-100.                  |
//|     R           -   percent of a training set used to build      |
//|                     individual trees. 0<R<=1.                    |
//|                     recommended values: 0.1 <= R <= 0.66.        |
//| OUTPUT PARAMETERS:                                               |
//|     Info        -   return code:                                 |
//|                     * -2, if there is a point with class number  |
//|                           outside of [0..NClasses-1].            |
//|                     * -1, if incorrect parameters was passed     |
//|                           (NPoints<1, NVars<1, NClasses<1,       |
//|                           NTrees<1, R<=0 or R>1).                |
//|                     *  1, if task has been solved                |
//|     DF          -   model built                                  |
//|     Rep         -   training report, contains error on a training|
//|                     set and out-of-bag estimates of              |
//|                     generalization error.                        |
//+------------------------------------------------------------------+
static void CDForest::DFBuildRandomDecisionForest(CMatrixDouble &xy,
                                                   const int npoints,
                                                   const int nvars,
                                                   const int nclasses,
                                                   const int ntrees,
                                                   const double r, int &info,
                                                  CDecisionForest &df,
                                                  CDFReport &rep)

Onlar. son hata, eğitim örneğinin uzunluğu ile çıktı sayısı ile çarpılmalıdır (1 ise, çıktıları atlarız)

biri için yararlı mb

Umarım bir şeyi karıştırmadım ve doğru yaptım :) en azından hataların anlamları anlaşılır oldu
 
Maksim Dmitrievski :

hayır, burada npoints, giriş vektörünün uzunluğu anlamına gelir :)

o zaman rezult'un ne olduğuna bakmanız gerekir, çünkü bölen giriş parametreleridir.

Samimi olarak.
 
Andrey Kisselev :
o zaman rezult'un ne olduğuna bakmanız gerekir, çünkü bölen giriş parametreleridir.

Samimi olarak.

kısacası, bu tüm örnekler üzerinde sadece ortalama bir hatadır, ama ne gerek var .. rezult sadece toplam hatayı döndürür ve ardından örnekteki örnek sayısına bölünür (bu kaldırılabilir)

 
Maksim Dmitrievski :

kısacası, bu sadece tüm örneklerde ortalama bir hata, ama ne gerek var .. rezult sadece toplam hatayı döndürür ve ardından örnekteki örnek sayısına bölünür

bu yüzden bir bölenle çarparak yaptığınız normal durumuna döndürülmesi gerekiyor.

Т.е. итоговую ошибку нужно домножить на длину обучающей выборки умноженную на кол-во выходов (если 1 то выходы опускаем)



Samimi olarak.

 
Andrey Kisselev :

bu yüzden bir bölenle çarparak yaptığınız normal durumuna döndürülmesi gerekiyor.



Samimi olarak.


Bir şeyi değiştirdiğinizde ve sonra bir çocuk gibi sevindiğinizde o duygu :)

 
Maksim Dmitrievski :

Bir şeyi değiştirdiğinizde ve sonra bir çocuk gibi sevindiğinizde o duygu :)

dolaba bak ve vazodan şekeri al.

Samimi olarak.
 
Maksim Dmitrievski :

Teoride, rastgele ormanlarda küçük bir hata olmalıdır, çünkü karar ağaçlarında oluşturulduklarında, tüm değişkenler kullanılır ve sinir ağlarında olduğu gibi bellek kullanımında - nöronların sayısında - herhangi bir kısıtlama yoktur. Burada, seviyeyi sınırlama, ağaçları budama veya torbalama gibi sonucu "bulanıklaştırmak" için yalnızca bireysel işlemleri kullanabilirsiniz. Alglib'in MQ uygulamasında kırpma, torbalama olup olmadığını bilmiyorum

//      R           -   percent of a training set used to build      |
//|                     individual trees. 0<R<=1.                    |
//|                     recommended values: 0.1 <= R <= 0.66.  

bu değişken 1'den küçük yapılırsa hata artmalıdır.

Neden: