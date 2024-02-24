Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2749

elibrarius #:

Vladimir'in makalelerinde de %10-20 civarında bir hata var, ancak denge çizgisi cesaret verici değil.

Bu aynı zamanda.... eğitimin "a-post" yorumuna da bağlı olabilir.

 
Maxim Dmitrievsky #:

önceki gönderiye eklendi

#299

Birisi videoyu yayınladığım gönderilerimi silmiş... bunun nasıl olabileceğini bilmiyorum.

mytarmailS #:

Birisi videoyu yayınladığım gönderilerimi silmiş... bunun nasıl olabileceğini bilmiyorum.

Vay, vay, vay, sanırım çok fazla gösteriş yapıyorsun.

İşte ahşap modelleme üzerine bir tane.

#4469

#4467

Catbusters araması hakkında mı? 😄 konuyu kim başlattı

Maxim Dmitrievsky #:

Vay, vay, vay, çok fazla gösteriş yapıyor olmalısın.

İşte ahşap modelleme

#4469

#4467

Catbusters araması hakkında mı? 😄 konuyu kim başlattı

Bakın, ahşap bir tartışma konusu değil... Savunma Bakanlığı eğitimlerinin yüzde 95'i ahşapla başlar, yeni başlayan birinin ilk öğreneceği şey odundur, bundan siz sorumlu değilsiniz.

mytarmailS #:

Bakın, ahşap bir tartışma konusu değil... MoD eğitimlerinin %95'i ahşapla başlar, yeni başlayanlar ilk olarak bunu öğrenir, bu sizin hatanız değil.

Daha önce burada çoğunlukla NS vardı, neden ağaçlar olmasın diye merak ettim. Testler yaptım, daha kötü olmadıkları ortaya çıktı. Daha önce burada böyle bir bilgi görmemiştim, yoksa bu soruyu sormazdım.

Sonra bousting'e geçtim, katbust lib'i buldum ve burada kopyalamaya başladım

 
Maxim Dmitrievsky #:

Daha önce burada tartışılan çoğunlukla NS'lerdi, neden ağaçlar değil diye merak ettim. Testler yaptım ve daha kötü olmadıkları ortaya çıktı. Daha önce burada böyle bir bilgi görmedim, aksi takdirde bu soruyu sormazdım.

ve bu arada ağaçlar, kümeleme ve fs'ye değerli bir alternatif olarak hizmet edebilir - "2'si bir arada".

Maxim Dmitrievsky #:

Sonra bousting'e geçtim, katbust kütüphanesini buldum ve burada kopyalamaya başladım

algoritma hakkında: matematiksel olarak başka bir 2. türev verir (veya artıkların ortalaması - istatistiksel olarak) -- AMA eğitimde kişisel olarak size nasıl yardımcı olur ve hangi durumlarda?... reklamlardaki standart klişelerin yanı sıra "catboost daha iyi ve daha doğru sonuçlar verecektir".... çünkü nokta hassasiyeti her zaman önemli değildir, bazen modelin üretim yeteneği daha önemli olabilir.
JeeyCi #:

ve ağaçlar, bu arada, kümeleme ve fs'ye değerli bir alternatif olarak hizmet edebilir.

algoritma hakkında: matematiksel olarak başka bir 2. türev verir (veya artıkların ortalaması - istatistiksel olarak) -- AMA eğitimde nasıl yardımcı olur ve hangi durumlarda?... reklamlardaki standart klişelerin yanı sıra "catboost daha iyi ve daha doğru sonuçlar verecektir".... çünkü her yerde nokta hassasiyeti önemli değildir, bazen modelin üretken yeteneği daha önemli olabilir?

Nedensel çıkarım için ahşap modeller de var, henüz çözmeye zamanım olmadı

Boosting önyargı ve varyansı azaltırken, Forest sadece varyansı azaltıyor sanırım. Kanıtlanmış avantajlarla ilgili, google'da arayabilirsiniz. Ve kütüphanenin kendisi geliştirilmiştir, onunla çalışmak uygundur.

Üretken olanlar hakkında tam olarak net değil, belki bazen daha önemlidirler. Ancak NS jeneratif olanlar Forex'te iyi çalışmıyor, eğer sentetik veri üretmekten bahsediyorsak.

Forest Based Estimators — econml 0.13.1 documentation
  • econml.azurewebsites.net
Orthogonal Random Forests are a combination of causal forests and double machine learning that allow for controlling for a high-dimensional set of confounders , while at the same time estimating non-parametrically the heterogeneous treatment effect , on a lower dimensional set of variables . Moreover, the estimates are asymptotically normal and...
 
Maxim Dmitrievsky #:

Eğer sentetik veri üretmekten bahsediyorsak.

hayır - bu genelleme yapmakla ilgili... Evet, yanlış, ifade et.... özür dilerim.

Bence risk açık/risk kapalı ortamını ayırt etmek için -- hala bu ayrımı nasıl genelleştireceğimi düşünüyorum... hepsi kendi düşüncelerim (kazara forumda)...

cevap için teşekkürler!

JeeyCi #:

hayır - bu genelleme yapmakla ilgili..... evet, yanlış, açık.... üzgünüm

Sanırım riskli/riskten uzak ortamı ayırt etmek için - hala bu ayrımı nasıl genelleştireceğimi düşünüyorum... hepsi kendi düşüncelerim (kazara forumda)...

Cevap için teşekkürler!

deneyin, catbusta'nın bir sürü farklı özelliği var, ben beğendim.

Eğitim öncesi doğrulama örneğindeki hataya dayalı erken bir durdurma var. Genelleme NS'den daha kötü değil, buna ek olarak öğrenmeyi durdurmak için kendi fonksiyonlarını yazmak zorundalar.

Ve hızlı öğreniyor, saatlerce beklemenize gerek yok.

 
rastgele orman bir veri dizisindeki maksimum değeri bulabilir mi, yani mach() işlevini simüle edebilir mi?

Sadece MO'nun JA'daki ilkel fonksiyonları simüle edip edemeyeceğini merak ediyorum

bir matris vardır, matrisin her satırı bir eğitim örneğidir.

head(X)
     [,1] [,2] [,3] [,4] [,5]
[1,]    2    4    1    3    1
[2,]    3    1    4    5    3
[3,]    1    2    4    4    1
[4,]    1    1    5    3    5
[5,]    3    4    1    3    3
[6,]    4    4    5    1    2

her satırın maksimumunu bulmamız gerekiyor, örneklem boyutu 20k satır.


regresyon yoluyla problem çözme

 pred actual
1  4.967619      5
2  4.996474      5
3  4.127626      4
4  4.887233      5
5  5.000000      5
6  4.881568      5
7  4.028334      4
8  4.992406      5
9  3.974674      4
10 4.899804      5
11 4.992406      5

netlik için yuvarlatılmış

 pred actual
1     5      5
2     5      5
3     4      4
4     5      5
5     5      5
6     5      5
7     4      4
8     5      5
9     4      4
10    5      5
11    5      5

oldukça iyi, 50 yeni satırdan oluşan testte sadece birkaç hata var


Ancak X matrisindeki veriler çok basit, sadece 1'den 5'e kadar 5 benzersiz değer ve sadece 5 sütun, ancak zaten hatalar var.

Yine de sınıflandırma yaparsak hata olmayacağını düşünüyorum, bu arada kontrol edebilirsiniz.

Evet, öyle ama eğer verilerde maksimum değeri arıyorsak o zaman sınıflandırma uygun değildir çünkü değerlerin dağılımı çok büyük olabilir....

Öyleyse regresyona geri dönelim ve verileri karmaşıklaştıralım.

head(X)
      [,1]  [,2]  [,3]  [,4]  [,5]
[1,]  0.93 -2.37 -0.35  0.16 -0.11
[2,] -0.53  0.19 -0.42  1.35 -0.16
[3,]  1.81  0.19 -0.68  0.31 -0.05
[4,]  0.08 -1.43  0.15 -0.96  0.43
[5,]  0.40  1.36  1.17 -0.99 -0.18
[6,] -2.19 -0.65  0.42 -1.12  1.46

bu sonucu elde ederiz.

  pred actual
1   1.75   1.78
2   1.33   1.31
3   1.67   1.69
4   1.15   1.16
5   0.51   0.41
6   1.00   0.99
7   0.80   0.78
8   1.75   1.76
9   0.35   0.36
10  1.78   1.79
11  2.02   2.13
12  1.26   1.21
13  1.60   1.57
14  0.19   0.06

Prensip olarak fena değildir, ancak normal mach() işlevi bunu daha iyi yapar ve tüm bu modelin yerini alabilir....

Bu arada, diğer modellerin nasıl çalışacağını, mach() işlevini hatasız oluşturup oluşturamayacaklarını merak ediyorum

