Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3339

 
СанСаныч Фоменко #:

Sadece başlıkları okuma alışkanlığından vazgeçin: kitap bir Twitter gönderisi değildir.

Kitabın yarısından fazlasını okudum, bu nedenle içeriği kendim değerlendirebilirim; %80'i kod olan bölümler var.

Kitapta kod yazarken kullanılan paketlerin bir listesi burada.

İçeriği açısından kitap, "makine öğrenimi" olarak adlandırılan şeyin problemlerinin ve çözümlerinin sistematik bir sunumudur, bu sitede "makine öğrenimi" genellikle sadece bir model olarak anlaşıldığı için çok yararlıdır.

Evet. İyi bir kitap.

Yarısını okuduğunuza göre.

Muhtemelen bir satır kod yazabilirsin.

En çok aklınızda kalan?

P.Z.

Herkese kitabı incelemesini tavsiye ederim.

 
Maxim Dmitrievsky #:
i̇stati̇sti̇ksel öğrenme

kozul kendi reklamını yapıyor, eski pantolonun üzerine yeni bir etiket yapıştırıyor.

Maxim Dmitrievsky #:
Yeniden örnekleme ve cv'den sonra istatistiksel çıktı nerede? Ve nihai sınıflandırıcının inşası. Bu konuyu ele alın ve geliştirin. Kozul'un temeli budur.

Verimli Modeller Oluşturma, çoklu modellerin karşılaştırılması ve yeniden örnekleme için Tuls. Sırada istatistiksel çıkarım ve yansız model oluşturma gibi bir şey olmalı.

İstatistiksel çıkarıma ihtiyacımız var. Aynı RL ve diğer yöntemlerle karşılaştırıldığında bazı sonuçlar verir.

R'de arama: istatistiksel öğrenme, zayıf denetimli öğrenme, işlevsel artırma öğrenmesi.

Kozul haksız reklamdır, eski pantolonun üzerine yeni bir etiket yapıştırmaktır.

Etkili modeller oluşturmak, çoklu modelleri yeniden örnekleme ile karşılaştırmak için Tuls. Sırada istatistiksel çıkarım ve yansız model oluşturma gibi bir şey olmalı.

Bu, makine öğreniminin standardıdır ve kitabın çoğu, uzun yıllara dayanan ve birçok aracın icat edildiği bu konularla ilgilenmektedir. Kitabın 3. Bölümünün adı: Etkili Modeller Oluşturma Araçları olup aşağıdaki içeriğe sahiptir:

- 10 Performans değerlendirmesi için yeniden örnekleme

- 11 Yeniden örnekleme ile modellerin karşılaştırılması

- 12 Model ayarlama ve aşırı uyumun tehlikeleri

- 13 Izgara araması

- 14 Yinelemeli arama

- 15 Birden fazla model görüntüleme

Buna ek olarak,nihai modelin nasıl oluşturulacağını anlatan 20. bölüm"Model Toplulukları" da bulunmaktadır.

İstatistiksel öğrenmeye ihtiyacımız var.

İhtiyacınız var mı? Lütfen: CRAN Görev Görünümü: Makine Öğrenimi ve İstatistiksel Öğrenme

10 Resampling for Evaluating Performance | Tidy Modeling with R
10 Resampling for Evaluating Performance | Tidy Modeling with R
  • Max Kuhn and Julia Silge
  • www.tmwr.org
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
 
Topluluklar zaten kozul'a daha yakın, en azından artan varyansla önyargıyı eşitleyebilirsiniz.

Ancak tahminlerde hala çok fazla gürültünüz olacak (çünkü varyans daha büyük), bununla ne yapacaksınız? Yani, TS traine üzerinde bile, diyelim ki, karlı işlemlerin sadece% 60'ına sahip olacaktır. Ve testte aynı veya daha az.

Evet, bu gürültüyü düzeltmek için stake etmeye başlayacaksınız... peki, deneyin.
 
Maxim Dmitrievsky #:
Bu yeni başlayanlar için ipuçları, bir kozul ve düşünme yeteneğine ihtiyacınız var

İşte, istatistik ofisine gidin, ön masayı doldurmayın.

Bu kitaba göre son modelin nasıl inşa edileceğine dair bir tez alabilir miyim? Telefonumdan bakıyorum, şu anda bakamam.

Birden fazla tek öğrenicinin tahminlerinin tek bir tahmin yapmak için toplandığı bir model topluluğu, yüksek performanslı bir nihai model üretebilir. Topluluk modelleri oluşturmak için en popüler yöntemler torbalama(Breiman 1996a), rastgele orman ( Ho 1995;Breiman 2001a) ve güçlendirme ( Freund ve Schapire 1997) yöntemleridir. Bu yöntemlerin her biri, aynı model türünün (örneğin sınıflandırma ağaçları) birden fazla versiyonundan elde edilen tahminleri birleştirir. Ancak, topluluk oluşturmaya yönelik en eski yöntemlerden birimodel istiflemedir(Wolpert 1992;Breiman 1996b).

Model istifleme, herhangi bir türdeki birden fazla modelin tahminlerini birleştirir. Örneğin, bir lojistik regresyon, sınıflandırma ağacı ve destek vektör makinesi bir istifleme topluluğuna dahil edilebilir.

Bu bölümdestacks paketi kullanılarak tahmin modellerinin nasıl yığılacağı gösterilmektedir. Beton karışımlarının basınç dayanımını tahmin etmek için birden fazla modelin değerlendirildiği Bölüm15'teki sonuçları yeniden kullanacağız.

Yığınlanmış bir topluluk oluşturma süreci şu şekildedir:

  1. Bekletilen tahminlerin eğitim setini bir araya getirin (yeniden örnekleme yoluyla üretilir).
  2. Bu tahminleri harmanlamak için bir model oluşturun.
  3. Topluluğun her bir üyesi için, modeli orijinal eğitim setine uydurun.


20.5 BÖLÜM ÖZETİ

Bu bölümde, daha iyi tahmin performansı için farklı modellerin bir toplulukta nasıl birleştirileceği gösterilmiştir. Topluluğu oluşturma süreci, performansı artıran küçük bir alt küme bulmak için aday modelleri otomatik olarak eleyebilir.Stacks paketi , yeniden örnekleme ve ayarlama sonuçlarını bir meta-modelde birleştirmek için akıcı bir arayüze sahiptir.



Bu, yazarın soruna bakış açısıdır, ancak birden fazla modeli birleştirmenin tek yolu bu değildir - R'de modelleri birleştirmek için yığın paketleri vardır. Örneğin, caretEnsemble: Caret Modelleri Toplulukları

20 Ensembles of Models | Tidy Modeling with R
20 Ensembles of Models | Tidy Modeling with R
  • Max Kuhn and Julia Silge
  • www.tmwr.org
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
 
Topluluk ve istiflemeye, yani sınıflandırıcılar üzerinde bousting yapmaya ihtiyacımız var. Topluluk önyargıyı, istifleme ise varyansı ortadan kaldırır. Teoride işe yarayabilir, pratikte bunu yapmadım. Ve üretimde hoş olmayan çok sayıda model olacaktır.

Çünkü üretime geçtiğinizde çok sayıda modelle baş başa kalırsınız. Ve siz bir ya da iki tane istersiniz.

Ayrıca her zaman piyasada olmanız gerekmediği sorununu da çözmez. Model her zaman çekiçleniyor olacak. Bu, diyelim ki, nüanslar nedeniyle, geliştirmeden uygulamaya kadar tüm döngü bozulur.
Testçi yavaş test edecek, her şey yavaş olacak, pamuk ipliğine bağlı olacak.
 
Ayrıca kitapta topluluk ve istifleme arasında bir karışıklık var gibi görünüyor. Kısacası, bu normal bir yaklaşım, ancak üretimde tuhaf olabilir. Ve bir yığın paket gerektirmez.

Ayrıca en önemli biçimlendirme sorununu da çözmüyor.
 
Vladimir'in makalesine verilen son bağlantı gibi. Bu, en tuhaf TC yaratımına bir örnektir. Çok fazla çalışma, dönüşüm yaptığınızda ve çıktı, hiçbir şey yapmadan rastgele kaba kuvvetle elde edebileceğiniz bir model olduğunda. İlginç ama verimsiz.
 
Maxim Dmitrievsky #:
her şey yavaş olacak, pamuk.
Maxim Dmitrievsky #:
Ayrıca kitabın topluluk ve istiflemeyi karıştırdığı görülüyor. Kısacası bu normal bir yaklaşım ama üretimde pamuk ipliğine bağlı olabilir.
Maxim Dmitrievsky #:
Geçenlerde Vladimir'in makalesine bir bağlantı verdiğiniz gibi. En tuhaf TC yaratımına bir örnek.

Ne tür bir pamukluk?

 
Forester #:

Bu pamuksuluk da ne?

Yavaş ile eşanlamlı.
 

Kozul'a, istatistiksel öğrenmeye ve güvenilir yapay zekaya geri dönmemizi öneriyorum.

P.Z.

Bunun ince detaylarını çözün.

Neden: