"Veri Bilimi ve Makine Öğrenimi (Bölüm 05): Karar Ağaçları" makalesi için tartışma

 

Yeni makale Veri Bilimi ve Makine Öğrenimi (Bölüm 05): Karar Ağaçları yayınlandı:

Karar ağaçları, insanların düşünme şeklini taklit ederek verileri sınıflandırır. Bu makalede, karar ağaçlarını nasıl oluşturacağımızı ve onları verileri sınıflandırmak ve öngörmek için nasıl kullanacağımızı göreceğiz. Karar ağacı algoritmasının temel amacı, heterojen verilerden homojen veya homojene yakın verileri ayırmaktır.

Karar ağaçları, bir düğümü iki veya daha fazla alt düğüme bölmeye karar vermek amacıyla birden fazla algoritma kullanır. Alt düğümlerin oluşturulması, ortaya çıkan alt düğümlerin homojenliğini artırır. Yani düğümün homojenliğinin (saflığının) hedef değişkenle ilişkili olarak arttığını söyleyebiliriz. Karar ağacı algoritması, düğümleri tüm mevcut değişkenlere böler ve ardından en homojen alt düğümlerle sonuçlanan bölümü seçer.

Karar ağacı örneği

Algoritma seçimi, hedef değişkenlerin türüne bağlıdır.

Karar ağacında kullanılan algoritmalar şunlardır:

  1. ID3: Yinelemeli bölücü 3 (Iterative Dichotomiser 3, ID3), D3'ün devamıdır
  2. C4.5: ID3'ün devamıdır
  3. CART: Sınıflandırma ve regresyon ağacı (Classification And Regression Tree, CART)
  4. CHAID: Ki-kare otomatik etkileşim tespiti (CHi-square Automatic Interaction Detection, CHAID), karar ağacını hesaplarken çok seviyeli bölmeler gerçekleştirir
  5. MARS: Çok değişkenli uyarlanabilir regresyon splineları (Multivariate Adaptive Regression Splines, MARS)

Bu makalede ID3 algoritmasına dayalı bir karar ağacı oluşturacağız, diğer algoritmaları bu serinin sonraki makalelerinde tartışıp kullanacağız.

Yazar: Omega J Msigwa

 

Merhaba Bay Omega,

ID3 çözümü için çok teşekkür ederim. benim için çok faydalı oldu. Bununla birlikte, bu konuda bir excel sayfası sağladım ve ekledim, açıklamalarınız için net olduğunu düşünüyorum.

Tekrar çok teşekkürler,

F.Mahmoudian

Dosyalar:
 
Fatemeh Haji Mahmoudian #:

Merhaba Bay Omega,

ID3 çözümü için çok teşekkür ederim. benim için çok faydalı oldu. Bununla birlikte, bu konuda bir excel sayfası sağladım ve ekledim, açıklamalarınız için net olduğunu düşünüyorum.

Tekrar çok teşekkürler,

F.Mahmoudian

çok teşekkürler, hala betiğin ağacı kendisinin çizmesine nasıl izin vereceğimi bulmaya çalışıyorum

 
Omega J Msigwa #:

many thanks to it, I'm still trying to figure out how to let the script draw the tree itself

Bu harika olurdu!

Çok teşekkür ederim.

 

Ve bu arada, evet, neden herkes MO, AI ve DeepLearning'e bu kadar takmış durumda? Konuyu başlatan kişinin hatırlattığı, unutulmuş eski bir şey var. Uzman sistemler ve her türlü ağırlıklı değerlendirmeler var. Elbette yöntemler 30-50 yıllık, moda değil ama fiziksel modele ve neden-sonuç ilişkilerine sadık kalıyorlar ve sonuçları yorumlanabilir. ORAYA GIRMEM LAZIM.

Zaten hesaplanmış sinyaller için potansiyel olarak bir filtre olabilecek tek şey bu. Bu yöndeki diğer yöntemler berbat.

[Silindi]  
Maxim Kuznetsov #:

Ve bu arada, evet, neden herkes MO, AI ve DeepLearning'e bu kadar takmış durumda? Konuyu başlatan kişinin bize hatırlattığı, unutulmuş eski bir şey var. Uzman sistemler ve her türlü ağırlıklı değerlendirmeler var. Elbette yöntemler 30-50 yıllık, moda değil ama fiziksel modele ve neden-sonuç ilişkilerine sadık kalıyorlar ve sonuçları yorumlanabilir. ORAYA BAKMAM GEREKECEK.

Zaten hesaplanmış sinyaller için potansiyel olarak filtre olabilecek tek şey bu. Bu yöndeki diğer yöntemler berbattır.

Aslında bu temel bir algoritmadır, daha karmaşık ağaç tabanlı bir algoritmanın parçasıdır) ve en çok yeniden eğitilmiş olanıdır.