記事「データサイエンスと機械学習(第05回):決定木」についてのディスカッション

 

新しい記事「データサイエンスと機械学習(第05回):決定木」はパブリッシュされました:

決定木は、人間の思考方法を模倣してデータを分類します。木を作り、それを使ってデータを分類・予測する方法を見てみましょう。決定木アルゴリズムの主な目的は、不純物を含むデータを純粋なノードまたはそれに近いノードに分離することです。

す。決定木アルゴリズムは、利用可能なすべての変数でノードを分割し、最も均質なサブノードになる分割を選択します。

決定木の例

アルゴリズムの選択は、目的変数の種類に基づきます。

次は、決定木で使用されるアルゴリズムです。

  1. ID3 > D3の拡張
  2. C4.5 > ID3の後継
  3. CART > 分類と回帰木
  4. CHAID > カイ二乗自動相互作用検出、分類木を計算する際に多段階の分割を実行
  5. MARS > 多変量適応回帰スプライン

今回は、ID3アルゴリズムに基づいて決定木を作成します。他のアルゴリズムについては、本連載の次回の記事で説明し、使用する予定です。

作者: Omega J Msigwa