記事「データサイエンスと機械学習(第05回):決定木」についてのディスカッション

 

新しい記事「データサイエンスと機械学習(第05回):決定木」はパブリッシュされました:

決定木は、人間の思考方法を模倣してデータを分類します。木を作り、それを使ってデータを分類・予測する方法を見てみましょう。決定木アルゴリズムの主な目的は、不純物を含むデータを純粋なノードまたはそれに近いノードに分離することです。

す。決定木アルゴリズムは、利用可能なすべての変数でノードを分割し、最も均質なサブノードになる分割を選択します。

決定木の例

アルゴリズムの選択は、目的変数の種類に基づきます。

次は、決定木で使用されるアルゴリズムです。

  1. ID3 > D3の拡張
  2. C4.5 > ID3の後継
  3. CART > 分類と回帰木
  4. CHAID > カイ二乗自動相互作用検出、分類木を計算する際に多段階の分割を実行
  5. MARS > 多変量適応回帰スプライン

今回は、ID3アルゴリズムに基づいて決定木を作成します。他のアルゴリズムについては、本連載の次回の記事で説明し、使用する予定です。

作者: Omega J Msigwa

 

こんにちは、オメガさん、

ID3ソリューション、ありがとうございます。しかし、私はこの点に関して、あなたの説明のために明確であると思うエクセルシートを提供し、添付しました。

ありがとうございました、

F.Mahmoudian

ファイル:
 
Fatemeh Haji Mahmoudian #:

オメガさん、こんにちは、

ID3ソリューション、ありがとうございます。しかし、私はこの点に関して、あなたの説明のために明確であると思うエクセルシートを提供し、添付しました。

ありがとうございました、

F.Mahmoudian

スクリプトにツリーそのものを描画させる方法をまだ考えているところです。

 
Omega J Msigwa #:

many thanks to it, I'm still trying to figure out how to let the script draw the tree itself

それは素晴らしいことだ!

本当にありがとう

 

ところで、そうだ、なぜみんなMOやAIやDeepLearningに夢中なのだろう?トピ主が思い出させてくれた、忘れ去られた古いものがある。エキスパートシステムとか、いろいろな重み付け評価がある。もちろん、その手法は30~50年前のもので、流行のものではないが、物理モデルと因果関係にこだわっており、その結果は解釈可能だ。私はそこを掘り下げなければならない。

すでに計算された信号のフィルターになる可能性があるのは、この方法だけだ。この方向の他の方法はダメだ。

削除済み  
Maxim Kuznetsov #:

ところで、そうだ、なぜみんなMOやAIやDeepLearningに夢中なのだろう?トピ主が思い出させてくれた、忘れ去られた古いものがある。エキスパートシステムとか、いろいろな重み付け評価がある。もちろん、その手法は30~50年前のもので、流行のものではないが、物理モデルと因果関係にこだわっており、その結果は解釈可能だ。もっと詳しく調べてみる必要がありそうだ。

すでに計算された信号のフィルターになる可能性があるのは、この方法だけだ。この方向の他の方法はめちゃくちゃだ。

実際、これは基本的なアルゴリズムであり、より複雑なツリーベースの一部である。