Discussion de l'article "Data Science des Données et Apprentissage Automatique (Machine Learning) (partie 5) : Arbres de Décision"

 

Un nouvel article Data Science des Données et Apprentissage Automatique (Machine Learning) (partie 5) : Arbres de Décision a été publié :

Les Arbres de Décision imitent la façon dont les humains pensent pour classer les données. Voyons comment construire des arbres et comment les utiliser pour classer et prédire certaines données. L'objectif principal de l'algorithme des arbres de décision est de séparer les données contenant des impuretés en nœuds purs ou proches.

Les Arbres de Décision utilisent plusieurs algorithmes pour décider de diviser un nœud en deux ou plusieurs sous-ensembles de nœuds. La création de sous-nœuds augmente l'homogénéité des sous-nœuds résultants. En d'autres termes, nous pouvons dire que la pureté du nœud augmente, en ce qui concerne la variable cible. L'algorithme d’un arbre de décision divise les nœuds en fonction de toutes les variables disponibles et sélectionne ensuite la division qui donne les sous-nœuds les plus homogènes.

exemple d'un arbre de décision

La sélection de l'algorithme est basée sur le type des variables cibles.

Les algorithmes utilisés dans les arbres de décision sont les suivants :

  1. ID3 > Extension de D3
  2. C4.5 > Successeur de ID3
  3. CART > Arbre de Classification et de Régression
  4. CHAID > Chi-square Automatic Interaction Detection (Détection Automatique des Interactions Chi-carré), effectue des divisions à plusieurs niveaux lors du calcul des arbres de classification.
  5. MARS > Splines de Régression Adaptatives Multivariées

Dans cet article, je vais créer un arbre de décision basé sur l'algorithme ID3. Nous discuterons et utiliserons des autres algorithmes dans les prochains articles de cette série.

Auteur : Omega J Msigwa

 

Bonjour M. Omega,

Merci beaucoup pour la solution ID3, elle m'est très utile. Cependant, j'ai fourni et joint une feuille excel à cet égard, qui, je pense, est claire pour vos explications.

Merci encore,

F.Mahmoudian

Dossiers :
 
Fatemeh Haji Mahmoudian #:

Bonjour Monsieur Omega,

Merci beaucoup pour la solution ID3, elle m'est très utile. Cependant j'ai fourni et joint une feuille excel à cet égard, qui je pense est claire pour vos explications.

Merci encore,

F.Mahmoudian

Merci beaucoup, j'essaie toujours de comprendre comment laisser le script dessiner l'arbre lui-même.

 
Omega J Msigwa #:

many thanks to it, I'm still trying to figure out how to let the script draw the tree itself

Ce serait formidable !

Merci beaucoup pour votre aide.

 

Et au fait, oui, pourquoi tout le monde est si obsédé par la MO, l'IA et le DeepLearning ? Il y a une vieille chose bien oubliée, que l'amorce d'actualité nous a rappelée. Il existe des systèmes experts et toutes sortes d'évaluations pondérées. Bien sûr, les méthodes sont vieilles de 30 à 50 ans, elles ne sont pas à la mode, mais elles s'en tiennent au modèle physique et aux relations de cause à effet, et leurs résultats sont interprétables. IL FAUT QUE JE CREUSE UN PEU.

C'est la seule chose qui pourrait potentiellement servir de filtre pour des signaux déjà calculés. Les autres méthodes qui vont dans ce sens sont foutues.

 
Maxim Kuznetsov #:

Et au fait, oui, pourquoi tout le monde est si obsédé par la MO, l'IA et le DeepLearning ? Il y a une vieille chose bien oubliée, que l'amorce d'actualité nous a rappelée. Il existe des systèmes experts et toutes sortes d'évaluations pondérées. Bien sûr, les méthodes datent de 30 à 50 ans, elles ne sont pas à la mode, mais elles s'en tiennent au modèle physique et aux relations de cause à effet et leurs résultats sont interprétables. IL FAUDRA QUE JE CREUSE UN PEU.

C'est la seule chose qui pourrait potentiellement servir de filtre pour des signaux déjà calculés. Les autres méthodes allant dans ce sens ont été malmenées.

En fait, il s'agit d'un algorithme de base, qui fait partie d'un algorithme plus complexe basé sur des arbres, et qui est le plus recyclé.