Discusión sobre el artículo "Aprendizaje automático y data science (Parte 05): Árboles de decisión usando como ejemplo las condiciones meteorológicas para jugar al tenis"

 

Artículo publicado Aprendizaje automático y data science (Parte 05): Árboles de decisión usando como ejemplo las condiciones meteorológicas para jugar al tenis:

Los árboles de decisión clasifican los datos imitando la forma de pensar de los seres humanos. En este artículo, veremos cómo construir árboles de decisión y usar estos para clasificar y predecir datos. El objetivo principal del algoritmo del árbol de decisión es dividir la muestra en datos con "impurezas" y en datos "limpios" o próximos a los nodos.

os árboles de decisión usan un conjunto de algoritmos para tomar decisiones sobre la división de un nodo en dos o más nodos de un subconjunto. La creación de subnodos aumenta la homogeneidad de los subnodos resultantes. En otras palabras, podemos decir que la pureza del nodo aumenta respecto a la variable objetivo. El algoritmo del árbol de decisiones divide los nodos entre todas las variables disponibles y luego selecciona la división que genera como resultado los subnodos más homogéneos.

Ejemplo de árbol de decisión

La selección del algoritmo se basa en el tipo de variables objetivo.

A continuación, mostramos los algoritmos utilizados en el árbol de decisión:

  1. ID3 — extensión de D3
  2. C4.5 — sucesor de ID3
  3. CART — árbol de clasificación y regresión
  4. CHAID — la detección automática de interacción de chi-cuadrado (CHAID), realiza divisiones de varios niveles al calcular árboles de clasificación
  5. MARS — splines de regresión adaptativa multivariante

En este artículo, crearemos un árbol de decisión basado en el algoritmo ID3; los otros algoritmos los analizaremos y aplicaremos en futuros artículos de esta serie.

Autor: Omega J Msigwa

 

Hola Sr. Omega,

Muchas gracias por la solución ID3. es muy útil para mí. Sin embargo he proporcionado y adjuntado una hoja excel a este respecto, que creo que está claro para su explica.

Muchas gracias de nuevo,

F.Mahmoudian

Archivos adjuntos:
 
Fatemeh Haji Mahmoudian #:

Hola Sr. Omega,

Muchas gracias por la solución ID3. es muy útil para mí. Sin embargo he proporcionado y se adjunta una hoja de Excel en este sentido, que creo que es claro para sus explicaciones.

Muchas gracias de nuevo,

F.Mahmoudian

muchas gracias a él, todavía estoy tratando de averiguar cómo dejar que el guión dibujar el árbol en sí

 
Omega J Msigwa #:

many thanks to it, I'm still trying to figure out how to let the script draw the tree itself

Sería estupendo.

Muchas gracias

 

Y por cierto, sí, ¿por qué todo el mundo está tan obsesionado con MO, AI y DeepLearning? Hay una cosa antigua bien olvidada, que nos ha recordado el tópico de inicio. Hay sistemas expertos y todo tipo de evaluaciones ponderadas. Claro que los métodos tienen 30-50 años, no están de moda, pero se ciñen al modelo físico y a las relaciones causa-efecto y sus resultados son interpretables. TENGO QUE PROFUNDIZAR.

es lo unico que potencialmente podria ser un filtro para señales ya calculadas. Otros métodos en esta dirección están jodidos.

[Eliminado]  
Maxim Kuznetsov #:

Y por cierto, sí, ¿por qué todo el mundo está tan obsesionado con MO, AI y DeepLearning? Hay una cosa antigua bien olvidada, que nos ha recordado el tópico de inicio. Hay sistemas expertos y todo tipo de evaluaciones ponderadas. Claro que los métodos tienen 30-50 años, no están de moda, pero se ciñen al modelo físico y a las relaciones causa-efecto y sus resultados son interpretables. TENDRÉ QUE INVESTIGAR.

es lo unico que potencialmente podria ser un filtro para señales ya calculadas. Otros métodos en esta dirección están jodidos.

En realidad es un algoritmo básico, parte de uno más complejo basado en árboles ) y el más reentrenado.