Discussão do artigo "Ciência de Dados e Aprendizado de Máquina (Parte 05): Árvores de Decisão"

 

Novo artigo Ciência de Dados e Aprendizado de Máquina (Parte 05): Árvores de Decisão foi publicado:

As árvores de decisão imitam a maneira como os humanos pensam para classificar os dados. Vamos ver como construir árvores e usá-las para classificar e prever alguns dados. O principal objetivo do algoritmo de árvores de decisão é separar os dados impuros em puros ou próximos a nós.

As árvores de decisão usam vários algoritmos para decidir dividir um nó em dois ou mais nós do subconjunto. A criação dos sub-nós aumenta a homogeneidade dos sub-nós resultantes. Em outras palavras, nós podemos dizer que a pureza do nó aumenta em relação à variável alvo. O algoritmo da árvore de decisão divide os nós em todas as variáveis disponíveis e então seleciona a divisão que resulta nos sub-nós mais homogêneos.

exemplo de árvore de decisão

A seleção do algoritmo é baseada no tipo de variáveis de destino.

A seguir estão os algoritmos usados na Árvore de Decisão:

  1. ID3 > Extensão de D3
  2. C4.5 > Sucessor de ID3
  3. CART > Árvore de Classificação e Regressão
  4. CHAID > Detecção Automática da Interação Qui-quadrado, executa divisões em vários níveis ao calcular as árvores de classificação
  5. MARS > Splines de Regressão Adaptativa Multivariada

Neste artigo eu vou criar uma árvore de decisão baseada no algoritmo ID3, nós vamos discutir e usar os outros algoritmos nos próximos artigos desta série.

Autor: Omega J Msigwa