Discussão do artigo "Ciência de Dados e Aprendizado de Máquina (Parte 02): Regressão Logística"

 

Novo artigo Ciência de Dados e Aprendizado de Máquina (Parte 02): Regressão Logística foi publicado:

A classificação de dados é uma coisa crucial para um algotrader e um programador. Neste artigo, nós vamos nos concentrar em um dos algoritmos de classificação logística que provavelmente podem nos ajudar a identificar os Sims ou Nãos, as Altas e Baixas, Compras e Vendas.

O modelo Linear é passado para uma função logística (sigmoide/p) =1/1+e^t onde t é o modelo linear cujo resultado possui valores entre 0 e 1. Isso representa a probabilidade de um ponto de dado pertencer a uma classe.

Em vez de usar y de um modelo linear como dependente, sua função é exibida como "p" para caracterizar como dependente

p = 1/1+e^-(c+m1x1+m2x2+....+mnxn), no caso de múltiplos valores 

Como dito anteriormente, a curva sigmoide visa converter valores infinitos em uma saída no formato binário (0 ou 1). Mas e se eu tiver um ponto de dados localizado em 0.8, como se pode decidir que o valor é zero ou um? É aqui que os valores do limiar entram em jogo.

Limiar sigmoide da regressão logística

O limiar indica a probabilidade de ganhar ou perder, ele está localizado em 0.5 (centro de 0 e 1).

Qualquer valor maior ou igual a 0.5 será arredondado para um, portanto, considerado vencedor, enquanto qualquer valor abaixo de 0.5 será arredondado para 0, portanto, considerado perdedor neste ponto, está hora de vermos a diferença entre a regressão linear e logística.

Autor: Omega J Msigwa