Discussione sull’articolo "Scienza dei Dati e Apprendimento Automatico (Parte 02): Regressione Logistica"

 

Il nuovo articolo Scienza dei Dati e Apprendimento Automatico (Parte 02): Regressione Logistica è stato pubblicato:

La classificazione dei dati è una cosa cruciale per un algo trader e un programmatore. In questo articolo, ci concentreremo su uno degli algoritmi logistici di classificazione che possono aiutarci a identificare i Sì o i No, gli alti e bassi, gli acquisti e le vendite.

Il modello lineare viene passato a una funzione logistica (sigmoid/p) =1/1+e^t dove t è il risultato del modello lineare il cui valore è tra 0 e 1. Questo rappresenta la probabilità che un punto dati appartenga a una classe.

Invece di utilizzare y di un modello lineare come dipendente, la sua funzione viene mostrata come " p" e utilizzata come dipendente 

p = 1/1+e^-(c+m1x1+m2x2+....+mnxn) ,in caso di valori multipli.

Come detto in precedenza, la curva sigmoidea mira a convertire i valori di infinito in output in formato binario (0 o 1). Ma cosa succede se ho un punto dati situato a 0,8, come si può decidere che il valore è zero o uno? È qui che entrano in gioco i valori di soglia.

logistic regression sigmoid threshold

La soglia indica la probabilità di vincere o perdere, si trova a 0,5 (centro di 0 e 1).

Qualsiasi valore maggiore o uguale a 0,5 verrà arrotondato a uno, quindi considerato vincente, mentre qualsiasi valore inferiore a 0,5 verrà arrotondato a 0 quindi considerato perdente a questo punto, è tempo di vedere la differenza tra regressione lineare e logistica .

Autore: Omega J Msigwa