Regressione lineare vs logistica
Nell'analisi statistica, è importante identificare le relazioni tra le variabili interessate allo studio. A volte può essere l'unico scopo dell'analisi stessa. Uno strumento forte impiegato per stabilire l'esistenza della relazione e identificare la relazione è l'analisi di regressione.
La forma più semplice di analisi di regressione è la regressione lineare, in cui la relazione tra le variabili è una relazione lineare. In termini statistici, mette in evidenza la relazione tra la variabile esplicativa e la variabile di risposta. Ad esempio, utilizzando la regressione possiamo stabilire la relazione tra il prezzo delle materie prime e il consumo sulla base dei dati raccolti da un campione casuale. L'analisi di regressione produrrà una funzione di regressione dell'insieme di dati, che è un modello matematico che meglio si adatta ai dati disponibili. Questo può essere facilmente rappresentato da una trama a dispersione. La regressione grafica equivale a trovare la curva di adattamento migliore per il set di dati specificato. La funzione della curva è la funzione di regressione. Utilizzando il modello matematico, l'utilizzo di una merce può essere previsto per un dato prezzo.
Pertanto, l'analisi di regressione è ampiamente utilizzata nella previsione e nella previsione. Viene anche utilizzato per stabilire le relazioni in dati sperimentali, nei campi della fisica, della chimica e in molte scienze naturali e discipline ingegneristiche. Se la relazione o la funzione di regressione è una funzione lineare, il processo è noto come regressione lineare. Nel grafico a dispersione, può essere rappresentato come una linea retta. Se la funzione non è una combinazione lineare dei parametri, la regressione non è lineare.
La regressione logistica è paragonabile alla regressione multivariata e crea un modello per spiegare l'impatto di predittori multipli su una variabile di risposta. Tuttavia, nella regressione logistica, la variabile del risultato finale dovrebbe essere categoriale (solitamente divisa, cioè una coppia di risultati raggiungibili, come la morte o la sopravvivenza, sebbene tecniche speciali consentano di modellare più informazioni categorizzate). Una variabile di risultato continuo può essere trasformata in una variabile categoriale, da utilizzare per la regressione logistica; tuttavia, il collasso delle variabili continue in questo modo è per lo più scoraggiato perché riduce la precisione.
Diversamente dalla regressione lineare, verso la media, le variabili predittive nella regressione logistica non devono essere costrette per essere collegate linearmente, comunemente distribuite, o per avere una varianza uguale all'interno di ogni cluster. Di conseguenza, la relazione tra predittore e variabili di risultato non è probabile che sia una funzione lineare.
Qual è la differenza tra regressione logistica e lineare?
• Nella regressione lineare, viene assunta una relazione lineare tra la variabile esplicativa e la variabile di risposta e i parametri che soddisfano il modello sono rilevati dall'analisi, per fornire la relazione esatta.
• La regressione lineare viene eseguita per le variabili quantitative e la funzione risultante è quantitativa.
• Nella regressione logistica, i dati utilizzati possono essere categoriali o quantitativi, ma il risultato è sempre categorico.