Il differenza fondamentale tra la classificazione e l'albero di regressione è quello nella classificazione le variabili dipendenti sono categoriali e non ordinate mentre nella regressione le variabili dipendenti sono valori interi continui o ordinati.
Classificazione e regressione sono tecniche di apprendimento per creare modelli di previsione dai dati raccolti. Entrambe le tecniche sono presentate graficamente come alberi di classificazione e di regressione, o piuttosto diagrammi di flusso con divisioni di dati dopo ogni passo, o meglio, "ramo" nell'albero. Questo processo è chiamato partizionamento ricorsivo. Campi come Mining utilizzano queste tecniche di classificazione e di regressione. Questo articolo si concentra sull'albero di classificazione e sull'albero di regressione.
1. Panoramica e differenza chiave
2. Cos'è la classificazione
3. Cos'è la regressione
4. Confronto affiancato - Classificazione vs regressione in forma tabulare
5. Sommario
La classificazione è una tecnica utilizzata per arrivare a uno schema che mostra l'organizzazione dei dati a partire da una variabile precursore. Le variabili dipendenti sono ciò che classifica i dati.
Figura 01: data mining
L'albero di classificazione inizia con la variabile indipendente, che si dirama in due gruppi come determinato dalle variabili dipendenti esistenti. Ha lo scopo di chiarire le risposte sotto forma di categorizzazione determinate dalle variabili dipendenti.
La regressione è un metodo di predizione basato su un valore di output numerico presunto o conosciuto. Questo valore di uscita è il risultato di una serie di partizioni ricorsive, con ogni passo che ha un valore numerico e un altro gruppo di variabili dipendenti che si diramano verso un'altra coppia come questa.
L'albero di regressione inizia con una o più variabili precursore e termina con una variabile di output finale. Le variabili dipendenti sono variabili numeriche continue o discrete.
Classificazione vs Regressione | |
Un modello ad albero in cui la variabile di destinazione può prendere un insieme discreto di valori. | Un modello ad albero in cui la variabile di destinazione può assumere valori continui, in genere numeri reali. |
Variabile dipendente | |
Per l'albero di classificazione, le variabili dipendenti sono categoriali. | Per l'albero di regressione, le variabili dipendenti sono numeriche. |
Valori | |
Ha una quantità prestabilita di valori non ordinati. | Ha valori discreti ma ordinati o valori indiscreti. |
Scopo della costruzione | |
Lo scopo della costruzione dell'albero di regressione è di adattare un sistema di regressione a ciascun ramo determinante in modo che il valore di uscita previsto si presenti. | Un albero di classificazione si ramifica come determinato da una variabile dipendente derivata dal nodo precedente. |
Gli alberi di regressione e classificazione sono utili tecniche per mappare il processo che punta a un risultato studiato, sia in classificazione che in un singolo valore numerico. La differenza tra l'albero di classificazione e l'albero di regressione è la loro variabile dipendente. Gli alberi di classificazione hanno variabili dipendenti che sono categoriali e non ordinate. Gli alberi di regressione hanno variabili dipendenti che sono valori continui o valori interi ordinati.
1. "Apprendimento dell'albero decisionale". Wikipedia, Wikimedia Foundation, 13 maggio 2018. Disponibile qui
1.'Data Mining'By Arbeck - Opera propria, (CC BY 3.0) via Commons Wikimedia