Differenza tra apprendimento automatico sorvegliato e non supervisionato

Differenza chiave - Supervisionata vs unsupervised Machine Learning
 

L'apprendimento supervisionato e l'apprendimento senza supervisione sono due concetti chiave dell'apprendimento automatico. L'apprendimento supervisionato è un compito di apprendimento automatico per l'apprendimento di una funzione che associa un input a un output basato sulle coppie input-output di esempio. L'apprendimento senza supervisione è il compito di Machine Learning di dedurre una funzione per descrivere la struttura nascosta da dati non etichettati. Il differenza fondamentale tra l'apprendimento automatico supervisionato e non supervisionato è quello l'apprendimento supervisionato utilizza dati etichettati mentre l'apprendimento senza supervisione utilizza dati senza etichetta.

Machine Learning è un campo in Informatica che offre la possibilità per un sistema informatico di apprendere dai dati senza essere programmato esplicitamente. Permette di analizzare i dati e prevedere i modelli in esso contenuti. Esistono molte applicazioni di machine learning. Alcuni di essi sono riconoscimento facciale, riconoscimento di gesti e riconoscimento vocale. Esistono vari algoritmi relativi all'apprendimento automatico. Alcuni di essi sono regressione, classificazione e clustering. I linguaggi di programmazione più comuni per lo sviluppo di applicazioni basate sull'apprendimento automatico sono R e Python. Possono essere usati anche altri linguaggi come Java, C ++ e Matlab.

CONTENUTO

1. Panoramica e differenza chiave
2. Cos'è l'apprendimento supervisionato
3. Cos'è l'apprendimento senza supervisione
4. Somiglianze tra apprendimento automatico sorvegliato e non supervisionato
5. Confronto affiancato - Apprendimento automatico supervisionato e non supervisionato in formato tabulare
6. Sommario

Cos'è l'apprendimento supervisionato?

Nei sistemi basati sull'apprendimento automatico, il modello funziona secondo un algoritmo. Nell'apprendimento supervisionato, il modello è supervisionato. Innanzitutto, è necessario addestrare il modello. Con la conoscenza acquisita, può prevedere le risposte per le istanze future. Il modello viene addestrato utilizzando un set di dati etichettato. Quando un dato fuori campione viene fornito al sistema, può prevedere il risultato. Di seguito è riportato un piccolo estratto dal famoso set di dati IRIS.

Secondo la tabella sopra, Sepal length, Sepal width, Patel length, Patel width e Species sono detti attributi. Le colonne sono conosciute come funzioni. Una riga contiene dati per tutti gli attributi. Pertanto, una riga è chiamata osservazione. I dati possono essere numerici o categoriali. Il modello riceve le osservazioni con il nome della specie corrispondente come input. Quando viene fornita una nuova osservazione, il modello dovrebbe prevedere il tipo di specie a cui appartiene.

Nell'apprendimento supervisionato, esistono degli algoritmi per la classificazione e la regressione. La classificazione è il processo di classificazione dei dati etichettati. Il modello ha creato dei limiti che separano le categorie di dati. Quando vengono forniti nuovi dati al modello, può categorizzare in base a dove il punto esiste. K-Nearest Neighbors (KNN) è un modello di classificazione. A seconda del valore k, la categoria viene decisa. Ad esempio, quando k è 5, se un dato punto dati è vicino a otto punti dati nella categoria A e sei punti dati nella categoria B, il punto dati sarà classificato come A.

La regressione è il processo di previsione dell'andamento dei dati precedenti per prevedere l'esito dei nuovi dati. Nella regressione, l'output può essere costituito da una o più variabili continue. La predizione viene eseguita utilizzando una linea che copre la maggior parte dei punti dati. Il modello di regressione più semplice è una regressione lineare. È veloce e non richiede parametri di ottimizzazione come in KNN. Se i dati mostrano una tendenza parabolica, il modello di regressione lineare non è adatto.

Questi sono alcuni esempi di algoritmi di apprendimento supervisionati. Generalmente, i risultati generati dai metodi di apprendimento supervisionati sono più accurati e affidabili perché i dati di input sono ben noti ed etichettati. Pertanto, la macchina deve analizzare solo i modelli nascosti.

Cos'è l'apprendimento senza supervisione?

Nell'apprendimento non supervisionato, il modello non è supervisionato. Il modello funziona da solo, per prevedere i risultati. Utilizza algoritmi di apprendimento automatico per giungere a conclusioni su dati senza etichetta. Generalmente, gli algoritmi di apprendimento non supervisionati sono più difficili degli algoritmi di apprendimento supervisionati perché ci sono poche informazioni. Il clustering è un tipo di apprendimento non supervisionato. Può essere usato per raggruppare i dati sconosciuti usando algoritmi. Il cluster di media e densità basato su k sono due algoritmi di clustering.

algoritmo k-mean, colloca il centroide a caso per ciascun cluster. Quindi ciascun punto dati viene assegnato al centroide più vicino. La distanza euclidea viene utilizzata per calcolare la distanza dal punto dati al centroide. I punti dati sono classificati in gruppi. Le posizioni per k centroidi vengono calcolate nuovamente. La nuova posizione del centroide è determinata dalla media di tutti i punti nel gruppo. Ancora una volta ogni punto dati è assegnato al centroide più vicino. Questo processo si ripete finché i centroidi non cambiano più. k-mean è un algoritmo di clustering veloce, ma non è stata specificata l'inizializzazione dei punti di clustering. Inoltre, esiste un'alta variazione dei modelli di cluster basata sull'inizializzazione dei punti del cluster.

Un altro algoritmo di clustering è Cluster basato sulla densità. È anche noto come applicazioni di raggruppamento spaziale basato sulla densità con rumore. Funziona definendo un cluster come set massimo di punti collegati alla densità. Sono due parametri utilizzati per il clustering basato sulla densità. Sono Ɛ (epsilon) e punti minimi. Il Ɛ è il raggio massimo del quartiere. I punti minimi sono il numero minimo di punti nel quartiere Ɛ per definire un cluster. Questi sono alcuni esempi di clustering che ricadono nell'apprendimento non supervisionato.

Generalmente, i risultati generati da algoritmi di apprendimento non supervisionati non sono molto accurati e affidabili perché la macchina deve definire ed etichettare i dati di input prima di determinare i modelli e le funzioni nascosti.

Qual è la somiglianza tra apprendimento automatico supervisionato e non supervisionato?

  • L'apprendimento supervisionato e non supervisionato sono tipi di apprendimento automatico.

Qual è la differenza tra l'apprendimento automatico sorvegliato e non supervisionato?

Apprendimento automatico supervisionato e non supervisionato

L'apprendimento supervisionato è il compito di apprendimento automatico di una funzione che associa un input a un output basato su coppie di input-output di esempio. L'apprendimento senza supervisione è il compito di Machine Learning di dedurre una funzione per descrivere la struttura nascosta da dati senza etichetta.
 Funzionalità principale
Nell'apprendimento supervisionato, il modello prevede il risultato in base ai dati di input etichettati. Nell'apprendimento non supervisionato, il modello predice il risultato senza dati etichettati identificando i pattern da solo.
Precisione dei risultati
I risultati generati dai metodi di apprendimento supervisionati sono più accurati e affidabili. I risultati generati da metodi di apprendimento non supervisionati non sono molto accurati e affidabili.
Algoritmi principali
Esistono algoritmi per la regressione e la classificazione nell'apprendimento supervisionato. Esistono algoritmi per il clustering nell'apprendimento non supervisionato.

Riepilogo - Supervisionato vs unsupervised Machine Learning

L'apprendimento supervisionato e l'apprendimento senza supervisione sono due tipi di apprendimento automatico. L'apprendimento supervisionato è il compito di apprendimento automatico di una funzione che associa un input a un output basato su coppie di input-output di esempio. L'apprendimento senza supervisione è il compito di Machine Learning di dedurre una funzione per descrivere la struttura nascosta da dati senza etichetta. La differenza tra l'apprendimento automatico supervisionato e non supervisionato è che l'apprendimento supervisionato utilizza dati etichettati mentre l'inclinazione senza supervisione utilizza dati senza etichetta.

Riferimento:

1.TheBigDataUniversity. Apprendimento automatico: apprendimento supervisionato senza supervisione, classe cognitiva, 13 marzo 2017. Disponibile qui 
2. "Apprendimento senza supervisione". Wikipedia, Wikimedia Foundation, 20 marzo 2018. Disponibile qui 
3. "Apprendimento supervisionato". Wikipedia, Wikimedia Foundation, 15 marzo 2018. Disponibile qui

Cortesia dell'immagine:

1. "2729781" di GDJ (Public Domain) via pixabay