Campionamento stratificato vs Campionamento a grappolo
Nelle statistiche, soprattutto quando si effettuano sondaggi, è importante ottenere un campione imparziale, quindi i risultati e le previsioni sulla popolazione sono più accurati. Ma, nel semplice campionamento casuale, esiste la possibilità di selezionare i membri del campione che sono di parte; in altre parole, non rappresenta la popolazione in modo equo. Pertanto, il campionamento stratificato e il campionamento del cluster vengono utilizzati per superare i problemi di bias e efficienza del semplice campionamento casuale.
Campionamento stratificato
Il campionamento casuale stratificato è un metodo di campionamento in cui la popolazione viene prima divisa in strati (uno strato è un sottoinsieme omogeneo della popolazione). Quindi viene prelevato un semplice campione casuale da ogni strato. I risultati di ogni strato combinati costituiscono il campione. Di seguito sono riportati esempi di possibili strati nelle popolazioni
• Per una popolazione di uno stato, strati maschili e femminili
• Per le persone che lavorano in una città, residenti e non residenti
• Per studenti di college, bianchi, neri, ispanici e asiatici
• Per un pubblico di un dibattito su teologia, protestanti, cattolici, ebrei, strati musulmani
In questo processo, piuttosto che prelevare campioni a caso direttamente dalla popolazione, la popolazione viene separata in gruppi utilizzando una caratteristica intrinseca degli elementi (gruppi omogenei). Quindi campioni casuali vengono presi dal gruppo. La quantità di campioni casuali prelevati da ciascun gruppo dipende dal numero di elementi all'interno del gruppo.
Ciò consente di effettuare il campionamento senza che il campione di un gruppo sia più grande del numero di campioni richiesti da quel particolare gruppo. Se il numero di elementi di un determinato gruppo è maggiore della quantità richiesta, una distorsione nella distribuzione può portare a interpretazioni errate.
Il campionamento stratificato consente l'uso di diversi metodi statistici per ogni strato, il che aiuta a migliorare l'efficienza e l'accuratezza della stima.
Campionamento a grappolo
Il campionamento casuale a grappolo è un metodo di campionamento in cui la popolazione viene inizialmente suddivisa in cluster (un cluster è un sottoinsieme eterogeneo della popolazione). Quindi viene preso un semplice campione casuale di cluster. Tutti i membri dei cluster selezionati costituiscono insieme il campione. Questo metodo è spesso usato quando i raggruppamenti naturali sono ovvi e disponibili.
Ad esempio, si consideri un sondaggio per valutare il coinvolgimento degli studenti delle scuole superiori in attività extrascolastiche. Piuttosto che selezionare studenti a caso dalla popolazione studentesca, selezionare una classe come campioni per il sondaggio è il campionamento del cluster. Quindi ogni membro della classe viene intervistato. In questo caso, le classi sono gruppi di popolazione studentesca.
Nel campionamento del cluster, sono i cluster selezionati casualmente, non gli individui. Si presume che ogni cluster da solo sia una rappresentazione imparziale della popolazione, il che implica che ciascuno dei cluster è eterogeneo.
Qual è la differenza tra Stratified Sampling e Cluster Sampling?
• Nel campionamento stratificato, la popolazione è divisa in gruppi omogenei chiamati strati, utilizzando un attributo dei campioni. Quindi vengono selezionati i membri di ogni strato e il numero di campioni prelevati da tali strati è proporzionale alla presenza degli strati all'interno della popolazione.
• Nel campionamento del cluster, la popolazione è raggruppata in cluster, prevalentemente in base alla posizione, quindi un cluster viene selezionato casualmente.
• Nel campionamento del cluster, un cluster viene selezionato casualmente, mentre in quello stratificato i membri vengono selezionati casualmente.
• Nel campionamento stratificato, ogni gruppo utilizzato (strati) include membri omogenei mentre, nel campionamento del cluster, un cluster è eterogeneo.
• Il campionamento stratificato è più lento mentre il campionamento del cluster è relativamente più veloce.
• I campioni stratificati hanno meno errori dovuti al factoring in presenza di ciascun gruppo all'interno della popolazione e adattando i metodi per ottenere una stima migliore.
• Il campionamento del cluster ha una maggiore percentuale di errori.