Popolazione rispetto alla deviazione standard del campione
Nella statistica, diversi indici sono usati per descrivere un insieme di dati corrispondente alla sua tendenza centrale, dispersione e asimmetria. La deviazione standard è una delle misure più comuni di dispersione dei dati dal centro del set di dati.
A causa di difficoltà pratiche, non sarà possibile utilizzare i dati dell'intera popolazione quando viene testata un'ipotesi. Pertanto, utilizziamo i valori dei dati dai campioni per fare inferenze sulla popolazione. In una tale situazione, questi sono chiamati stimatori poiché stimano i valori dei parametri della popolazione.
È estremamente importante utilizzare stimatori imparziali per l'inferenza. Si dice che uno stimatore è imparziale se il valore atteso di tale stimatore è uguale al parametro della popolazione. Ad esempio, usiamo la media campionaria come stimatore non distorto per la media della popolazione. (Matematicamente, si può dimostrare che il valore atteso della media campionaria è uguale alla media della popolazione). Nel caso di stima della deviazione standard della popolazione, anche la deviazione standard del campione è uno stimatore corretto.
Qual è la deviazione standard della popolazione?
Quando è possibile tenere conto dei dati dell'intera popolazione (ad esempio nel caso di un censimento) è possibile calcolare la deviazione standard della popolazione. Per calcolare la deviazione standard della popolazione, vengono prima calcolate le deviazioni dei valori dei dati dalla media della popolazione. La media della radice quadrata (media quadratica) delle deviazioni è chiamata deviazione standard della popolazione.
In una classe di 10 studenti, i dati sugli studenti possono essere facilmente raccolti. Se un'ipotesi viene testata su questa popolazione di studenti, non è necessario utilizzare valori di esempio. Ad esempio, i pesi dei 10 studenti (in chilogrammi) sono misurati in 70, 62, 65, 72, 80, 70, 63, 72, 77 e 79. Quindi il peso medio delle dieci persone (in chilogrammi) è (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, che è 71 (in chilogrammi). Questa è la media della popolazione.
Ora per calcolare la deviazione standard della popolazione, calcoliamo le deviazioni dalla media. Le rispettive deviazioni dalla media sono (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 e (79 - 71) = 8. La somma dei quadrati di deviazione è ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. La deviazione standard della popolazione è √ (366/10) = 6,05 (in chilogrammi). 71 è il peso medio esatto degli studenti della classe e 6,05 è l'esatta deviazione standard del peso da 71.
Qual è la deviazione standard del campione?
Quando vengono utilizzati i dati di un campione (di dimensione n) per stimare i parametri della popolazione, viene calcolata la deviazione standard del campione. Per prima cosa vengono calcolate le deviazioni dei valori dei dati dalla media campionaria. Poiché la media campionaria è utilizzata al posto della media della popolazione (che è sconosciuta), la media quadratica non è appropriata. Per compensare l'uso della media campionaria, la somma dei quadrati delle deviazioni è divisa per (n-1) invece di n. La deviazione standard campionaria è la radice quadrata di questo. In simboli matematici, S = √ Σ (xio-X)2 / (n-1), dove S è la deviazione standard campionaria, ẍ è la media campionaria e xiosono i punti dati.
Ora supponiamo che, nell'esempio precedente, la popolazione sia gli studenti di tutta la scuola. Quindi, la classe sarà solo un esempio. Se questo campione viene utilizzato nella stima, la deviazione standard del campione sarà √ (366/9) = 6,38 (in chilogrammi) poiché 366 è stato diviso per 9 anziché 10 (la dimensione del campione). Il fatto di osservare è che questo non è garantito per essere il valore di deviazione standard della popolazione esatta. È solo una stima per questo.
Qual è la differenza tra la deviazione standard della popolazione e la deviazione standard del campione? • La deviazione standard della popolazione è il valore esatto del parametro usato per misurare la dispersione dal centro, mentre la deviazione standard del campione è uno stimatore corretto per esso. • La deviazione standard della popolazione viene calcolata quando sono noti tutti i dati riguardanti ogni individuo della popolazione. Altrimenti, viene calcolata la deviazione standard del campione. • La deviazione standard della popolazione è data da σ = √ Σ (xi-μ)2/ n dove μ è la media della popolazione e n è la dimensione della popolazione, ma la deviazione standard del campione è data da S = √ Σ (xi-ẍ)2 / (n-1) dove ẍ è la media campionaria en è la dimensione del campione.
|