Differenza tra deviazione standard e errore standard

introduzione

Standard Deviazione (SD) e Standard Error (SE) sono terminologie apparentemente simili; tuttavia, sono concettualmente così diversi da essere usati quasi in modo intercambiabile nella letteratura statistica. Entrambi i termini sono solitamente preceduti da un simbolo più-meno (+/-) che è indicativo del fatto che definiscono un valore simmetrico o rappresentano un intervallo di valori. Invariabilmente, entrambi i termini appaiono con una media (media) di un insieme di valori misurati.

È interessante notare che una SE non ha nulla a che fare con gli standard, con errori o con la comunicazione di dati scientifici.

Uno sguardo dettagliato sull'origine e la spiegazione di SD e SE rivelerà, perché gli statistici professionali e coloro che lo usano in modo sistematico, tendono entrambi a sbagliare.

Deviazione standard (SD)

Un SD è un descrittivo statistica che descrive la diffusione di una distribuzione. Come metrica, è utile quando i dati sono normalmente distribuiti. Tuttavia, è meno utile quando i dati sono molto distorti o bimodali perché non descrive molto bene la forma della distribuzione. In genere, utilizziamo la SD quando si riportano le caratteristiche del campione, perché lo intendiamo descrivere quanto i dati variano attorno alla media. Altre statistiche utili per descrivere la diffusione dei dati sono l'intervallo interquartile, il 25 ° e il 75 ° percentile e l'intervallo dei dati.

Figura 1. La SD è una misura della diffusione dei dati. Quando i dati sono un campione di una distribuzione distribuita normalmente, allora ci si aspetta che due terzi dei dati si trovino entro 1 deviazione standard della media.

La varianza è a descrittivo anche statistica, ed è definita come il quadrato della deviazione standard. Di solito non viene riportato quando si descrivono i risultati, ma si tratta di una formula più trattabile matematicamente (a.k.a la somma delle deviazioni al quadrato) e svolge un ruolo nel calcolo delle statistiche.

Ad esempio, se abbiamo due statistiche P & Q con varianze note var(P) & var(Q), quindi la varianza della somma P + Q è uguale alla somma delle varianze: var(P) +var(Q). Ora è evidente il motivo per cui agli statistici piace parlare di varianze.

Ma le deviazioni standard hanno un significato importante per la diffusione, in particolare quando i dati sono distribuiti normalmente: la media dell'intervallo +/ - 1 SD ci si può aspettare che catturi 2/3 del campione e la media dell'intervallo +- 2 SD ci si può aspettare che catturi il 95% del campione.

SD fornisce un'indicazione di quanto le risposte individuali a una domanda variano o "deviano" dalla media. SD dice al ricercatore come sono distribuite le risposte - sono concentrate intorno alla media, o sparse in lungo e in largo? Tutti i tuoi intervistati hanno valutato il tuo prodotto nel mezzo della tua scala, o alcuni lo hanno approvato e alcuni lo hanno disapprovato?

Considera un esperimento in cui agli intervistati viene chiesto di valutare un prodotto su una serie di attributi su una scala a 5 punti. Il valore medio per un gruppo di dieci intervistati (etichettato da "A" a "J" sotto) per "un buon rapporto qualità / prezzo" era 3.2 con un SD di 0.4 e il valore medio per "affidabilità del prodotto" era 3.4 con un SD di 2.1.

A prima vista (guardando solo i mezzi) sembrerebbe che l'affidabilità sia stata valutata superiore al valore. Ma la maggiore SD per affidabilità potrebbe indicare (come mostrato nella distribuzione di seguito) che le risposte erano molto polarizzate, dove la maggior parte degli intervistati non aveva problemi di affidabilità (valutato l'attributo a "5"), ma un segmento più piccolo, ma importante di un problema di affidabilità e valutato l'attributo "1". Guardando solo il significato del significato di una parte della storia, tuttavia, il più delle volte, questo è ciò su cui i ricercatori si concentrano. La distribuzione delle risposte è importante da considerare e la SD fornisce una preziosa misura descrittiva di ciò.

convenuto Buon valore per il denaro Affidabilità del prodotto
UN 3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
sol 3 5
H 3 5
io 3 5
J 3 5
Significare 3.2 3.4
Std. dev. 0.4 2.1

Primo sondaggio: i rispondenti valutano un prodotto su una scala a 5 punti

Due distribuzioni molto diverse di risposte a una scala di valutazione a 5 punti possono fornire la stessa media. Considera il seguente esempio che mostra i valori di risposta per due valutazioni diverse.

Nel primo esempio (Rating "A"), SD è zero perché TUTTE le risposte erano esattamente il valore medio. Le risposte individuali non hanno affatto deviato dalla media.

Nella valutazione "B", anche se la media del gruppo è la stessa (3.0) della prima distribuzione, la deviazione standard è più alta. La deviazione standard di 1.15 mostra che le risposte individuali, in media *, erano di poco più di 1 punto di distanza dalla media.

convenuto Valutazione "A" Valutazione "B"
UN 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
sol 3 3
H 3 4
io 3 4
J 3 5
Significare 3.0 3.0
Std. dev. 0.00 1.15

Secondo censimento: i rispondenti valutano un prodotto su una scala a 5 punti

Un altro modo di guardare SD è tracciare la distribuzione come un istogramma di risposte. Una distribuzione con un SD basso si visualizzerebbe come una forma stretta e alta, mentre una SD più grande sarebbe indicata da una forma più ampia.

SD generalmente non indica "giusto o sbagliato" o "migliore o peggiore" - un SD inferiore non è necessariamente più desiderabile. È usato puramente come statistica descrittiva. Descrive la distribuzione in relazione alla media.

Tdisclaimer ecologico relativo alla SD

Pensare a SD come a una "deviazione media" è un modo eccellente per comprenderne concettualmente il significato. Tuttavia, in realtà non è calcolato come media (se lo fosse, la chiameremmo la "deviazione media"). Invece, è "standardizzato", un metodo un po 'complesso di calcolare il valore usando la somma dei quadrati.

Per scopi pratici, il calcolo non è importante. La maggior parte dei programmi di tabulazione, fogli di calcolo o altri strumenti di gestione dei dati calcoleranno la SD per te. Più importante è capire cosa trasmettono le statistiche.

Errore standard

Un errore standard è un induttivo statistica utilizzata quando si confrontano medie campionarie (medie) tra le popolazioni. È una misura di precisione della media campionaria. La media campionaria è una statistica derivata da dati che ha una distribuzione sottostante. Non possiamo visualizzarlo allo stesso modo dei dati, poiché abbiamo eseguito un singolo esperimento e abbiamo solo un singolo valore. La teoria statistica ci dice che la media campionaria (per un grande campione "sufficiente" e in alcune condizioni di regolarità) è approssimativamente distribuita normalmente. La deviazione standard di questa distribuzione normale è ciò che chiamiamo l'errore standard.

figura 2. La distribuzione in basso repreassegna la distribuzione dei dati, mentre la distribuzione in alto è la distribuzione teorica della media campionaria. La SD di 20 è una misura della diffusione dei dati, mentre la SE di 5 è una misura di incertezza attorno alla media campionaria.

Quando vogliamo confrontare i mezzi di risultati di un esperimento a due campioni del trattamento A e del trattamento B, allora dobbiamo stimare quanto precisamente abbiamo misurato i mezzi.

In realtà, siamo interessati a quanto precisamente abbiamo misurato la differenza tra i due mezzi. Chiamiamo questa misura l'errore standard della differenza. Potresti non essere sorpreso di apprendere che l'errore standard della differenza nel mezzo campione è una funzione degli errori standard dei mezzi:

Ora che hai capito che l'errore standard della media (SE) e la deviazione standard della distribuzione (SD) sono due animali diversi, potresti chiederti come si siano confusi in primo luogo. Mentre differiscono concettualmente, hanno una semplice relazione matematica:

,dove n è il numero di punti dati.

Si noti che l'errore standard dipende da due componenti: la deviazione standard del campione e la dimensione del campione n. Questo ha un senso intuitivo: più grande è la deviazione standard del campione, meno preciso possiamo essere sulla nostra stima della media reale.

Inoltre, maggiore è la dimensione del campione, più informazioni abbiamo sulla popolazione e più precisamente possiamo stimare la vera media.

SE è un'indicazione dell'affidabilità della media. Una piccola SE indica che la media campionaria è un riflesso più accurato della media effettiva della popolazione. Un campione di dimensioni maggiori normalmente produce un SE più piccolo (mentre la SD non è direttamente influenzata dalle dimensioni del campione).

La maggior parte delle ricerche sui sondaggi prevede il prelievo di un campione da una popolazione. Quindi facciamo inferenze sulla popolazione dai risultati ottenuti da quel campione. Se è stato disegnato un secondo campione, i risultati probabilmente non corrisponderanno esattamente al primo campione. Se il valore medio di un attributo di classificazione era 3.2 per un campione, potrebbe essere 3.4 per un secondo campione della stessa dimensione. Se dovessimo disegnare un numero infinito di campioni (di uguale dimensione) dalla nostra popolazione, potremmo visualizzare i mezzi osservati come una distribuzione. Potremmo quindi calcolare una media di tutti i nostri mezzi di campionamento. Questa media equivarrebbe alla media della popolazione reale. Possiamo anche calcolare la SD della distribuzione di medie campionarie. La SD di questa distribuzione di medie campionarie è la SE di ogni singola media campionaria.

Pertanto, abbiamo la nostra osservazione più significativa: SE è la SD della media della popolazione.

Campione Significare
1 ° 3.2
2 ° 3.4
3 ° 3.3
4 ° 3.2
5 ° 3.1
... . ... .
... . ... .
... . ... .
... . ... .
... . ... .
Significare 3.3
Std. dev. 0,13

Tabella che illustra la relazione tra SD e SE

Ora è chiaro che se la SD di questa distribuzione ci aiuta a capire fino a che punto una media campionaria è dalla media della popolazione reale, allora possiamo usare questo per capire quanto accurata sia la media campionaria individuale in relazione alla media vera. Questa è l'essenza di SE.

In realtà, abbiamo prelevato un solo campione dalla nostra popolazione, ma possiamo usare questo risultato per fornire una stima dell'affidabilità della media campionaria osservata.

Infatti, SE ci dice che possiamo essere sicuri al 95% che la nostra media campionaria osservata sia più o meno all'incirca 2 (in realtà 1.96) Errori standard dalla media della popolazione.

La tabella seguente mostra la distribuzione delle risposte dal nostro primo (e unico) campione utilizzato per la nostra ricerca. La SE di 0,13, essendo relativamente piccola, ci dà un'indicazione che la nostra media è relativamente vicina alla media reale della nostra popolazione complessiva. Il margine di errore (al 95% di confidenza) per la nostra media è (approssimativamente) il doppio di tale valore (+/- 0,26), indicando che la media effettiva è molto probabilmente compresa tra 2,94 e 3,46..

convenuto Valutazione
UN 3
B 3
C 3
D 3
E 4
F 4
sol 3
H 3
io 3
J 3
Significare 3.2
Std. sbagliare 0,13

Sommario

Molti ricercatori non riescono a capire la distinzione tra deviazione standard e errore standard, anche se sono comunemente inclusi nell'analisi dei dati. Mentre i calcoli effettivi per la deviazione standard e l'errore standard sembrano molto simili, rappresentano due misure molto diverse ma complementari. SD ci parla della forma della nostra distribuzione, quanto sono vicini i valori dei singoli dati dal valore medio. SE ci dice quanto la nostra media campionaria sia vicina alla media reale della popolazione complessiva. Insieme, aiutano a fornire un'immagine più completa di quella che il solo significato può dirci.