Differenza tra varianza campionaria e varianza popolazione

Spiegazione

In Statistica il termine campionamento si riferisce alla selezione di una parte di dati statistici aggregati allo scopo di ottenere informazioni rilevanti sull'intero. L'insieme o l'insieme delle informazioni statistiche su un particolare carattere di tutti i membri oggetto dell'indagine si chiama "popolazione" o "universo". (Das, N.G., 2010). La parte selezionata della popolazione che viene utilizzata per ottenere le caratteristiche della popolazione o dell'universo è definita come "campione". Si presume che la popolazione sia composta da singole unità o membri e alcune delle unità sono incluse nel campione. Il numero totale di unità della popolazione è chiamato dimensione della popolazione e quello del campione è chiamato dimensione del campione. La popolazione e il campione possono essere finiti o infiniti e allo stesso modo possono essere esistenti o ipotetici.

Varianza: La varianza è un valore numerico che mostra quanto le singole figure in un insieme di dati si distribuiscano sulla media. Questo è quanto lontano ogni numero è dalla media, e quindi l'uno dall'altro. Una varianza di valore zero significa che tutti i dati sono identici. Più la varianza, più sono i valori distribuiti sulla media, quindi l'uno dall'altro. Meno la varianza, meno sono i valori distribuiti sulla media, quindi l'uno sull'altro, e la varianza non può essere negativa.

Differenza tra varianza della popolazione e varianza campionaria

La principale differenza tra la varianza della popolazione e la varianza campionaria si riferisce al calcolo della varianza. La varianza è calcolata in cinque fasi. La prima media è calcolata, quindi calcoliamo le deviazioni dalla media, e in terzo luogo le deviazioni sono al quadrato, in quarto luogo le deviazioni al quadrato sono riassunte e infine questa somma è divisa per il numero di elementi per i quali viene calcolata la varianza. Quindi varianza = Σ (xi-x -) / n. Dove xi = ith. Numero, x- = media e n = numero di elementi ...

Ora, quando la varianza deve essere calcolata dai dati sulla popolazione, n è uguale al numero di elementi. Pertanto, se la varianza della pressione arteriosa di tutte le 1000 persone deve essere calcolata da dati sulla pressione arteriosa di tutte le 1000 persone, allora n = 1000. Tuttavia quando la varianza viene calcolata dai dati di esempio 1 deve essere dedotta da n prima di dividere il somma delle deviazioni quadrate. Quindi nell'esempio sopra se i dati di esempio hanno 100 voci, il denominatore sarebbe 100 - 1 = 99.

A causa di ciò, il valore della varianza calcolato dai dati di esempio è superiore al valore che avrebbe potuto essere scoperto utilizzando i dati della popolazione. La logica del fare ciò è di compensare la nostra mancanza di informazioni sui dati della popolazione. È impossibile scoprire la varianza delle altezze negli esseri umani, la nostra assoluta mancanza di informazioni sulle altezze di tutti gli esseri umani viventi, non parlare del futuro. Anche se prendiamo un esempio moderato, come i dati sulla popolazione di tutti gli uomini viventi negli Stati Uniti, è fisicamente possibile, ma il costo e il tempo coinvolti in ciò vanificherebbe lo scopo del suo calcolo. Questa è la ragione per cui i dati di esempio vengono presi per la maggior parte degli scopi statistici, e questo è accompagnato dalla mancanza di informazioni sulla maggior parte dei dati. Per compensare questo, il valore della varianza e della deviazione standard, che è la radice quadrata della varianza, sono più alti nel caso di dati campionari rispetto alla varianza dai dati sulla popolazione.

Questo funge da scudo automatico per gli analisti e i responsabili delle decisioni. La logica si applica alle decisioni in materia di capital budgeting, finanza personale e aziendale, costruzione, gestione del traffico e molti campi applicabili. Ciò aiuta il detentore delle scommesse a stare al sicuro mentre prende decisioni o altre inferenze.

Sommario: La varianza della popolazione si riferisce al valore della varianza che viene calcolato dai dati della popolazione e la varianza campionaria è la varianza calcolata dai dati campione. A causa di questo valore del denominatore nella formula della varianza nel caso dei dati campione è 'n-1', ed è 'n' per i dati sulla popolazione. Di conseguenza sia la varianza che la deviazione standard derivate dai dati del campione sono più di quelle scoperte dai dati sulla popolazione.