Varianza vs Covarianza
Varianza e covarianza sono due misure utilizzate nelle statistiche. La varianza è una misura della dispersione dei dati e la covarianza indica insieme il grado di variazione di due variabili casuali. La varianza è piuttosto un concetto intuitivo, ma la covarianza è definita matematicamente non intuitiva all'inizio.
Ulteriori informazioni sulla varianza
La varianza è una misura della dispersione dei dati dal valore medio della distribuzione. Indica fino a che punto i dati si trovano dalla media della distribuzione. È uno dei principali descrittori della distribuzione di probabilità e uno dei momenti della distribuzione. Inoltre, la varianza è un parametro della popolazione, e la varianza di un campione dalla popolazione si comporta come uno stimatore per la varianza della popolazione. Da una prospettiva, è definito come il quadrato della deviazione standard.
In un linguaggio semplice, può essere descritto come la media dei quadrati della distanza tra ciascun punto dati e la media della distribuzione. La seguente formula è usata per calcolare la varianza.
Var (X) = E [(X-μ)2 ] per una popolazione, e
Var (X) = E [(X-~x)2 ] per un campione
Può essere ulteriormente semplificato per dare Var (X) = E [X2 ]-(EX])2.
La varianza ha alcune proprietà di firma e viene spesso utilizzata nelle statistiche per semplificare l'utilizzo. La varianza è non negativa perché è il quadrato delle distanze. Tuttavia, l'intervallo della varianza non è limitato e dipende dalla particolare distribuzione. La varianza di una variabile casuale costante è zero e la varianza non cambia rispetto a un parametro di posizione.
Maggiori informazioni su Covariance
Nella teoria statistica, la covarianza è una misura di quanto due variabili casuali cambiano insieme. In altre parole, la covarianza è una misura della forza della correlazione tra due variabili casuali. Inoltre, può essere considerato come una generalizzazione del concetto di varianza di due variabili casuali.
La covarianza di due variabili casuali X e Y, che sono distribuite congiuntamente con il secondo momento finito, è nota come σXY= E [(X-E [X]) (Y-E [Y])]. Da questo, la varianza può essere vista come un caso speciale di covarianza, in cui due variabili sono le stesse. Cov (X, X) = Var (X)
Normalizzando la covarianza, è possibile ottenere il coefficiente di correlazione lineare o il coefficiente di correlazione di Pearson, che è definito come ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Graficamente, la covarianza tra una coppia di punti dati può essere vista come l'area del rettangolo con i punti dati ai vertici opposti. Può essere interpretato come una misura della grandezza della separazione tra i due punti di dati. Considerando i rettangoli per l'intera popolazione, la sovrapposizione dei rettangoli corrispondenti a tutti i punti dati può essere considerata come la forza della separazione; varianza delle due variabili. La covarianza è in due dimensioni, a causa di due variabili, ma la sua semplificazione in una variabile dà la varianza di una singola come la separazione in una dimensione.
Qual è la differenza tra Varianza e Covarianza?
• La varianza è la misura della diffusione / dispersione in una popolazione, mentre la covarianza è considerata come una misura della variazione di due variabili casuali o la forza della correlazione.
• La varianza può essere considerata un caso speciale di covarianza.
• La varianza e la covarianza dipendono dall'entità dei valori dei dati e non possono essere confrontati; quindi, sono normalizzati. La covarianza è normalizzata nel coefficiente di correlazione (dividendo per il prodotto delle deviazioni standard delle due variabili casuali) e la varianza è normalizzata nella deviazione standard (prendendo la radice quadrata)