Differenza tra T-TEST e ANOVA

T-TEST vs. ANOVA

Raccogliere e calcolare i dati statistici per acquisire la media è spesso un processo lungo e noioso. Il test t e l'analisi della varianza a una via (ANOVA) sono i due test più comuni utilizzati per questo scopo.

Il t-test è un test di ipotesi statistica in cui la statistica del test segue una distribuzione t di Student se l'ipotesi nulla è supportata. Questo test viene applicato quando la statistica del test segue una distribuzione normale e il valore di un termine di scala nella statistica del test è noto. Se il termine di ridimensionamento è sconosciuto, viene sostituito da una stima basata sui dati disponibili. La statistica del test seguirà la distribuzione t di Student.

William Sealy Gosset presentò la statistica t nel 1908. Gosset era un chimico per il birrificio Guinness a Dublino, in Irlanda. Il birrificio della Guinness aveva la politica di reclutare i migliori laureati di Oxford e Cambridge, scegliendo tra coloro che potevano fornire applicazioni di biochimica e statistica ai processi industriali stabiliti dalla società. William Sealy Gosset era uno di questi laureati. Nel processo, William Sealy Gosset ha ideato il t-test, che originariamente era stato concepito come un modo per monitorare la qualità dello stout (la birra scura prodotta dal birrificio) in un modo economico. Gosset pubblicò il test sotto lo pseudonimo "Studente" in Biometrika, circa 1908. Il motivo per cui lo pseudonimo era l'insistenza di Guinness, poiché la compagnia voleva mantenere la sua politica sull'utilizzo delle statistiche come parte dei loro "segreti commerciali".

Le statistiche del test T generalmente seguono la forma T = Z / s, dove Z e s sono funzioni dei dati. La variabile Z è progettata per essere sensibile all'ipotesi alternativa; efficacemente, la grandezza della variabile Z è maggiore quando l'ipotesi alternativa è vera. Nel frattempo, 's' è un parametro di ridimensionamento, che consente di determinare la distribuzione di T. Le ipotesi alla base di un t-test sono che a) Z segue una distribuzione normale standard sotto l'ipotesi nulla; b) ps2 segue una distribuzione Ï ‡ 2 con p gradi di libertà sotto l'ipotesi nulla (dove p è una costante positiva); e c) il valore Z e il valore s sono indipendenti. In un tipo specifico di t-test, queste condizioni sono conseguenze della popolazione studiata, nonché del modo in cui i dati sono campionati.

D'altra parte, l'analisi della varianza (ANOVA) è una raccolta di modelli statistici. Mentre i principi di ANOVA sono stati utilizzati da ricercatori e statistici da molto tempo, non è stato fino al 1918 che Sir Ronald Fisher fece una proposta per formalizzare l'analisi della varianza in un articolo intitolato "La correlazione tra i parenti sulla supposizione dell'eredità mendeliana" . Da allora, ANOVA è stato ampliato nel suo campo di applicazione e applicazione. ANOVA è in realtà un termine improprio, in quanto non deriva dalle differenze delle varianze ma piuttosto dalle differenze tra i mezzi dei gruppi. Include le procedure associate in cui la varianza osservata in una particolare variabile è suddivisa in componenti attribuibili a diverse fonti di variazione.

Essenzialmente, un ANOVA fornisce un test statistico per determinare se i mezzi di diversi gruppi sono tutti uguali e, di conseguenza, generalizza il t-test a più di due gruppi. Un ANOVA può essere più utile di un t-test a due campioni in quanto ha una minore probabilità di commettere un errore di tipo I. Ad esempio, avere più t-test a due campioni avrebbe maggiori probabilità di commettere un errore rispetto a un ANOVA delle stesse variabili coinvolte per ottenere la media. Il modello è lo stesso e la statistica del test è il rapporto F. In termini più semplici, i t-test sono solo un caso speciale di ANOVA: fare un ANOVA avrà lo stesso risultato di test multipli di t. Esistono tre classi di modelli ANOVA: a) Modelli a effetti fissi che presuppongono che i dati provengano da popolazioni normali, che differiscono solo per i loro mezzi; b) Modelli a effetti casuali che presuppongono che i dati descrivano una gerarchia di popolazioni diverse le cui differenze sono limitate dalla gerarchia; e, c) Modelli ad effetto misto che sono situazioni in cui sono presenti sia gli effetti fissi che quelli casuali.

Sommario:

  1.  Il test t viene utilizzato per determinare se due medie o medie sono uguali o diversi. L'ANOVA è preferito quando si confrontano tre o più medie o medie.
  2.  Un t-test ha più probabilità di commettere un errore più si usano i mezzi, ed è per questo che ANOVA viene usato quando si confrontano due o più mezzi.