Statistica della t di Student per Due Campioni (Campioni Indipendenti)
Questa statistica determina se la differenza tra le medie di due gruppi indipendenti è statisticamente significativa quando le varianze della popolazione sono sconosciute.
This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.
Core idea
Overview
Conosciuta anche come t-test di Welch, questa formula viene utilizzata per confrontare le medie di due campioni indipendenti sotto l'assunzione di varianze disuguali. Misura la distanza tra la differenza osservata delle medie campionarie e la differenza ipotizzata della popolazione in unità di errore standard. Il valore t risultante viene quindi confrontato con una distribuzione t per determinare il valore p.
When to use: Utilizzare questo test quando si confrontano le medie di due gruppi indipendenti quando le deviazioni standard della popolazione sono sconosciute e non si possono assumere varianze uguali.
Why it matters: È uno strumento fondamentale nella ricerca scientifica e nei test A/B, che consente agli analisti di inferire differenze di popolazione da dati campionari limitati senza assumere omogeneità di varianza.
Symbols
Variables
t = t-statistic, _1 = Mean of sample 1, _2 = Mean of sample 2, = Variance of sample 1, = Variance of sample 2
Walkthrough
Derivation
Derivazione della Statistica del Test t a Due Campioni (Campioni Indipendenti)
Questa derivazione utilizza le proprietà delle distribuzioni campionarie per costruire una statistica di test che segue una distribuzione t standardizzando la differenza tra due medie campionarie.
- I due campioni sono indipendenti l'uno dall'altro.
- Le popolazioni da cui vengono tratti i campioni sono approssimativamente distribuite normalmente.
- Le varianze della popolazione sono sconosciute, richiedendo l'uso delle varianze campionarie come stime.
Definire la Distribuzione Campionaria della Differenza tra Medie
Poiché le medie campionarie di popolazioni normali indipendenti sono a loro volta distribuite normalmente, la loro differenza segue una distribuzione normale centrata sulla differenza delle medie della popolazione con una varianza combinata.
Note: La varianza della differenza di due variabili indipendenti è la somma delle loro varianze individuali.
Standardizzazione (z-score)
Trasformiamo la differenza tra le medie campionarie in una variabile normale standard sottraendo il valore atteso e dividendo per l'errore standard.
Note: Questo passaggio richiede la conoscenza delle varianze della popolazione, che sono solitamente sconosciute.
Sostituzione delle Varianze Campionarie
Poiché le varianze della popolazione sono sconosciute, le sostituiamo con le varianze campionarie e . Questa sostituzione converte la distribuzione Z in una distribuzione t.
Note: Questo è noto come test t di Welch quando le varianze sono assunte disuguali; i gradi di libertà sono approssimati tramite l'equazione di Welch-Satterthwaite.
Result
Source: Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.
Free formulas
Rearrangements
Solve for
Isolare _1
Isolare la prima media campionaria moltiplicandola per l'errore standard e aggiungendo gli altri termini.
Difficulty: 3/5
Solve for
Isolare _2
Riorganizza l'equazione per isolare bar_.
Difficulty: 3/5
Solve for
Isolare
Riorganizza l'equazione per isolare .
Difficulty: 3/5
Solve for
Isolare
Riorganizza l'equazione per isolare .
Difficulty: 3/5
Solve for
Isolare
Isolare il primo termine di varianza del campione elevando al quadrato entrambi i membri dopo l'isolamento algebrico.
Difficulty: 5/5
Solve for
Isolare
Isolare il termine della varianza del secondo campione seguendo passaggi simili a .
Difficulty: 5/5
Solve for
Isolare
Riorganizza l'equazione per isolare .
Difficulty: 5/5
Solve for
Isolare
Riorganizza l'equazione per isolare .
Difficulty: 5/5
The static page shows the finished rearrangements. The app keeps the full worked algebra walkthrough.
Why it behaves this way
Intuition
Immagina due distinte distribuzioni di probabilità a forma di campana che fluttuano su una linea numerica. Il numeratore misura la distanza fisica tra i loro picchi (centri). Il denominatore agisce come un "righello" che si restringe o si espande in base allo spread (incertezza/varianza) delle due distribuzioni; la statistica t è il numero di "lunghezze del righello" in base alle quali i due picchi sono separati.
Signs and relationships
- x̄₁ - x̄₂: Prima spiegazione: il vincolo x̄₁ - x̄₂ in Derivazione della Statistica del Test t a Due Campioni (Campioni Indipendenti) stabilisce quale operazione e ammessa e quale lettura va evitata. Prima di usare il risultato numerico, controlla verso, uguaglianza o condizione limite e mantieni coerente il significato della relazione.
- Radice quadrata del denominatore: Seconda spiegazione: il vincolo Denominator square root in Derivazione della Statistica del Test t a Due Campioni (Campioni Indipendenti) stabilisce quale operazione e ammessa e quale lettura va evitata. Prima di usare il risultato numerico, controlla verso, uguaglianza o condizione limite e mantieni coerente il significato della relazione.
One free problem
Practice Problem
Vengono testati due gruppi. Gruppo 1: media=50, =10, n=20. Gruppo 2: media=45, =12, n=25. Assumendo che la differenza ipotizzata (mu1-mu2) sia 0, qual è la statistica t?
Hint: Calcolare il denominatore sommando s1^2/n1 e s2^2/n2, quindi estrarre la radice quadrata del risultato.
The full worked solution stays in the interactive walkthrough.
Where it shows up
Real-World Context
Un ricercatore medico confronta il tempo medio di recupero dei pazienti che utilizzano un nuovo farmaco con un gruppo placebo per vedere se il farmaco influisce significativamente sul recupero.
Study smarter
Tips
- Verificare sempre la normalità se le dimensioni del campione sono piccole (n < 30).
- Utilizzare l'equazione di Welch-Satterthwaite per calcolare i gradi di libertà per questo test.
- Assicurarsi che i campioni siano indipendenti, il che significa che la selezione di un soggetto non influenza la selezione di un altro.
Avoid these traps
Common Mistakes
- Assumere varianze uguali quando le dimensioni del campione o le distribuzioni differiscono significativamente.
- Non riuscire a confermare che i campioni siano veramente indipendenti (ad esempio, utilizzandolo su dati appaiati).
- Utilizzare la formula standard della varianza pooled invece della versione non pooled.
Common questions
Frequently Asked Questions
Questa derivazione utilizza le proprietà delle distribuzioni campionarie per costruire una statistica di test che segue una distribuzione t standardizzando la differenza tra due medie campionarie.
Utilizzare questo test quando si confrontano le medie di due gruppi indipendenti quando le deviazioni standard della popolazione sono sconosciute e non si possono assumere varianze uguali.
È uno strumento fondamentale nella ricerca scientifica e nei test A/B, che consente agli analisti di inferire differenze di popolazione da dati campionari limitati senza assumere omogeneità di varianza.
Assumere varianze uguali quando le dimensioni del campione o le distribuzioni differiscono significativamente. Non riuscire a confermare che i campioni siano veramente indipendenti (ad esempio, utilizzandolo su dati appaiati). Utilizzare la formula standard della varianza pooled invece della versione non pooled.
Un ricercatore medico confronta il tempo medio di recupero dei pazienti che utilizzano un nuovo farmaco con un gruppo placebo per vedere se il farmaco influisce significativamente sul recupero.
Verificare sempre la normalità se le dimensioni del campione sono piccole (n < 30). Utilizzare l'equazione di Welch-Satterthwaite per calcolare i gradi di libertà per questo test. Assicurarsi che i campioni siano indipendenti, il che significa che la selezione di un soggetto non influenza la selezione di un altro.
References
Sources
- Rice, J. A. (2006). Mathematical Statistics and Data Analysis.
- Welch, B. L. (1947). The generalization of 'Student's' problem when several different population variances are involved.
- Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.