MathematicsStatistica InferenzialeUniversity

Statistica della t di Student per Due Campioni (Campioni Indipendenti)

Q: What are common mistakes with the Statistica della t di Student per Due Campioni (Campioni Indipendenti) formula?

Assumere varianze uguali quando le dimensioni del campione o le distribuzioni differiscono significativamente. Non riuscire a confermare che i campioni siano veramente indipendenti (ad esempio, utilizzandolo su dati appaiati). Utilizzare la formula standard della varianza pooled invece della versione non pooled.

Questa statistica determina se la differenza tra le medie di due gruppi indipendenti è statisticamente significativa quando le varianze della popolazione sono sconosciute.

Understand the formulaSee the free derivationOpen the full walkthrough

t = \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{\frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}}

Open Full Walkthrough Try Calculator

This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.

Core idea

Overview

Conosciuta anche come t-test di Welch, questa formula viene utilizzata per confrontare le medie di due campioni indipendenti sotto l'assunzione di varianze disuguali. Misura la distanza tra la differenza osservata delle medie campionarie e la differenza ipotizzata della popolazione in unità di errore standard. Il valore t risultante viene quindi confrontato con una distribuzione t per determinare il valore p.

When to use: Utilizzare questo test quando si confrontano le medie di due gruppi indipendenti quando le deviazioni standard della popolazione sono sconosciute e non si possono assumere varianze uguali.

Why it matters: È uno strumento fondamentale nella ricerca scientifica e nei test A/B, che consente agli analisti di inferire differenze di popolazione da dati campionari limitati senza assumere omogeneità di varianza.

Symbols

Variables

t = t-statistic, $\overset{x}{ˉ}$ _1 = Mean of sample 1, $\overset{x}{ˉ}$ _2 = Mean of sample 2, $s_{1}^{2}$ = Variance of sample 1, $s_{2}^{2}$ = Variance of sample 2

t

t-statistic

Variable

\overset{x}{ˉ}_{1}

Mean of sample 1

Variable

\overset{x}{ˉ}_{2}

Mean of sample 2

Variable

s_{1}^{2}

Variance of sample 1

Variable

s_{2}^{2}

Variance of sample 2

Variable

n_{1}

Size of sample 1

Variable

n_{2}

Size of sample 2

Variable

diff

Hypothesized difference

Variable

Walkthrough

Derivation

Derivazione della Statistica del Test t a Due Campioni (Campioni Indipendenti)

Questa derivazione utilizza le proprietà delle distribuzioni campionarie per costruire una statistica di test che segue una distribuzione t standardizzando la differenza tra due medie campionarie.

I due campioni sono indipendenti l'uno dall'altro.
Le popolazioni da cui vengono tratti i campioni sono approssimativamente distribuite normalmente.
Le varianze della popolazione sono sconosciute, richiedendo l'uso delle varianze campionarie come stime.

Definire la Distribuzione Campionaria della Differenza tra Medie

Poiché le medie campionarie di popolazioni normali indipendenti sono a loro volta distribuite normalmente, la loro differenza segue una distribuzione normale centrata sulla differenza delle medie della popolazione con una varianza combinata.

(\overset{x}{ˉ}_{1} - \overset{x}{ˉ}_{2}) \sim N (μ_{1} - μ_{2}, \frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}})

Note: La varianza della differenza di due variabili indipendenti è la somma delle loro varianze individuali.

Standardizzazione (z-score)

Trasformiamo la differenza tra le medie campionarie in una variabile normale standard sottraendo il valore atteso e dividendo per l'errore standard.

Z = \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{\frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}}} \sim N (0, 1)

Note: Questo passaggio richiede la conoscenza delle varianze della popolazione, che sono solitamente sconosciute.

Sostituzione delle Varianze Campionarie

Poiché le varianze della popolazione sono sconosciute, le sostituiamo con le varianze campionarie $s_{1}^{2}$ e $s_{2}^{2}$ . Questa sostituzione converte la distribuzione Z in una distribuzione t.

t = \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{\frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}}

Note: Questo è noto come test t di Welch quando le varianze sono assunte disuguali; i gradi di libertà sono approssimati tramite l'equazione di Welch-Satterthwaite.

Result

t = \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{\frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}}

Source: Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.

Free formulas

Rearrangements

Solve for $\overset{x}{ˉ}_{1}$

Isolare $\overset{x}{ˉ}$ _1

\overset{x}{ˉ}_{1} = t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}} + \overset{x}{ˉ}_{2} + (μ_{1} - μ_{2})

Isolare la prima media campionaria moltiplicandola per l'errore standard e aggiungendo gli altri termini.

Difficulty: 3/5

Solve for $\overset{x}{ˉ}_{2}$

Isolare $\overset{x}{ˉ}$ _2

\overset{x}{ˉ}_{2} = \overset{x}{ˉ}_{1} - (μ_{1} - μ_{2}) - t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}

Riorganizza l'equazione per isolare bar_ $x_{2}$ .

Difficulty: 3/5

Solve for $μ_{1}$

Isolare $μ_{1}$

μ_{1} = (\overset{x}{ˉ}_{1} - \overset{x}{ˉ}_{2}) - t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}} + μ_{2}

Riorganizza l'equazione per isolare $μ_{1}$ .

Difficulty: 3/5

Solve for $μ_{2}$

Isolare $μ_{2}$

μ_{2} = μ_{1} - (\overset{x}{ˉ}_{1} - \overset{x}{ˉ}_{2}) + t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}

Riorganizza l'equazione per isolare $μ_{2}$ .

Difficulty: 3/5

Solve for $s_{1}$

Isolare $s_{1}$

s_{1} = n_{1} ([\frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t}]^{2} - \frac{s _{2}^{2}}{n _{2}})

Isolare il primo termine di varianza del campione elevando al quadrato entrambi i membri dopo l'isolamento algebrico.

Difficulty: 5/5

Solve for $s_{2}$

Isolare $s_{2}$

s_{2} = n_{2} ([\frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t}]^{2} - \frac{s _{1}^{2}}{n _{1}})

Isolare il termine della varianza del secondo campione seguendo passaggi simili a $s_{1}$ .

Difficulty: 5/5

Solve for $n_{1}$

Isolare $n_{1}$

n_{1} = \frac{s _{1}^{2}}{[ \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t} ] ^{2} - \frac{s _{2}^{2}}{n _{2}}}

Riorganizza l'equazione per isolare $n_{1}$ .

Difficulty: 5/5

Solve for $n_{2}$

Isolare $n_{2}$

n_{2} = \frac{s _{2}^{2}}{[ \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t} ] ^{2} - \frac{s _{1}^{2}}{n _{1}}}

Riorganizza l'equazione per isolare $n_{2}$ .

Difficulty: 5/5

The static page shows the finished rearrangements. The app keeps the full worked algebra walkthrough.

Why it behaves this way

Intuition

Immagina due distinte distribuzioni di probabilità a forma di campana che fluttuano su una linea numerica. Il numeratore misura la distanza fisica tra i loro picchi (centri). Il denominatore agisce come un "righello" che si restringe o si espande in base allo spread (incertezza/varianza) delle due distribuzioni; la statistica t è il numero di "lunghezze del righello" in base alle quali i due picchi sono separati.

Term

statistica t

La prima voce (t) in Derivazione della Statistica del Test t a Due Campioni (Campioni Indipendenti) va letta come il dato che aggancia il testo al modello matematico: prima si decide se sia nota o cercata, poi si controlla come modifica scala, verso e interpretazione del risultato.

Term

Differenza nelle medie del campione

Nella seconda voce (x̄₁ - x̄₂) di Derivazione della Statistica del Test t a Due Campioni (Campioni Indipendenti), il punto pratico consiste nel seguire il passaggio dall'enunciato alla formula; questa quantita non e una lettera isolata, ma un contributo coerente con ipotesi e unita.

Term

Nel ruolo della terza voce (μ₁ - μ₂), differenza ipotetica nella popolazione significa

Usa la terza voce (μ₁ - μ₂) in Derivazione della Statistica del Test t a Due Campioni (Campioni Indipendenti) per verificare quale parte del sistema sta cambiando. Se il suo valore aumenta o diminuisce, la relazione indica quale effetto attendersi sul calcolo finale.

Term

Somma degli errori standard quadrati

Per la quarta voce (s₁²/n₁ + s₂²/n₂) dentro Derivazione della Statistica del Test t a Due Campioni (Campioni Indipendenti), separa significato fisico e manipolazione algebrica: il simbolo entra nella formula solo dopo aver chiarito contesto, misura e vincoli del problema.

Signs and relationships

x̄₁ - x̄₂: Prima spiegazione: il vincolo x̄₁ - x̄₂ in Derivazione della Statistica del Test t a Due Campioni (Campioni Indipendenti) stabilisce quale operazione e ammessa e quale lettura va evitata. Prima di usare il risultato numerico, controlla verso, uguaglianza o condizione limite e mantieni coerente il significato della relazione.
Radice quadrata del denominatore: Seconda spiegazione: il vincolo Denominator square root in Derivazione della Statistica del Test t a Due Campioni (Campioni Indipendenti) stabilisce quale operazione e ammessa e quale lettura va evitata. Prima di usare il risultato numerico, controlla verso, uguaglianza o condizione limite e mantieni coerente il significato della relazione.

One free problem

Practice Problem

Vengono testati due gruppi. Gruppo 1: media=50, $s^{2}$ =10, n=20. Gruppo 2: media=45, $s^{2}$ =12, n=25. Assumendo che la differenza ipotizzata (mu1-mu2) sia 0, qual è la statistica t?

Hint: Calcolare il denominatore sommando s1^2/n1 e s2^2/n2, quindi estrarre la radice quadrata del risultato.

The full worked solution stays in the interactive walkthrough.

Where it shows up

Real-World Context

Un ricercatore medico confronta il tempo medio di recupero dei pazienti che utilizzano un nuovo farmaco con un gruppo placebo per vedere se il farmaco influisce significativamente sul recupero.

Study smarter

Tips

Verificare sempre la normalità se le dimensioni del campione sono piccole (n < 30).
Utilizzare l'equazione di Welch-Satterthwaite per calcolare i gradi di libertà per questo test.
Assicurarsi che i campioni siano indipendenti, il che significa che la selezione di un soggetto non influenza la selezione di un altro.

Avoid these traps

Common Mistakes

Assumere varianze uguali quando le dimensioni del campione o le distribuzioni differiscono significativamente.
Non riuscire a confermare che i campioni siano veramente indipendenti (ad esempio, utilizzandolo su dati appaiati).
Utilizzare la formula standard della varianza pooled invece della versione non pooled.

Common questions

Frequently Asked Questions

Questa derivazione utilizza le proprietà delle distribuzioni campionarie per costruire una statistica di test che segue una distribuzione t standardizzando la differenza tra due medie campionarie.

Utilizzare questo test quando si confrontano le medie di due gruppi indipendenti quando le deviazioni standard della popolazione sono sconosciute e non si possono assumere varianze uguali.

È uno strumento fondamentale nella ricerca scientifica e nei test A/B, che consente agli analisti di inferire differenze di popolazione da dati campionari limitati senza assumere omogeneità di varianza.

Assumere varianze uguali quando le dimensioni del campione o le distribuzioni differiscono significativamente. Non riuscire a confermare che i campioni siano veramente indipendenti (ad esempio, utilizzandolo su dati appaiati). Utilizzare la formula standard della varianza pooled invece della versione non pooled.

Un ricercatore medico confronta il tempo medio di recupero dei pazienti che utilizzano un nuovo farmaco con un gruppo placebo per vedere se il farmaco influisce significativamente sul recupero.

Verificare sempre la normalità se le dimensioni del campione sono piccole (n < 30). Utilizzare l'equazione di Welch-Satterthwaite per calcolare i gradi di libertà per questo test. Assicurarsi che i campioni siano indipendenti, il che significa che la selezione di un soggetto non influenza la selezione di un altro.

References

Sources

Rice, J. A. (2006). Mathematical Statistics and Data Analysis.
Welch, B. L. (1947). The generalization of 'Student's' problem when several different population variances are involved.
Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.

Statistica della t di Student per Due Campioni (Campioni Indipendenti)

Overview

Variables

Derivation

Definire la Distribuzione Campionaria della Differenza tra Medie

Standardizzazione (z-score)

Sostituzione delle Varianze Campionarie

Rearrangements

Intuition

Practice Problem

Real-World Context

Tips

Common Mistakes

Related Formulas

One-Sample t-Test

Pooled Two-Sample t-Test

Frequently Asked Questions

Sources