MathematicsStatistiques inférentiellesUniversity

Statistique du test t pour deux échantillons (échantillons indépendants)

Cette statistique détermine si la différence entre les moyennes de deux groupes indépendants est statistiquement significative lorsque les variances de la population sont inconnues.

Understand the formulaSee the free derivationOpen the full walkthrough

This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.

Core idea

Overview

Également connu sous le nom de test t de Welch, cette formule est utilisée pour comparer les moyennes de deux échantillons indépendants sous l'hypothèse de variances inégales. Elle mesure la distance entre la différence observée des moyennes d'échantillons et la différence de population hypothétique en unités d'erreur standard. La valeur t obtenue est ensuite comparée à une distribution t pour déterminer la valeur p.

When to use: Utilisez ce test lorsque vous comparez les moyennes de deux groupes indépendants lorsque les écarts types de la population sont inconnus et que vous ne pouvez pas supposer des variances égales.

Why it matters: C'est un outil fondamental en recherche scientifique et en tests A/B, permettant aux analystes de déduire des différences de population à partir de données d'échantillons limitées sans supposer l'homogénéité de la variance.

Symbols

Variables

t = t-statistic, _1 = Mean of sample 1, _2 = Mean of sample 2, = Variance of sample 1, = Variance of sample 2

t-statistic
Variable
Mean of sample 1
Variable
Mean of sample 2
Variable
Variance of sample 1
Variable
Variance of sample 2
Variable
Size of sample 1
Variable
Size of sample 2
Variable
diff
Hypothesized difference
Variable

Walkthrough

Derivation

Dérivation de la statistique de test t pour deux échantillons (échantillons indépendants)

Cette dérivation utilise les propriétés des distributions d'échantillonnage pour construire une statistique de test qui suit une distribution t en standardisant la différence entre deux moyennes d'échantillon.

  • Les deux échantillons sont indépendants l'un de l'autre.
  • Les populations à partir desquelles les échantillons sont tirés sont approximativement normalement distribuées.
  • Les variances de population sont inconnues, nécessitant l'utilisation des variances d'échantillon comme estimations.
1

Définir la distribution d'échantillonnage de la différence des moyennes

Puisque les moyennes d'échantillon de populations normales indépendantes sont elles-mêmes normalement distribuées, leur différence suit une distribution normale centrée sur la différence des moyennes de population avec une variance combinée.

Note: La variance de la différence de deux variables indépendantes est la somme de leurs variances individuelles.

2

Standardisation (Score Z)

Nous transformons la différence des moyennes d'échantillon en une variable normale standard en soustrayant la valeur attendue et en divisant par l'erreur type.

Note: Cette étape nécessite la connaissance des variances de population, qui sont généralement inconnues.

3

Substitution des variances d'échantillon

Puisque les variances de population sont inconnues, nous les remplaçons par les variances d'échantillon et . Cette substitution convertit la distribution Z en une distribution t.

Note: Ceci est connu sous le nom de test t de Welch lorsque les variances sont supposées inégales ; les degrés de liberté sont approximés via l'équation de Welch-Satterthwaite.

Result

Source: Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.

Free formulas

Rearrangements

Solve for

Isoler _1

Isolez la moyenne du premier échantillon en multipliant par l'erreur type et en ajoutant les autres termes.

Difficulty: 3/5

Solve for

Isoler _2

Réarrange l'équation pour isoler bar_.

Difficulty: 3/5

Solve for

Isoler

Réarrange l'équation pour isoler .

Difficulty: 3/5

Solve for

Isoler

Réarrange l'équation pour isoler .

Difficulty: 3/5

Solve for

Isoler

Isolez le premier terme de variance de l'échantillon en mettant au carré les deux côtés après l'isolation algébrique.

Difficulty: 5/5

Solve for

Isoler

Isolez le deuxième terme de variance d'échantillon en suivant des étapes similaires à .

Difficulty: 5/5

Solve for

Isoler

Réarrange l'équation pour isoler .

Difficulty: 5/5

Solve for

Isoler

Réarrange l'équation pour isoler .

Difficulty: 5/5

The static page shows the finished rearrangements. The app keeps the full worked algebra walkthrough.

Why it behaves this way

Intuition

Imaginez deux distributions de probabilité distinctes en forme de cloche flottant sur une droite numérique. Le numérateur mesure la distance physique entre leurs sommets (centres). Le dénominateur agit comme une « règle » qui rétrécit ou s'étend en fonction de l'étendue (incertitude/variance) des deux distributions ; la statistique t est le nombre de « longueurs de règle » par lequel les deux pics sont séparés.

Term
statistique t
Un rapport signal/bruit : il vous indique à combien d'erreurs types se trouve la différence observée par rapport à la différence hypothétique.
Term
Différence dans les moyennes de l'échantillon
Le « signal » ou la différence brute observée entre les résultats moyens des deux groupes.
Term
Différence hypothétique dans les moyennes de la population
La « ligne de base nulle » ; généralement zéro, ce qui représente l'hypothèse selon laquelle il n'y a pas de réelle différence entre les groupes.
Term
Somme des carrés des erreurs types
Le « bruit » total ou l'incertitude dans notre estimation, combinant la variation de chaque groupe (s²) en fonction du nombre de points de données dont nous disposons (n).

Signs and relationships

  • x̄₁ - x̄₂: La soustraction définit le sens de la différence ; un résultat positif indique que la moyenne du premier groupe est plus élevée, tandis qu'un résultat négatif indique que la moyenne du second est plus élevée.
  • Racine carrée du dénominateur: Nous additionnons les variances (s²/n) plutôt que les écarts types car les variances sont additives ; prendre la racine carrée reconvertit la variance totale dans les mêmes unités que la moyenne (erreur standard).

One free problem

Practice Problem

Deux groupes sont testés. Groupe 1 : mean=50, =10, n=20. Groupe 2 : mean=45, =12, n=25. En supposant que la différence hypothétique (mu1-mu2) est 0, quelle est la statistique t ?

Hint: Calculez le dénominateur en additionnant s1^2/n1 et s2^2/n2, puis prenez la racine carrée du résultat.

The full worked solution stays in the interactive walkthrough.

Where it shows up

Real-World Context

Un chercheur médical compare le temps de récupération moyen des patients utilisant un nouveau médicament par rapport à un groupe placebo pour voir si le médicament a un impact significatif sur la récupération.

Study smarter

Tips

  • Conseil : Always check for normality if sample sizes are small (n < 30).
  • Utilisez l'équation de Welch-Satterthwaite pour calculer les degrés de liberté pour ce test.
  • Assurez-vous que les échantillons sont indépendants, c'est-à-dire que la sélection d'un sujet n'influence pas la sélection d'un autre.

Avoid these traps

Common Mistakes

  • Erreur fréquente : Assuming equal variances when the sample sizes or distributions differ significantly.
  • Ne pas confirmer que les échantillons sont vraiment indépendants (par exemple, en l'utilisant sur des données appariées).
  • Erreur fréquente : Using the standard pooled variance formula instead of the unpooled version.

Common questions

Frequently Asked Questions

Cette dérivation utilise les propriétés des distributions d'échantillonnage pour construire une statistique de test qui suit une distribution t en standardisant la différence entre deux moyennes d'échantillon.

Utilisez ce test lorsque vous comparez les moyennes de deux groupes indépendants lorsque les écarts types de la population sont inconnus et que vous ne pouvez pas supposer des variances égales.

C'est un outil fondamental en recherche scientifique et en tests A/B, permettant aux analystes de déduire des différences de population à partir de données d'échantillons limitées sans supposer l'homogénéité de la variance.

Erreur fréquente : Assuming equal variances when the sample sizes or distributions differ significantly. Ne pas confirmer que les échantillons sont vraiment indépendants (par exemple, en l'utilisant sur des données appariées). Erreur fréquente : Using the standard pooled variance formula instead of the unpooled version.

Un chercheur médical compare le temps de récupération moyen des patients utilisant un nouveau médicament par rapport à un groupe placebo pour voir si le médicament a un impact significatif sur la récupération.

Conseil : Always check for normality if sample sizes are small (n < 30). Utilisez l'équation de Welch-Satterthwaite pour calculer les degrés de liberté pour ce test. Assurez-vous que les échantillons sont indépendants, c'est-à-dire que la sélection d'un sujet n'influence pas la sélection d'un autre.

References

Sources

  1. Rice, J. A. (2006). Mathematical Statistics and Data Analysis.
  2. Welch, B. L. (1947). The generalization of 'Student's' problem when several different population variances are involved.
  3. Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.