Statistique du test t pour deux échantillons (échantillons indépendants)
Cette statistique détermine si la différence entre les moyennes de deux groupes indépendants est statistiquement significative lorsque les variances de la population sont inconnues.
This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.
Core idea
Overview
Également connu sous le nom de test t de Welch, cette formule est utilisée pour comparer les moyennes de deux échantillons indépendants sous l'hypothèse de variances inégales. Elle mesure la distance entre la différence observée des moyennes d'échantillons et la différence de population hypothétique en unités d'erreur standard. La valeur t obtenue est ensuite comparée à une distribution t pour déterminer la valeur p.
When to use: Utilisez ce test lorsque vous comparez les moyennes de deux groupes indépendants lorsque les écarts types de la population sont inconnus et que vous ne pouvez pas supposer des variances égales.
Why it matters: C'est un outil fondamental en recherche scientifique et en tests A/B, permettant aux analystes de déduire des différences de population à partir de données d'échantillons limitées sans supposer l'homogénéité de la variance.
Symbols
Variables
t = t-statistic, _1 = Mean of sample 1, _2 = Mean of sample 2, = Variance of sample 1, = Variance of sample 2
Walkthrough
Derivation
Dérivation de la statistique de test t pour deux échantillons (échantillons indépendants)
Cette dérivation utilise les propriétés des distributions d'échantillonnage pour construire une statistique de test qui suit une distribution t en standardisant la différence entre deux moyennes d'échantillon.
- Les deux échantillons sont indépendants l'un de l'autre.
- Les populations à partir desquelles les échantillons sont tirés sont approximativement normalement distribuées.
- Les variances de population sont inconnues, nécessitant l'utilisation des variances d'échantillon comme estimations.
Définir la distribution d'échantillonnage de la différence des moyennes
Puisque les moyennes d'échantillon de populations normales indépendantes sont elles-mêmes normalement distribuées, leur différence suit une distribution normale centrée sur la différence des moyennes de population avec une variance combinée.
Note: La variance de la différence de deux variables indépendantes est la somme de leurs variances individuelles.
Standardisation (Score Z)
Nous transformons la différence des moyennes d'échantillon en une variable normale standard en soustrayant la valeur attendue et en divisant par l'erreur type.
Note: Cette étape nécessite la connaissance des variances de population, qui sont généralement inconnues.
Substitution des variances d'échantillon
Puisque les variances de population sont inconnues, nous les remplaçons par les variances d'échantillon et . Cette substitution convertit la distribution Z en une distribution t.
Note: Ceci est connu sous le nom de test t de Welch lorsque les variances sont supposées inégales ; les degrés de liberté sont approximés via l'équation de Welch-Satterthwaite.
Result
Source: Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.
Free formulas
Rearrangements
Solve for
Isoler _1
Isolez la moyenne du premier échantillon en multipliant par l'erreur type et en ajoutant les autres termes.
Difficulty: 3/5
Solve for
Isoler _2
Réarrange l'équation pour isoler bar_.
Difficulty: 3/5
Solve for
Isoler
Réarrange l'équation pour isoler .
Difficulty: 3/5
Solve for
Isoler
Réarrange l'équation pour isoler .
Difficulty: 3/5
Solve for
Isoler
Isolez le premier terme de variance de l'échantillon en mettant au carré les deux côtés après l'isolation algébrique.
Difficulty: 5/5
Solve for
Isoler
Isolez le deuxième terme de variance d'échantillon en suivant des étapes similaires à .
Difficulty: 5/5
Solve for
Isoler
Réarrange l'équation pour isoler .
Difficulty: 5/5
Solve for
Isoler
Réarrange l'équation pour isoler .
Difficulty: 5/5
The static page shows the finished rearrangements. The app keeps the full worked algebra walkthrough.
Why it behaves this way
Intuition
Imaginez deux distributions de probabilité distinctes en forme de cloche flottant sur une droite numérique. Le numérateur mesure la distance physique entre leurs sommets (centres). Le dénominateur agit comme une « règle » qui rétrécit ou s'étend en fonction de l'étendue (incertitude/variance) des deux distributions ; la statistique t est le nombre de « longueurs de règle » par lequel les deux pics sont séparés.
Signs and relationships
- x̄₁ - x̄₂: La soustraction définit le sens de la différence ; un résultat positif indique que la moyenne du premier groupe est plus élevée, tandis qu'un résultat négatif indique que la moyenne du second est plus élevée.
- Racine carrée du dénominateur: Nous additionnons les variances (s²/n) plutôt que les écarts types car les variances sont additives ; prendre la racine carrée reconvertit la variance totale dans les mêmes unités que la moyenne (erreur standard).
One free problem
Practice Problem
Deux groupes sont testés. Groupe 1 : mean=50, =10, n=20. Groupe 2 : mean=45, =12, n=25. En supposant que la différence hypothétique (mu1-mu2) est 0, quelle est la statistique t ?
Hint: Calculez le dénominateur en additionnant s1^2/n1 et s2^2/n2, puis prenez la racine carrée du résultat.
The full worked solution stays in the interactive walkthrough.
Where it shows up
Real-World Context
Un chercheur médical compare le temps de récupération moyen des patients utilisant un nouveau médicament par rapport à un groupe placebo pour voir si le médicament a un impact significatif sur la récupération.
Study smarter
Tips
- Conseil : Always check for normality if sample sizes are small (n < 30).
- Utilisez l'équation de Welch-Satterthwaite pour calculer les degrés de liberté pour ce test.
- Assurez-vous que les échantillons sont indépendants, c'est-à-dire que la sélection d'un sujet n'influence pas la sélection d'un autre.
Avoid these traps
Common Mistakes
- Erreur fréquente : Assuming equal variances when the sample sizes or distributions differ significantly.
- Ne pas confirmer que les échantillons sont vraiment indépendants (par exemple, en l'utilisant sur des données appariées).
- Erreur fréquente : Using the standard pooled variance formula instead of the unpooled version.
Common questions
Frequently Asked Questions
Cette dérivation utilise les propriétés des distributions d'échantillonnage pour construire une statistique de test qui suit une distribution t en standardisant la différence entre deux moyennes d'échantillon.
Utilisez ce test lorsque vous comparez les moyennes de deux groupes indépendants lorsque les écarts types de la population sont inconnus et que vous ne pouvez pas supposer des variances égales.
C'est un outil fondamental en recherche scientifique et en tests A/B, permettant aux analystes de déduire des différences de population à partir de données d'échantillons limitées sans supposer l'homogénéité de la variance.
Erreur fréquente : Assuming equal variances when the sample sizes or distributions differ significantly. Ne pas confirmer que les échantillons sont vraiment indépendants (par exemple, en l'utilisant sur des données appariées). Erreur fréquente : Using the standard pooled variance formula instead of the unpooled version.
Un chercheur médical compare le temps de récupération moyen des patients utilisant un nouveau médicament par rapport à un groupe placebo pour voir si le médicament a un impact significatif sur la récupération.
Conseil : Always check for normality if sample sizes are small (n < 30). Utilisez l'équation de Welch-Satterthwaite pour calculer les degrés de liberté pour ce test. Assurez-vous que les échantillons sont indépendants, c'est-à-dire que la sélection d'un sujet n'influence pas la sélection d'un autre.
References
Sources
- Rice, J. A. (2006). Mathematical Statistics and Data Analysis.
- Welch, B. L. (1947). The generalization of 'Student's' problem when several different population variances are involved.
- Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.