Estadístico t de Prueba para Dos Muestras (Muestras Independientes)
Este estadístico determina si la diferencia entre las medias de dos grupos independientes es estadísticamente significativa cuando las varianzas poblacionales son desconocidas.
This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.
Core idea
Overview
También conocida como prueba t de Welch, esta fórmula se utiliza para comparar las medias de dos muestras independientes bajo la suposición de varianzas desiguales. Mide la distancia entre la diferencia observada de las medias de la muestra y la diferencia poblacional hipotetizada en unidades de error estándar. El valor t resultante se compara luego con una distribución t para determinar el valor p.
When to use: Utilice esta prueba al comparar las medias de dos grupos independientes cuando las desviaciones estándar poblacionales son desconocidas y no puede asumir varianzas iguales.
Why it matters: Es una herramienta fundamental en la investigación científica y las pruebas A/B, que permite a los analistas inferir diferencias poblacionales a partir de datos muestrales limitados sin asumir homogeneidad de varianza.
Symbols
Variables
t = t-statistic, _1 = Mean of sample 1, _2 = Mean of sample 2, = Variance of sample 1, = Variance of sample 2
Walkthrough
Derivation
Derivacion de Estadístico t de Prueba para Dos Muestras (Muestras Independientes)
Esta derivación utiliza las propiedades de las distribuciones muestrales para construir un estadístico de prueba que sigue una distribución t mediante la estandarización de la diferencia entre dos medias muestrales.
- Las dos muestras son independientes entre sí.
- Las poblaciones de las que se extraen las muestras están aproximadamente distribuidas normalmente.
- Se desconocen las varianzas poblacionales, lo que requiere el uso de las varianzas muestrales como estimaciones.
Definir la distribución muestral de la diferencia de medias
Dado que las medias muestrales de poblaciones normales independientes están ellas mismas distribuidas normalmente, su diferencia sigue una distribución normal centrada en la diferencia de las medias poblacionales con una varianza combinada.
Note: La varianza de la diferencia de dos variables independientes es la suma de sus varianzas individuales.
Estandarización (puntuación Z)
Transformamos la diferencia en las medias muestrales en una variable normal estándar restando el valor esperado y dividiendo por el error estándar.
Note: Este paso requiere el conocimiento de las varianzas poblacionales, que suelen ser desconocidas.
Sustitución de varianzas muestrales
Como las varianzas poblacionales son desconocidas, las reemplazamos por las varianzas muestrales y . Esta sustitución convierte la distribución Z en una distribución t.
Note: Esto se conoce como la prueba t de Welch cuando se asume que las varianzas son desiguales; los grados de libertad se aproximan mediante la ecuación de Welch-Satterthwaite.
Result
Source: Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.
Free formulas
Rearrangements
Solve for
Despejar _1
Aísle la media de la primera muestra multiplicándola por el error estándar y sumando los demás términos.
Difficulty: 3/5
Solve for
Despejar _2
Reordena la ecuación para despejar bar_.
Difficulty: 3/5
Solve for
Despejar
Reordena la ecuación para despejar .
Difficulty: 3/5
Solve for
Despejar
Reordena la ecuación para despejar .
Difficulty: 3/5
Solve for
Despejar
Aísle el primer término de varianza muestral elevando al cuadrado ambos lados después del aislamiento algebraico.
Difficulty: 5/5
Solve for
Despejar
Aislar el segundo término de varianza muestral siguiendo pasos similares a .
Difficulty: 5/5
Solve for
Despejar
Reordena la ecuación para despejar .
Difficulty: 5/5
Solve for
Despejar
Reordena la ecuación para despejar .
Difficulty: 5/5
The static page shows the finished rearrangements. The app keeps the full worked algebra walkthrough.
Why it behaves this way
Intuition
Imagine dos distribuciones de probabilidad distintas en forma de campana flotando en una recta numérica. El numerador mide la distancia física entre sus picos (centros). El denominador actúa como una "regla" que se reduce o se expande según la dispersión (incertidumbre/varianza) de las dos distribuciones; la estadística t es el número de 'longitudes de regla' por las que se separan los dos picos.
Signs and relationships
- x̄₁ - x̄₂: La resta define la dirección de la diferencia; un resultado positivo indica que la media del primer grupo es mayor, mientras que un resultado negativo indica que el segundo es mayor.
- Raíz cuadrada del denominador: Sumamos varianzas (s²/n) en lugar de desviaciones estándar porque las varianzas son aditivas; tomar la raíz cuadrada convierte la varianza total nuevamente a las mismas unidades que la media (error estándar).
One free problem
Practice Problem
Se prueban dos grupos. Grupo 1: media=50, =10, n=20. Grupo 2: media=45, =12, n=25. Asumiendo que la diferencia hipotetizada (mu1-mu2) es 0, ¿cuál es el estadístico t?
Hint: Calcule el denominador sumando s1^2/n1 y s2^2/n2, luego tome la raíz cuadrada del resultado.
The full worked solution stays in the interactive walkthrough.
Where it shows up
Real-World Context
Un investigador médico compara el tiempo medio de recuperación de los pacientes que usan un nuevo medicamento frente a un grupo de placebo para ver si el medicamento impacta significativamente en la recuperación.
Study smarter
Tips
- Siempre verifique la normalidad si los tamaños de muestra son pequeños (n < 30).
- Utilice la ecuación de Welch-Satterthwaite para calcular los grados de libertad para esta prueba.
- Asegúrese de que las muestras sean independientes, lo que significa que la selección de un sujeto no influye en la selección de otro.
Avoid these traps
Common Mistakes
- Asumir varianzas iguales cuando los tamaños de muestra o las distribuciones difieren significativamente.
- No confirmar que las muestras son verdaderamente independientes (por ejemplo, usarla en datos pareados).
- Usar la fórmula de varianza agrupada estándar en lugar de la versión no agrupada.
Common questions
Frequently Asked Questions
Esta derivación utiliza las propiedades de las distribuciones muestrales para construir un estadístico de prueba que sigue una distribución t mediante la estandarización de la diferencia entre dos medias muestrales.
Utilice esta prueba al comparar las medias de dos grupos independientes cuando las desviaciones estándar poblacionales son desconocidas y no puede asumir varianzas iguales.
Es una herramienta fundamental en la investigación científica y las pruebas A/B, que permite a los analistas inferir diferencias poblacionales a partir de datos muestrales limitados sin asumir homogeneidad de varianza.
Asumir varianzas iguales cuando los tamaños de muestra o las distribuciones difieren significativamente. No confirmar que las muestras son verdaderamente independientes (por ejemplo, usarla en datos pareados). Usar la fórmula de varianza agrupada estándar en lugar de la versión no agrupada.
Un investigador médico compara el tiempo medio de recuperación de los pacientes que usan un nuevo medicamento frente a un grupo de placebo para ver si el medicamento impacta significativamente en la recuperación.
Siempre verifique la normalidad si los tamaños de muestra son pequeños (n < 30). Utilice la ecuación de Welch-Satterthwaite para calcular los grados de libertad para esta prueba. Asegúrese de que las muestras sean independientes, lo que significa que la selección de un sujeto no influye en la selección de otro.
References
Sources
- Rice, J. A. (2006). Mathematical Statistics and Data Analysis.
- Welch, B. L. (1947). The generalization of 'Student's' problem when several different population variances are involved.
- Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.