Estadístico t de Prueba para Dos Muestras (Muestras Independientes)

Q: What are common mistakes with the Estadístico t de Prueba para Dos Muestras (Muestras Independientes) formula?

Asumir varianzas iguales cuando los tamaños de muestra o las distribuciones difieren significativamente. No confirmar que las muestras son verdaderamente independientes (por ejemplo, usarla en datos pareados). Usar la fórmula de varianza agrupada estándar en lugar de la versión no agrupada.

Core idea

Overview

También conocida como prueba t de Welch, esta fórmula se utiliza para comparar las medias de dos muestras independientes bajo la suposición de varianzas desiguales. Mide la distancia entre la diferencia observada de las medias de la muestra y la diferencia poblacional hipotetizada en unidades de error estándar. El valor t resultante se compara luego con una distribución t para determinar el valor p.

When to use: Utilice esta prueba al comparar las medias de dos grupos independientes cuando las desviaciones estándar poblacionales son desconocidas y no puede asumir varianzas iguales.

Why it matters: Es una herramienta fundamental en la investigación científica y las pruebas A/B, que permite a los analistas inferir diferencias poblacionales a partir de datos muestrales limitados sin asumir homogeneidad de varianza.

Symbols

Variables

t = t-statistic, $\overset{x}{ˉ}$ _1 = Mean of sample 1, $\overset{x}{ˉ}$ _2 = Mean of sample 2, $s_{1}^{2}$ = Variance of sample 1, $s_{2}^{2}$ = Variance of sample 2

t

t-statistic

Variable

\overset{x}{ˉ}_{1}

Mean of sample 1

Variable

\overset{x}{ˉ}_{2}

Mean of sample 2

Variable

s_{1}^{2}

Variance of sample 1

Variable

s_{2}^{2}

Variance of sample 2

Variable

n_{1}

Size of sample 1

Variable

n_{2}

Size of sample 2

Variable

diff

Hypothesized difference

Variable

Walkthrough

Derivation

Derivacion de Estadístico t de Prueba para Dos Muestras (Muestras Independientes)

Esta derivación utiliza las propiedades de las distribuciones muestrales para construir un estadístico de prueba que sigue una distribución t mediante la estandarización de la diferencia entre dos medias muestrales.

Las dos muestras son independientes entre sí.
Las poblaciones de las que se extraen las muestras están aproximadamente distribuidas normalmente.
Se desconocen las varianzas poblacionales, lo que requiere el uso de las varianzas muestrales como estimaciones.

1

Definir la distribución muestral de la diferencia de medias

Dado que las medias muestrales de poblaciones normales independientes están ellas mismas distribuidas normalmente, su diferencia sigue una distribución normal centrada en la diferencia de las medias poblacionales con una varianza combinada.

(\overset{x}{ˉ}_{1} - \overset{x}{ˉ}_{2}) \sim N (μ_{1} - μ_{2}, \frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}})

Note: La varianza de la diferencia de dos variables independientes es la suma de sus varianzas individuales.

2

Estandarización (puntuación Z)

Transformamos la diferencia en las medias muestrales en una variable normal estándar restando el valor esperado y dividiendo por el error estándar.

Z = \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{\frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}}} \sim N (0, 1)

Note: Este paso requiere el conocimiento de las varianzas poblacionales, que suelen ser desconocidas.

3

Sustitución de varianzas muestrales

Como las varianzas poblacionales son desconocidas, las reemplazamos por las varianzas muestrales $s_{1}^{2}$ y $s_{2}^{2}$ . Esta sustitución convierte la distribución Z en una distribución t.

t = \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{\frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}}

Note: Esto se conoce como la prueba t de Welch cuando se asume que las varianzas son desiguales; los grados de libertad se aproximan mediante la ecuación de Welch-Satterthwaite.

Result

t = \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{\frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}}

Source: Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.

Free formulas

Rearrangements

Solve for $\overset{x}{ˉ}_{1}$

Despejar $\overset{x}{ˉ}$ _1

\overset{x}{ˉ}_{1} = t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}} + \overset{x}{ˉ}_{2} + (μ_{1} - μ_{2})

Aísle la media de la primera muestra multiplicándola por el error estándar y sumando los demás términos.

Difficulty: 3/5

Solve for $\overset{x}{ˉ}_{2}$

Despejar $\overset{x}{ˉ}$ _2

\overset{x}{ˉ}_{2} = \overset{x}{ˉ}_{1} - (μ_{1} - μ_{2}) - t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}

Reordena la ecuación para despejar bar_ $x_{2}$ .

Difficulty: 3/5

Solve for $μ_{1}$

Despejar $μ_{1}$

μ_{1} = (\overset{x}{ˉ}_{1} - \overset{x}{ˉ}_{2}) - t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}} + μ_{2}

Reordena la ecuación para despejar $μ_{1}$ .

Difficulty: 3/5

Solve for $μ_{2}$

Despejar $μ_{2}$

μ_{2} = μ_{1} - (\overset{x}{ˉ}_{1} - \overset{x}{ˉ}_{2}) + t \frac{s _{1}^{2}}{n _{1}} + \frac{s _{2}^{2}}{n _{2}}

Reordena la ecuación para despejar $μ_{2}$ .

Difficulty: 3/5

Solve for $s_{1}$

Despejar $s_{1}$

s_{1} = n_{1} ([\frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t}]^{2} - \frac{s _{2}^{2}}{n _{2}})

Aísle el primer término de varianza muestral elevando al cuadrado ambos lados después del aislamiento algebraico.

Difficulty: 5/5

Solve for $s_{2}$

Despejar $s_{2}$

s_{2} = n_{2} ([\frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t}]^{2} - \frac{s _{1}^{2}}{n _{1}})

Aislar el segundo término de varianza muestral siguiendo pasos similares a $s_{1}$ .

Difficulty: 5/5

Solve for $n_{1}$

Despejar $n_{1}$

n_{1} = \frac{s _{1}^{2}}{[ \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t} ] ^{2} - \frac{s _{2}^{2}}{n _{2}}}

Reordena la ecuación para despejar $n_{1}$ .

Difficulty: 5/5

Solve for $n_{2}$

Despejar $n_{2}$

n_{2} = \frac{s _{2}^{2}}{[ \frac{( x ˉ _{1} - x ˉ _{2} ) - ( μ _{1} - μ _{2} )}{t} ] ^{2} - \frac{s _{1}^{2}}{n _{1}}}

Reordena la ecuación para despejar $n_{2}$ .

Difficulty: 5/5

The static page shows the finished rearrangements. The app keeps the full worked algebra walkthrough.

Why it behaves this way

Intuition

Imagine dos distribuciones de probabilidad distintas en forma de campana flotando en una recta numérica. El numerador mide la distancia física entre sus picos (centros). El denominador actúa como una "regla" que se reduce o se expande según la dispersión (incertidumbre/varianza) de las dos distribuciones; la estadística t es el número de 'longitudes de regla' por las que se separan los dos picos.

Term

estadística t

Una relación señal-ruido: indica a cuántos errores estándar está la diferencia observada de la diferencia hipotética.

Term

Diferencia en las medias de la muestra

La 'señal' o la diferencia bruta observada entre los resultados promedio de los dos grupos.

Term

Diferencia hipotética en medias poblacionales

La 'línea de base nula'; generalmente cero, que representa el supuesto de que no existe una diferencia real entre los grupos.

Term

Suma de errores estándar al cuadrado

El 'ruido' o incertidumbre total en nuestra estimación, combinando cuánto varía cada grupo (s²) escalado por cuántos puntos de datos tenemos (n).

Signs and relationships

x̄₁ - x̄₂: La resta define la dirección de la diferencia; un resultado positivo indica que la media del primer grupo es mayor, mientras que un resultado negativo indica que el segundo es mayor.
Raíz cuadrada del denominador: Sumamos varianzas (s²/n) en lugar de desviaciones estándar porque las varianzas son aditivas; tomar la raíz cuadrada convierte la varianza total nuevamente a las mismas unidades que la media (error estándar).

One free problem

Practice Problem

Se prueban dos grupos. Grupo 1: media=50, $s^{2}$ =10, n=20. Grupo 2: media=45, $s^{2}$ =12, n=25. Asumiendo que la diferencia hipotetizada (mu1-mu2) es 0, ¿cuál es el estadístico t?

Hint: Calcule el denominador sumando s1^2/n1 y s2^2/n2, luego tome la raíz cuadrada del resultado.

The full worked solution stays in the interactive walkthrough.

Where it shows up

Real-World Context

Un investigador médico compara el tiempo medio de recuperación de los pacientes que usan un nuevo medicamento frente a un grupo de placebo para ver si el medicamento impacta significativamente en la recuperación.

Study smarter

Tips

Siempre verifique la normalidad si los tamaños de muestra son pequeños (n < 30).
Utilice la ecuación de Welch-Satterthwaite para calcular los grados de libertad para esta prueba.
Asegúrese de que las muestras sean independientes, lo que significa que la selección de un sujeto no influye en la selección de otro.

Avoid these traps

Common Mistakes

Asumir varianzas iguales cuando los tamaños de muestra o las distribuciones difieren significativamente.
No confirmar que las muestras son verdaderamente independientes (por ejemplo, usarla en datos pareados).
Usar la fórmula de varianza agrupada estándar en lugar de la versión no agrupada.

Keep going

Related Formulas

Common questions

Frequently Asked Questions

Esta derivación utiliza las propiedades de las distribuciones muestrales para construir un estadístico de prueba que sigue una distribución t mediante la estandarización de la diferencia entre dos medias muestrales.

Utilice esta prueba al comparar las medias de dos grupos independientes cuando las desviaciones estándar poblacionales son desconocidas y no puede asumir varianzas iguales.

Es una herramienta fundamental en la investigación científica y las pruebas A/B, que permite a los analistas inferir diferencias poblacionales a partir de datos muestrales limitados sin asumir homogeneidad de varianza.

Asumir varianzas iguales cuando los tamaños de muestra o las distribuciones difieren significativamente. No confirmar que las muestras son verdaderamente independientes (por ejemplo, usarla en datos pareados). Usar la fórmula de varianza agrupada estándar en lugar de la versión no agrupada.

Un investigador médico compara el tiempo medio de recuperación de los pacientes que usan un nuevo medicamento frente a un grupo de placebo para ver si el medicamento impacta significativamente en la recuperación.

Siempre verifique la normalidad si los tamaños de muestra son pequeños (n < 30). Utilice la ecuación de Welch-Satterthwaite para calcular los grados de libertad para esta prueba. Asegúrese de que las muestras sean independientes, lo que significa que la selección de un sujeto no influye en la selección de otro.

References

Sources

Rice, J. A. (2006). Mathematical Statistics and Data Analysis.
Welch, B. L. (1947). The generalization of 'Student's' problem when several different population variances are involved.
Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.

Overview

Variables

Derivation

Definir la distribución muestral de la diferencia de medias

Estandarización (puntuación Z)

Sustitución de varianzas muestrales

Rearrangements

Intuition

Practice Problem

Real-World Context

Tips

Common Mistakes

Related Formulas

One-Sample t-Test

Pooled Two-Sample t-Test

Frequently Asked Questions

Sources