MathematicsEstadística InferencialUniversity

Estadístico t de Prueba para Dos Muestras (Muestras Independientes)

Este estadístico determina si la diferencia entre las medias de dos grupos independientes es estadísticamente significativa cuando las varianzas poblacionales son desconocidas.

Understand the formulaSee the free derivationOpen the full walkthrough

This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.

Core idea

Overview

También conocida como prueba t de Welch, esta fórmula se utiliza para comparar las medias de dos muestras independientes bajo la suposición de varianzas desiguales. Mide la distancia entre la diferencia observada de las medias de la muestra y la diferencia poblacional hipotetizada en unidades de error estándar. El valor t resultante se compara luego con una distribución t para determinar el valor p.

When to use: Utilice esta prueba al comparar las medias de dos grupos independientes cuando las desviaciones estándar poblacionales son desconocidas y no puede asumir varianzas iguales.

Why it matters: Es una herramienta fundamental en la investigación científica y las pruebas A/B, que permite a los analistas inferir diferencias poblacionales a partir de datos muestrales limitados sin asumir homogeneidad de varianza.

Symbols

Variables

t = t-statistic, _1 = Mean of sample 1, _2 = Mean of sample 2, = Variance of sample 1, = Variance of sample 2

t-statistic
Variable
Mean of sample 1
Variable
Mean of sample 2
Variable
Variance of sample 1
Variable
Variance of sample 2
Variable
Size of sample 1
Variable
Size of sample 2
Variable
diff
Hypothesized difference
Variable

Walkthrough

Derivation

Derivacion de Estadístico t de Prueba para Dos Muestras (Muestras Independientes)

Esta derivación utiliza las propiedades de las distribuciones muestrales para construir un estadístico de prueba que sigue una distribución t mediante la estandarización de la diferencia entre dos medias muestrales.

  • Las dos muestras son independientes entre sí.
  • Las poblaciones de las que se extraen las muestras están aproximadamente distribuidas normalmente.
  • Se desconocen las varianzas poblacionales, lo que requiere el uso de las varianzas muestrales como estimaciones.
1

Definir la distribución muestral de la diferencia de medias

Dado que las medias muestrales de poblaciones normales independientes están ellas mismas distribuidas normalmente, su diferencia sigue una distribución normal centrada en la diferencia de las medias poblacionales con una varianza combinada.

Note: La varianza de la diferencia de dos variables independientes es la suma de sus varianzas individuales.

2

Estandarización (puntuación Z)

Transformamos la diferencia en las medias muestrales en una variable normal estándar restando el valor esperado y dividiendo por el error estándar.

Note: Este paso requiere el conocimiento de las varianzas poblacionales, que suelen ser desconocidas.

3

Sustitución de varianzas muestrales

Como las varianzas poblacionales son desconocidas, las reemplazamos por las varianzas muestrales y . Esta sustitución convierte la distribución Z en una distribución t.

Note: Esto se conoce como la prueba t de Welch cuando se asume que las varianzas son desiguales; los grados de libertad se aproximan mediante la ecuación de Welch-Satterthwaite.

Result

Source: Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.

Free formulas

Rearrangements

Solve for

Despejar _1

Aísle la media de la primera muestra multiplicándola por el error estándar y sumando los demás términos.

Difficulty: 3/5

Solve for

Despejar _2

Reordena la ecuación para despejar bar_.

Difficulty: 3/5

Solve for

Despejar

Reordena la ecuación para despejar .

Difficulty: 3/5

Solve for

Despejar

Reordena la ecuación para despejar .

Difficulty: 3/5

Solve for

Despejar

Aísle el primer término de varianza muestral elevando al cuadrado ambos lados después del aislamiento algebraico.

Difficulty: 5/5

Solve for

Despejar

Aislar el segundo término de varianza muestral siguiendo pasos similares a .

Difficulty: 5/5

Solve for

Despejar

Reordena la ecuación para despejar .

Difficulty: 5/5

Solve for

Despejar

Reordena la ecuación para despejar .

Difficulty: 5/5

The static page shows the finished rearrangements. The app keeps the full worked algebra walkthrough.

Why it behaves this way

Intuition

Imagine dos distribuciones de probabilidad distintas en forma de campana flotando en una recta numérica. El numerador mide la distancia física entre sus picos (centros). El denominador actúa como una "regla" que se reduce o se expande según la dispersión (incertidumbre/varianza) de las dos distribuciones; la estadística t es el número de 'longitudes de regla' por las que se separan los dos picos.

Term
estadística t
Una relación señal-ruido: indica a cuántos errores estándar está la diferencia observada de la diferencia hipotética.
Term
Diferencia en las medias de la muestra
La 'señal' o la diferencia bruta observada entre los resultados promedio de los dos grupos.
Term
Diferencia hipotética en medias poblacionales
La 'línea de base nula'; generalmente cero, que representa el supuesto de que no existe una diferencia real entre los grupos.
Term
Suma de errores estándar al cuadrado
El 'ruido' o incertidumbre total en nuestra estimación, combinando cuánto varía cada grupo (s²) escalado por cuántos puntos de datos tenemos (n).

Signs and relationships

  • x̄₁ - x̄₂: La resta define la dirección de la diferencia; un resultado positivo indica que la media del primer grupo es mayor, mientras que un resultado negativo indica que el segundo es mayor.
  • Raíz cuadrada del denominador: Sumamos varianzas (s²/n) en lugar de desviaciones estándar porque las varianzas son aditivas; tomar la raíz cuadrada convierte la varianza total nuevamente a las mismas unidades que la media (error estándar).

One free problem

Practice Problem

Se prueban dos grupos. Grupo 1: media=50, =10, n=20. Grupo 2: media=45, =12, n=25. Asumiendo que la diferencia hipotetizada (mu1-mu2) es 0, ¿cuál es el estadístico t?

Hint: Calcule el denominador sumando s1^2/n1 y s2^2/n2, luego tome la raíz cuadrada del resultado.

The full worked solution stays in the interactive walkthrough.

Where it shows up

Real-World Context

Un investigador médico compara el tiempo medio de recuperación de los pacientes que usan un nuevo medicamento frente a un grupo de placebo para ver si el medicamento impacta significativamente en la recuperación.

Study smarter

Tips

  • Siempre verifique la normalidad si los tamaños de muestra son pequeños (n < 30).
  • Utilice la ecuación de Welch-Satterthwaite para calcular los grados de libertad para esta prueba.
  • Asegúrese de que las muestras sean independientes, lo que significa que la selección de un sujeto no influye en la selección de otro.

Avoid these traps

Common Mistakes

  • Asumir varianzas iguales cuando los tamaños de muestra o las distribuciones difieren significativamente.
  • No confirmar que las muestras son verdaderamente independientes (por ejemplo, usarla en datos pareados).
  • Usar la fórmula de varianza agrupada estándar en lugar de la versión no agrupada.

Common questions

Frequently Asked Questions

Esta derivación utiliza las propiedades de las distribuciones muestrales para construir un estadístico de prueba que sigue una distribución t mediante la estandarización de la diferencia entre dos medias muestrales.

Utilice esta prueba al comparar las medias de dos grupos independientes cuando las desviaciones estándar poblacionales son desconocidas y no puede asumir varianzas iguales.

Es una herramienta fundamental en la investigación científica y las pruebas A/B, que permite a los analistas inferir diferencias poblacionales a partir de datos muestrales limitados sin asumir homogeneidad de varianza.

Asumir varianzas iguales cuando los tamaños de muestra o las distribuciones difieren significativamente. No confirmar que las muestras son verdaderamente independientes (por ejemplo, usarla en datos pareados). Usar la fórmula de varianza agrupada estándar en lugar de la versión no agrupada.

Un investigador médico compara el tiempo medio de recuperación de los pacientes que usan un nuevo medicamento frente a un grupo de placebo para ver si el medicamento impacta significativamente en la recuperación.

Siempre verifique la normalidad si los tamaños de muestra son pequeños (n < 30). Utilice la ecuación de Welch-Satterthwaite para calcular los grados de libertad para esta prueba. Asegúrese de que las muestras sean independientes, lo que significa que la selección de un sujeto no influye en la selección de otro.

References

Sources

  1. Rice, J. A. (2006). Mathematical Statistics and Data Analysis.
  2. Welch, B. L. (1947). The generalization of 'Student's' problem when several different population variances are involved.
  3. Welch, B. L. (1947). 'The generalization of 'Student's' problem when several different population variances are involved'.