Con Mi Profe: Julio Hurtado Marquez; EMAIL_TAREAS: juliohurtado210307@gmail.com
Para muestras grandes (n ≥ 30), el Teorema Central del Límite garantiza que la distribución muestral de la media es aproximadamente normal, incluso si la población no es normal. El estadístico de prueba es:
Z = (X̄ - μ₀) / (σ/√n)
Cuando σ es desconocida, se reemplaza por la desviación estándar muestral s (válido para n grande).
Contexto: Una fábrica de componentes electrónicos afirma que la resistencia media de sus componentes es de 100 MPa (megapascales). Un ingeniero de control de calidad sospecha que la resistencia media es mayor que el valor afirmado. Toma una muestra de 36 componentes y obtiene una media de 103 MPa con una desviación estándar de 9 MPa. Pruebe la hipótesis con α = 0.05.
H₀: μ = 100 MPa vs H₁: μ > 100 MPaPaso 2: Nivel de significancia
α = 0.05, z_{0.05} = 1.645
Paso 3: Estadístico de prueba
Z = (103 - 100) / (9/√36) = 3 / 1.5 = 2.00Paso 4: Región de rechazo y decisión
Z = 2.00 > 1.645 → Rechazamos H₀
Conclusión: Existe evidencia suficiente para afirmar que la resistencia media de los componentes es superior a 100 MPa.
# Parámetros n <- 36 x_bar <- 103 mu0 <- 100 s <- 9 alpha <- 0.05 # Estadístico de prueba z_calculado <- (x_bar - mu0) / (s / sqrt(n)) cat("Estadístico Z:", round(z_calculado, 4), "\n") # Valor crítico z_critico <- qnorm(1 - alpha) cat("Valor crítico:", round(z_critico, 4), "\n") # p-valor p_valor <- 1 - pnorm(z_calculado) cat("p-valor:", round(p_valor, 4), "\n") # Decisión if (z_calculado > z_critico) { cat("Rechazamos H₀: la media es mayor que 100 MPa") } else { cat("No rechazamos H₀") } # Visualización library(ggplot2) x <- seq(-3, 4, length.out = 500) df <- data.frame(x = x, y = dnorm(x)) ggplot(df, aes(x = x, y = y)) + geom_line(color = "blue", linewidth = 1) + geom_area(data = subset(df, x > z_critico), aes(x = x, y = y), fill = "red", alpha = 0.5) + geom_vline(xintercept = z_calculado, color = "darkgreen", linewidth = 1.2, linetype = "dashed") + geom_vline(xintercept = z_critico, color = "red", linewidth = 1, linetype = "dotted") + annotate("text", x = z_critico + 0.3, y = 0.1, label = "z_crítico", color = "red") + annotate("text", x = z_calculado + 0.3, y = 0.35, label = "z_calculado", color = "darkgreen") + labs(title = "Prueba de cola superior (Ingeniería)", x = "Z", y = "Densidad") + theme_minimal()
Contexto: Un fondo de inversión afirma que su rendimiento medio anual es del 12%. Un analista sospecha que el rendimiento medio es superior al afirmado. Analiza una muestra de 40 meses y obtiene un rendimiento medio del 13.5% con una desviación estándar del 4%. Pruebe la hipótesis con α = 0.01.
H₀: μ = 12% vs H₁: μ > 12%Paso 2: Nivel de significancia
α = 0.01, z_{0.01} = 2.326
Paso 3: Estadístico de prueba
Z = (13.5 - 12) / (4/√40) = 1.5 / 0.6325 = 2.37Paso 4: Región de rechazo y decisión
Z = 2.37 > 2.326 → Rechazamos H₀
Conclusión: Existe evidencia suficiente para afirmar que el rendimiento medio del fondo es superior al 12%.
# -*- coding: utf-8 -*- import numpy as np import matplotlib.pyplot as plt from scipy.stats import norm # Parámetros n = 40 x_bar = 13.5 mu0 = 12 s = 4 alpha = 0.01 # Estadístico de prueba z_calculado = (x_bar - mu0) / (s / np.sqrt(n)) print(f"Estadístico Z: {z_calculado:.4f}") # Valor crítico z_critico = norm.ppf(1 - alpha) print(f"Valor crítico: {z_critico:.4f}") # p-valor p_valor = 1 - norm.cdf(z_calculado) print(f"p-valor: {p_valor:.4f}") # Decisión if z_calculado > z_critico: print("Rechazamos H₀: la media es mayor que 12%") else: print("No rechazamos H₀") # Visualización x = np.linspace(-3, 4, 500) y = norm.pdf(x, 0, 1) plt.figure(figsize=(10, 5)) plt.plot(x, y, color='blue', linewidth=2) x_fill = np.linspace(z_critico, 4, 200) plt.fill_between(x_fill, 0, norm.pdf(x_fill), color='red', alpha=0.3) plt.axvline(x=z_calculado, color='green', linestyle='dashed', linewidth=2) plt.axvline(x=z_critico, color='red', linestyle='dotted', linewidth=1.5) plt.title('Prueba de cola superior (Ciencias Económicas)') plt.xlabel('Z') plt.ylabel('Densidad') plt.show()
Contexto: Un psicólogo afirma que una nueva terapia reduce el nivel de ansiedad. La escala de ansiedad tiene una media poblacional de 50 puntos. Se aplica la terapia a 35 pacientes y se obtiene una media de 46 puntos con una desviación estándar de 12 puntos. ¿Existe evidencia de que la terapia reduce el nivel de ansiedad? Pruebe con α = 0.05.
Nota: Este es un caso de cola inferior (menor ansiedad es mejor).
Paso 1: HipótesisH₀: μ = 50 vs H₁: μ < 50Paso 2: Nivel de significancia
α = 0.05, -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (46 - 50) / (12/√35) = -4 / 2.028 = -1.97Paso 4: Región de rechazo y decisión
Z = -1.97 < -1.645 → Rechazamos H₀
Conclusión: Existe evidencia suficiente para afirmar que la terapia reduce significativamente el nivel de ansiedad.
# Parámetros n <- 35 x_bar <- 46 mu0 <- 50 s <- 12 alpha <- 0.05 # Estadístico de prueba z_calculado <- (x_bar - mu0) / (s / sqrt(n)) cat("Estadístico Z:", round(z_calculado, 4), "\n") # Valor crítico (cola inferior) z_critico <- qnorm(alpha) cat("Valor crítico:", round(z_critico, 4), "\n") # p-valor p_valor <- pnorm(z_calculado) cat("p-valor:", round(p_valor, 4), "\n") # Decisión if (z_calculado < z_critico) { cat("Rechazamos H₀: la terapia reduce la ansiedad") } else { cat("No rechazamos H₀") } # Visualización x <- seq(-4, 3, length.out = 500) df <- data.frame(x = x, y = dnorm(x)) ggplot(df, aes(x = x, y = y)) + geom_line(color = "blue", linewidth = 1) + geom_area(data = subset(df, x < z_critico), aes(x = x, y = y), fill = "red", alpha = 0.5) + geom_vline(xintercept = z_calculado, color = "darkgreen", linewidth = 1.2, linetype = "dashed") + geom_vline(xintercept = z_critico, color = "red", linewidth = 1, linetype = "dotted") + labs(title = "Prueba de cola inferior (Ciencias de la Salud)", x = "Z", y = "Densidad") + theme_minimal()
Contexto: Un fabricante afirma que sus nuevos motores consumen en promedio 15 kWh por hora de operación. Un ingeniero sospecha que el consumo es menor al afirmado. Prueba 32 motores y obtiene un consumo medio de 14.2 kWh con una desviación estándar de 2.5 kWh. Pruebe con α = 0.01.
H₀: μ = 15 kWh vs H₁: μ < 15 kWhPaso 2: Nivel de significancia
α = 0.01, -z_{0.01} = -2.326
Paso 3: Estadístico de prueba
Z = (14.2 - 15) / (2.5/√32) = -0.8 / 0.442 = -1.81Paso 4: Decisión
Z = -1.81 > -2.326 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que el consumo medio es menor a 15 kWh.
Contexto: Una empresa afirma que sus costos operativos medios son de $500 por unidad. Un analista sospecha que los costos son menores. Analiza 45 unidades y obtiene un costo medio de $485 con una desviación estándar de $45. Pruebe con α = 0.05.
H₀: μ = 500 vs H₁: μ < 500Paso 2: Nivel de significancia
α = 0.05, -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (485 - 500) / (45/√45) = -15 / 6.708 = -2.236Paso 4: Decisión
Z = -2.236 < -1.645 → Rechazamos H₀
Conclusión: Existe evidencia suficiente para afirmar que los costos operativos medios son menores a $500.
Contexto: Un estudio previo indica que el nivel medio de estrés en empleados es de 65 puntos. Se implementa un programa de bienestar y se mide el estrés en 50 empleados, obteniendo una media de 62 puntos con desviación estándar de 10 puntos. ¿Existe evidencia de que el programa reduce el estrés? α = 0.05.
H₀: μ = 65 vs H₁: μ < 65Paso 2: Nivel de significancia
α = 0.05, -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (62 - 65) / (10/√50) = -3 / 1.414 = -2.12Paso 4: Decisión
Z = -2.12 < -1.645 → Rechazamos H₀
Conclusión: El programa de bienestar reduce significativamente los niveles de estrés.
Contexto: Una máquina debe producir piezas con longitud media de 10 cm. Un ingeniero sospecha que la máquina está descalibrada (la media es diferente). Toma 36 piezas y obtiene una media de 10.3 cm con desviación estándar de 1.2 cm. Pruebe con α = 0.05.
H₀: μ = 10 cm vs H₁: μ ≠ 10 cmPaso 2: Nivel de significancia
α = 0.05, z_{0.025} = 1.96
Paso 3: Estadístico de prueba
Z = (10.3 - 10) / (1.2/√36) = 0.3 / 0.2 = 1.50Paso 4: Región de rechazo y decisión
|Z| = 1.50 < 1.96 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que la máquina está descalibrada.
Contexto: Un economista afirma que el salario medio en un sector es de $2,500. Se toma una muestra de 64 trabajadores y se obtiene una media de $2,400 con una desviación estándar de $400. ¿Existe evidencia de que el salario medio es diferente? α = 0.01.
H₀: μ = 2500 vs H₁: μ ≠ 2500Paso 2: Nivel de significancia
α = 0.01, z_{0.005} = 2.576
Paso 3: Estadístico de prueba
Z = (2400 - 2500) / (400/√64) = -100 / 50 = -2.00Paso 4: Decisión
|Z| = 2.00 < 2.576 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que el salario medio es diferente de $2,500.
Contexto: Un test de memoria tiene una media poblacional de 100 puntos. Se aplica una intervención a 40 personas y se obtiene una media de 105 puntos con desviación estándar de 15 puntos. ¿Existe evidencia de que la intervención cambia la memoria (puede aumentar o disminuir)? α = 0.05.
H₀: μ = 100 vs H₁: μ ≠ 100Paso 2: Nivel de significancia
α = 0.05, z_{0.025} = 1.96
Paso 3: Estadístico de prueba
Z = (105 - 100) / (15/√40) = 5 / 2.372 = 2.11Paso 4: Decisión
|Z| = 2.11 > 1.96 → Rechazamos H₀
Conclusión: Existe evidencia suficiente para afirmar que la intervención tiene un efecto significativo sobre la memoria.
| Caso | Hipótesis | Estadístico Z | Región de rechazo | Regla de decisión |
|---|---|---|---|---|
| Cola superior | H₀: μ ≤ μ₀, H₁: μ > μ₀ | (X̄ - μ₀)/(σ/√n) | Z > z_α | Rechazar si Z > z_α |
| Cola inferior | H₀: μ ≥ μ₀, H₁: μ < μ₀ | (X̄ - μ₀)/(σ/√n) | Z < -z_α | Rechazar si Z < -z_α |
| Dos colas | H₀: μ = μ₀, H₁: μ ≠ μ₀ | (X̄ - μ₀)/(σ/√n) | Z < -z_{α/2} o Z > z_{α/2} | Rechazar si |
| α | z_α (una cola) | z_{α/2} (dos colas) |
|---|---|---|
| 0.10 | 1.282 | 1.645 |
| 0.05 | 1.645 | 1.960 |
| 0.025 | 1.960 | 2.241 |
| 0.01 | 2.326 | 2.576 |
| 0.005 | 2.576 | 2.807 |
Para muestras pequeñas (n < 30), cuando la población es aproximadamente normal y la varianza poblacional σ² es desconocida, se utiliza la distribución t-Student. El estadístico de prueba es:
t = (X̄ - μ₀) / (s/√n)
con v = n - 1 grados de libertad. La distribución t tiene colas más pesadas que la normal, lo que proporciona intervalos más amplios para muestras pequeñas.
Contexto: Un ingeniero civil afirma que la resistencia a la compresión de un nuevo concreto es superior a 28 MPa. Se prueban 15 muestras y se obtiene una media de 29.5 MPa con una desviación estándar de 2.8 MPa. Pruebe la hipótesis con α = 0.05. Suponga normalidad.
H₀: μ = 28 MPa vs H₁: μ > 28 MPaPaso 2: Nivel de significancia
α = 0.05, gl = 14, t_{0.05,14} = 1.761
Paso 3: Estadístico de prueba
t = (29.5 - 28) / (2.8/√15) = 1.5 / 0.723 = 2.075Paso 4: Región de rechazo y decisión
t = 2.075 > 1.761 → Rechazamos H₀
Conclusión: Existe evidencia suficiente para afirmar que la resistencia media del nuevo concreto es superior a 28 MPa.
# Parámetros n <- 15 x_bar <- 29.5 mu0 <- 28 s <- 2.8 alpha <- 0.05 gl <- n - 1 # Estadístico de prueba t_calculado <- (x_bar - mu0) / (s / sqrt(n)) cat("Estadístico t:", round(t_calculado, 4), "\n") # Valor crítico t_critico <- qt(1 - alpha, df = gl) cat("Valor crítico:", round(t_critico, 4), "\n") # p-valor p_valor <- 1 - pt(t_calculado, df = gl) cat("p-valor:", round(p_valor, 4), "\n") # Decisión if (t_calculado > t_critico) { cat("Rechazamos H₀: la media es mayor que 28 MPa") } else { cat("No rechazamos H₀") } # Visualización library(ggplot2) x <- seq(-4, 4, length.out = 500) df_plot <- data.frame(x = x, y = dt(x, df = gl)) ggplot(df_plot, aes(x = x, y = y)) + geom_line(color = "blue", linewidth = 1) + geom_area(data = subset(df_plot, x > t_critico), aes(x = x, y = y), fill = "red", alpha = 0.5) + geom_vline(xintercept = t_calculado, color = "darkgreen", linewidth = 1.2, linetype = "dashed") + geom_vline(xintercept = t_critico, color = "red", linewidth = 1, linetype = "dotted") + labs(title = "Prueba t de cola superior (Ingeniería)", x = "t", y = "Densidad") + theme_minimal()
Contexto: Un analista afirma que el rendimiento medio de un fondo de inversión es superior al 8% anual. Se toman datos de 12 meses y se obtiene una media del 9.2% con una desviación estándar del 2.5%. Pruebe con α = 0.05.
H₀: μ = 8% vs H₁: μ > 8%Paso 2: Nivel de significancia
α = 0.05, gl = 11, t_{0.05,11} = 1.796
Paso 3: Estadístico de prueba
t = (9.2 - 8) / (2.5/√12) = 1.2 / 0.722 = 1.662Paso 4: Decisión
t = 1.662 < 1.796 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que el rendimiento medio supera el 8%.
import numpy as np import matplotlib.pyplot as plt from scipy.stats import t # Parámetros n = 12 x_bar = 9.2 mu0 = 8 s = 2.5 alpha = 0.05 gl = n - 1 # Estadístico de prueba t_calculado = (x_bar - mu0) / (s / np.sqrt(n)) print(f"Estadístico t: {t_calculado:.4f}") # Valor crítico t_critico = t.ppf(1 - alpha, gl) print(f"Valor crítico: {t_critico:.4f}") # p-valor p_valor = 1 - t.cdf(t_calculado, gl) print(f"p-valor: {p_valor:.4f}") # Visualización x = np.linspace(-4, 4, 500) y = t.pdf(x, gl) plt.figure(figsize=(10, 5)) plt.plot(x, y, color='blue', linewidth=2) x_fill = np.linspace(t_critico, 4, 200) plt.fill_between(x_fill, 0, t.pdf(x_fill, gl), color='red', alpha=0.3) plt.axvline(x=t_calculado, color='green', linestyle='dashed', linewidth=2) plt.axvline(x=t_critico, color='red', linestyle='dotted', linewidth=1.5) plt.title('Prueba t de cola superior (Ciencias Económicas)') plt.xlabel('t') plt.ylabel('Densidad') plt.show()
Contexto: Se desarrolla un nuevo medicamento para reducir la presión arterial sistólica. Se sabe que la presión media en pacientes hipertensos es de 145 mmHg. Se prueba el medicamento en 10 pacientes y se obtiene una presión media de 138 mmHg con una desviación estándar de 8 mmHg. ¿Existe evidencia de que el medicamento reduce la presión? α = 0.01. (Nota: reducción significa presión menor)
Nota: Este es un caso de cola inferior (menor presión es mejor).
Paso 1: HipótesisH₀: μ = 145 mmHg vs H₁: μ < 145 mmHgPaso 2: Nivel de significancia
α = 0.01, gl = 9, -t_{0.01,9} = -2.821
Paso 3: Estadístico de prueba
t = (138 - 145) / (8/√10) = -7 / 2.529 = -2.77Paso 4: Región de rechazo y decisión
t = -2.77 > -2.821 → No rechazamos H₀
Conclusión: No hay suficiente evidencia al 1% para afirmar que el medicamento reduce la presión arterial.
Contexto: Un ingeniero industrial afirma que un nuevo método de ensamblaje reduce el tiempo medio por debajo de 12 minutos. Se prueba el método con 8 trabajadores y se obtiene un tiempo medio de 10.5 minutos con una desviación estándar de 2.2 minutos. Pruebe con α = 0.05.
H₀: μ = 12 min vs H₁: μ < 12 minPaso 2: Nivel de significancia
α = 0.05, gl = 7, -t_{0.05,7} = -1.895
Paso 3: Estadístico de prueba
t = (10.5 - 12) / (2.2/√8) = -1.5 / 0.778 = -1.928Paso 4: Decisión
t = -1.928 < -1.895 → Rechazamos H₀
Conclusión: Existe evidencia suficiente para afirmar que el nuevo método reduce el tiempo medio de ensamblaje por debajo de 12 minutos.
# Parámetros n <- 8 x_bar <- 10.5 mu0 <- 12 s <- 2.2 alpha <- 0.05 gl <- n - 1 t_calculado <- (x_bar - mu0) / (s / sqrt(n)) cat("Estadístico t:", round(t_calculado, 4), "\n") t_critico <- qt(alpha, df = gl) cat("Valor crítico:", round(t_critico, 4), "\n") p_valor <- pt(t_calculado, df = gl) cat("p-valor:", round(p_valor, 4), "\n") # Visualización x <- seq(-4, 4, length.out = 500) df_plot <- data.frame(x = x, y = dt(x, df = gl)) ggplot(df_plot, aes(x = x, y = y)) + geom_line(color = "blue", linewidth = 1) + geom_area(data = subset(df_plot, x < t_critico), aes(x = x, y = y), fill = "red", alpha = 0.5) + geom_vline(xintercept = t_calculado, color = "darkgreen", linewidth = 1.2, linetype = "dashed") + geom_vline(xintercept = t_critico, color = "red", linewidth = 1, linetype = "dotted") + labs(title = "Prueba t de cola inferior (Ingeniería)", x = "t", y = "Densidad") + theme_minimal()
Contexto: Un gerente afirma que los costos medios de producción son inferiores a $500 por unidad. Se toman 9 semanas de datos y se obtiene un costo medio de $480 con una desviación estándar de $35. Pruebe con α = 0.05.
H₀: μ = 500 vs H₁: μ < 500Paso 2: Nivel de significancia
α = 0.05, gl = 8, -t_{0.05,8} = -1.860
Paso 3: Estadístico de prueba
t = (480 - 500) / (35/√9) = -20 / 11.667 = -1.714Paso 4: Decisión
t = -1.714 > -1.860 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que los costos medios son inferiores a $500.
Contexto: Un psicólogo afirma que una terapia reduce la ansiedad por debajo de 30 puntos (escala de ansiedad). Se aplica la terapia a 12 pacientes y se obtiene una media de 27 puntos con una desviación estándar de 4.5 puntos. Pruebe con α = 0.01.
H₀: μ = 30 vs H₁: μ < 30Paso 2: Nivel de significancia
α = 0.01, gl = 11, -t_{0.01,11} = -2.718
Paso 3: Estadístico de prueba
t = (27 - 30) / (4.5/√12) = -3 / 1.299 = -2.309Paso 4: Decisión
t = -2.309 > -2.718 → No rechazamos H₀
Conclusión: No hay suficiente evidencia al 1% para afirmar que la terapia reduce la ansiedad por debajo de 30 puntos.
Contexto: Una máquina debe producir piezas con diámetro medio de 5 mm. Se sospecha que la máquina está descalibrada. Se miden 10 piezas y se obtiene un diámetro medio de 5.12 mm con una desviación estándar de 0.18 mm. Pruebe con α = 0.05.
H₀: μ = 5 mm vs H₁: μ ≠ 5 mmPaso 2: Nivel de significancia
α = 0.05, gl = 9, t_{0.025,9} = 2.262
Paso 3: Estadístico de prueba
t = (5.12 - 5) / (0.18/√10) = 0.12 / 0.0569 = 2.109Paso 4: Decisión
|t| = 2.109 < 2.262 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que la máquina está descalibrada.
import numpy as np import matplotlib.pyplot as plt from scipy.stats import t n = 10 x_bar = 5.12 mu0 = 5 s = 0.18 alpha = 0.05 gl = n - 1 t_calculado = (x_bar - mu0) / (s / np.sqrt(n)) print(f"Estadístico t: {abs(t_calculado):.4f}") t_critico = t.ppf(1 - alpha/2, gl) print(f"Valor crítico: {t_critico:.4f}") # Visualización x = np.linspace(-4, 4, 500) y = t.pdf(x, gl) plt.figure(figsize=(10, 5)) plt.plot(x, y, color='blue', linewidth=2) x_fill_left = np.linspace(-4, -t_critico, 200) x_fill_right = np.linspace(t_critico, 4, 200) plt.fill_between(x_fill_left, 0, t.pdf(x_fill_left, gl), color='red', alpha=0.3) plt.fill_between(x_fill_right, 0, t.pdf(x_fill_right, gl), color='red', alpha=0.3) plt.axvline(x=t_calculado, color='green', linestyle='dashed', linewidth=2) plt.axvline(x=-t_calculado, color='green', linestyle='dashed', linewidth=2) plt.axvline(x=t_critico, color='red', linestyle='dotted', linewidth=1.5) plt.axvline(x=-t_critico, color='red', linestyle='dotted', linewidth=1.5) plt.title('Prueba t de dos colas (Ingeniería)') plt.xlabel('t') plt.ylabel('Densidad') plt.show()
Contexto: Un sindicato afirma que el salario medio por hora es de $25. Se toma una muestra de 15 trabajadores y se obtiene un salario medio de $26.5 con una desviación estándar de $3.2. ¿Existe evidencia de que el salario medio es diferente? α = 0.10.
H₀: μ = 25 vs H₁: μ ≠ 25Paso 2: Nivel de significancia
α = 0.10, gl = 14, t_{0.05,14} = 1.761
Paso 3: Estadístico de prueba
t = (26.5 - 25) / (3.2/√15) = 1.5 / 0.826 = 1.815Paso 4: Decisión
|t| = 1.815 > 1.761 → Rechazamos H₀
Conclusión: Existe evidencia para afirmar que el salario medio es diferente de $25.
Contexto: Una intervención educativa busca cambiar el rendimiento en una prueba de matemáticas (media poblacional 70 puntos). Se aplica a 8 estudiantes y se obtiene una media de 73 puntos con una desviación estándar de 5 puntos. Pruebe si hubo cambio (aumento o disminución) con α = 0.05.
H₀: μ = 70 vs H₁: μ ≠ 70Paso 2: Nivel de significancia
α = 0.05, gl = 7, t_{0.025,7} = 2.365
Paso 3: Estadístico de prueba
t = (73 - 70) / (5/√8) = 3 / 1.768 = 1.697Paso 4: Decisión
|t| = 1.697 < 2.365 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que la intervención cambió significativamente el rendimiento.
| Caso | Hipótesis | Estadístico t | Región de rechazo | Grados de libertad |
|---|---|---|---|---|
| Cola superior | H₀: μ ≤ μ₀, H₁: μ > μ₀ | (X̄ - μ₀)/(s/√n) | t > t_{α, n-1} | n-1 |
| Cola inferior | H₀: μ ≥ μ₀, H₁: μ < μ₀ | (X̄ - μ₀)/(s/√n) | t < -t_{α, n-1} | n-1 |
| Dos colas | H₀: μ = μ₀, H₁: μ ≠ μ₀ | (X̄ - μ₀)/(s/√n) | t |
| gl | t_{0.10} | t_{0.05} | t_{0.025} | t_{0.01} | t_{0.005} |
|---|---|---|---|---|---|
| 7 | 1.415 | 1.895 | 2.365 | 2.998 | 3.499 |
| 8 | 1.397 | 1.860 | 2.306 | 2.896 | 3.355 |
| 9 | 1.383 | 1.833 | 2.262 | 2.821 | 3.250 |
| 10 | 1.372 | 1.812 | 2.228 | 2.764 | 3.169 |
| 11 | 1.363 | 1.796 | 2.201 | 2.718 | 3.106 |
| 14 | 1.345 | 1.761 | 2.145 | 2.624 | 2.977 |
Para muestras grandes (n₁ ≥ 30 y n₂ ≥ 30), el Teorema Central del Límite garantiza que la distribución muestral de la diferencia de medias es aproximadamente normal. El estadístico de prueba es:
Z = (X̄₁ - X̄₂) / √(σ₁²/n₁ + σ₂²/n₂)
Cuando las varianzas poblacionales σ₁² y σ₂² son desconocidas, se reemplazan por las varianzas muestrales s₁² y s₂² (válido para n grande).
Contexto: Un ingeniero industrial quiere determinar si el método A produce mayor resistencia a la tracción que el método B. Se prueban 40 muestras del método A (media = 85 MPa, s = 6 MPa) y 35 muestras del método B (media = 82 MPa, s = 5.5 MPa). Pruebe con α = 0.01.
H₀: μ_A - μ_B = 0 vs H₁: μ_A - μ_B > 0Paso 2: Nivel de significancia
α = 0.01, z_{0.01} = 2.326
Paso 3: Estadístico de prueba
Z = (85 - 82) / √(6²/40 + 5.5²/35) = 3 / √(0.9 + 0.864) = 3 / √1.764 = 3 / 1.328 = 2.26Paso 4: Región de rechazo y decisión
Z = 2.26 < 2.326 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que el método A produce mayor resistencia que el método B.
# Parámetros n1 <- 40; x1 <- 85; s1 <- 6 n2 <- 35; x2 <- 82; s2 <- 5.5 alpha <- 0.01 D0 <- 0 # Estadístico de prueba z_calculado <- (x1 - x2 - D0) / sqrt(s1^2/n1 + s2^2/n2) cat("Estadístico Z:", round(z_calculado, 4), "\n") # Valor crítico z_critico <- qnorm(1 - alpha) cat("Valor crítico:", round(z_critico, 4), "\n") # p-valor p_valor <- 1 - pnorm(z_calculado) cat("p-valor:", round(p_valor, 4), "\n") # Decisión if (z_calculado > z_critico) { cat("Rechazamos H₀: μ_A > μ_B") } else { cat("No rechazamos H₀") } # Visualización library(ggplot2) x <- seq(-3, 4, length.out = 500) df_plot <- data.frame(x = x, y = dnorm(x)) ggplot(df_plot, aes(x = x, y = y)) + geom_line(color = "blue", linewidth = 1) + geom_area(data = subset(df_plot, x > z_critico), aes(x = x, y = y), fill = "red", alpha = 0.5) + geom_vline(xintercept = z_calculado, color = "darkgreen", linewidth = 1.2, linetype = "dashed") + geom_vline(xintercept = z_critico, color = "red", linewidth = 1, linetype = "dotted") + labs(title = "Prueba de diferencia de medias (cola superior) - Ingeniería", x = "Z", y = "Densidad") + theme_minimal()
Contexto: Un analista afirma que el Fondo A tiene un rendimiento superior al Fondo B. Se toman 50 meses del Fondo A (media = 12.5%, s = 3.2%) y 45 meses del Fondo B (media = 11.8%, s = 3.5%). Pruebe con α = 0.05.
H₀: μ_A - μ_B = 0 vs H₁: μ_A - μ_B > 0Paso 2: Nivel de significancia
α = 0.05, z_{0.05} = 1.645
Paso 3: Estadístico de prueba
Z = (12.5 - 11.8) / √(3.2²/50 + 3.5²/45) = 0.7 / √(0.2048 + 0.2722) = 0.7 / √0.477 = 0.7 / 0.691 = 1.013Paso 4: Decisión
Z = 1.013 < 1.645 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que el Fondo A tiene mayor rendimiento que el Fondo B.
import numpy as np import matplotlib.pyplot as plt from scipy.stats import norm # Parámetros n1, x1, s1 = 50, 12.5, 3.2 n2, x2, s2 = 45, 11.8, 3.5 alpha = 0.05 D0 = 0 # Estadístico z_calc = (x1 - x2 - D0) / np.sqrt(s1**2/n1 + s2**2/n2) z_crit = norm.ppf(1 - alpha) p_valor = 1 - norm.cdf(z_calc) print(f"Z = {z_calc:.4f}, valor crítico = {z_crit:.4f}, p-valor = {p_valor:.4f}") # Visualización x = np.linspace(-3, 4, 500) y = norm.pdf(x) plt.figure(figsize=(10, 5)) plt.plot(x, y, color='blue', linewidth=2) x_fill = np.linspace(z_crit, 4, 200) plt.fill_between(x_fill, 0, norm.pdf(x_fill), color='red', alpha=0.3) plt.axvline(x=z_calc, color='green', linestyle='dashed', linewidth=2) plt.axvline(x=z_crit, color='red', linestyle='dotted', linewidth=1.5) plt.title('Prueba de diferencia de medias - Fondos de inversión') plt.xlabel('Z') plt.ylabel('Densidad') plt.show()
Contexto: Un psicólogo quiere determinar si la Terapia Cognitivo-Conductual (TCC) es más efectiva que la terapia tradicional para reducir la ansiedad (menor puntaje es mejor). Se evalúan 60 pacientes con TCC (media = 32, s = 8) y 55 con terapia tradicional (media = 35, s = 7.5). Compare con α = 0.05. (Nota: menor puntaje indica menos ansiedad)
H₀: μ_TCC - μ_Trad = 0 vs H₁: μ_TCC - μ_Trad < 0
Nota: La hipótesis alternativa indica que la TCC produce menor ansiedad (diferencia negativa).
Paso 2: Nivel de significanciaα = 0.05, -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (32 - 35) / √(8²/60 + 7.5²/55) = -3 / √(1.067 + 1.023) = -3 / √2.09 = -3 / 1.446 = -2.075Paso 4: Decisión
Z = -2.075 < -1.645 → Rechazamos H₀
Conclusión: Existe evidencia para afirmar que la TCC es más efectiva que la terapia tradicional para reducir la ansiedad.
# Datos n1 <- 60; x1 <- 32; s1 <- 8 n2 <- 55; x2 <- 35; s2 <- 7.5 alpha <- 0.05 z_calc <- (x1 - x2) / sqrt(s1^2/n1 + s2^2/n2) z_crit <- qnorm(alpha) # Cola inferior p_valor <- pnorm(z_calc) cat("Z =", round(z_calc, 4), "\n") cat("Valor crítico =", round(z_crit, 4), "\n") cat("p-valor =", round(p_valor, 4), "\n") if (z_calc < z_crit) { cat("Rechazamos H₀: la TCC reduce más la ansiedad") } else { cat("No rechazamos H₀") }
Contexto: Se quiere determinar si el motor A consume menos energía que el motor B. Se prueban 36 motores A (media = 120 kWh, s = 15 kWh) y 40 motores B (media = 125 kWh, s = 14 kWh). Pruebe con α = 0.01.
H₀: μ_A - μ_B = 0 vs H₁: μ_A - μ_B < 0Paso 2: Nivel de significancia
α = 0.01, -z_{0.01} = -2.326
Paso 3: Estadístico de prueba
Z = (120 - 125) / √(15²/36 + 14²/40) = -5 / √(6.25 + 4.9) = -5 / √11.15 = -5 / 3.339 = -1.497Paso 4: Decisión
Z = -1.497 > -2.326 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que el motor A consume menos energía que el motor B.
Contexto: Un gerente afirma que la Planta A tiene costos operativos medios inferiores a la Planta B. Se toman 45 días de la Planta A (media = $520, s = $45) y 50 días de la Planta B (media = $535, s = $50). Pruebe con α = 0.05.
H₀: μ_A - μ_B = 0 vs H₁: μ_A - μ_B < 0Paso 2: Nivel de significancia
α = 0.05, -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (520 - 535) / √(45²/45 + 50²/50) = -15 / √(45 + 50) = -15 / √95 = -15 / 9.747 = -1.539Paso 4: Decisión
Z = -1.539 > -1.645 → No rechazamos H₀
Conclusión: No hay suficiente evidencia para afirmar que la Planta A tiene costos inferiores.
Contexto: Se quiere determinar si el Grupo A (entrenado) tiene menor tiempo de reacción que el Grupo B (no entrenado). Se miden 60 personas del Grupo A (media = 0.32 s, s = 0.08 s) y 55 del Grupo B (media = 0.35 s, s = 0.09 s). Pruebe con α = 0.05.
H₀: μ_A - μ_B = 0 vs H₁: μ_A - μ_B < 0Paso 2: Nivel de significancia
α = 0.05, -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (0.32 - 0.35) / √(0.08²/60 + 0.09²/55) = -0.03 / √(0.000107 + 0.000147) = -0.03 / √0.000254 = -0.03 / 0.01594 = -1.882Paso 4: Decisión
Z = -1.882 < -1.645 → Rechazamos H₀
Conclusión: El grupo entrenado tiene un tiempo de reacción significativamente menor.
Contexto: Se quiere determinar si hay diferencia en la resistencia media de dos lotes de producción. Lote 1: n₁=38, x̄₁=92 MPa, s₁=5 MPa. Lote 2: n₂=42, x̄₂=90 MPa, s₂=4.8 MPa. Pruebe con α = 0.05.
H₀: μ₁ - μ₂ = 0 vs H₁: μ₁ - μ₂ ≠ 0Paso 2: Nivel de significancia
α = 0.05, z_{0.025} = 1.96
Paso 3: Estadístico de prueba
Z = (92 - 90) / √(5²/38 + 4.8²/42) = 2 / √(0.6579 + 0.5486) = 2 / √1.2065 = 2 / 1.098 = 1.822Paso 4: Decisión
|Z| = 1.822 < 1.96 → No rechazamos H₀
Conclusión: No hay evidencia suficiente para afirmar que existe diferencia en la resistencia media.
import numpy as np import matplotlib.pyplot as plt from scipy.stats import norm n1, x1, s1 = 38, 92, 5 n2, x2, s2 = 42, 90, 4.8 alpha = 0.05 z_calc = (x1 - x2) / np.sqrt(s1**2/n1 + s2**2/n2) z_crit = norm.ppf(1 - alpha/2) p_valor = 2 * (1 - norm.cdf(abs(z_calc))) print(f"Z = {z_calc:.4f}, valor crítico = {z_crit:.4f}, p-valor = {p_valor:.4f}") # Visualización x = np.linspace(-4, 4, 500) y = norm.pdf(x) plt.figure(figsize=(10, 5)) plt.plot(x, y, color='blue', linewidth=2) x_fill_left = np.linspace(-4, -z_crit, 200) x_fill_right = np.linspace(z_crit, 4, 200) plt.fill_between(x_fill_left, 0, norm.pdf(x_fill_left), color='red', alpha=0.3) plt.fill_between(x_fill_right, 0, norm.pdf(x_fill_right), color='red', alpha=0.3) plt.axvline(x=z_calc, color='green', linestyle='dashed', linewidth=2) plt.axvline(x=-z_calc, color='green', linestyle='dashed', linewidth=2) plt.axvline(x=z_crit, color='red', linestyle='dotted', linewidth=1.5) plt.axvline(x=-z_crit, color='red', linestyle='dotted', linewidth=1.5) plt.title('Prueba de dos colas para diferencia de medias - Calidad') plt.xlabel('Z') plt.ylabel('Densidad') plt.show()
Contexto: Se quiere determinar si hay diferencia en el salario medio entre el sector privado y público. Privado: n₁=100, x̄₁=$2,500, s₁=$400. Público: n₂=80, x̄₂=$2,600, s₂=$450. Pruebe con α = 0.05.
H₀: μ_Pv - μ_Pb = 0 vs H₁: μ_Pv - μ_Pb ≠ 0Paso 2: Nivel de significancia
α = 0.05, z_{0.025} = 1.96
Paso 3: Estadístico de prueba
Z = (2500 - 2600) / √(400²/100 + 450²/80) = -100 / √(1600 + 2531.25) = -100 / √4131.25 = -100 / 64.28 = -1.556Paso 4: Decisión
|Z| = 1.556 < 1.96 → No rechazamos H₀
Conclusión: No hay evidencia suficiente de diferencia salarial entre sectores.
Contexto: Se quiere comparar la efectividad de la Terapia A (cognitiva) vs Terapia B (conductual) en la reducción de síntomas depresivos (menor puntaje es mejor). Terapia A: n₁=45, x̄₁=28, s₁=6. Terapia B: n₂=50, x̄₂=30, s₂=7. Pruebe si hay diferencia con α = 0.05.
H₀: μ_A - μ_B = 0 vs H₁: μ_A - μ_B ≠ 0Paso 2: Nivel de significancia
α = 0.05, z_{0.025} = 1.96
Paso 3: Estadístico de prueba
Z = (28 - 30) / √(6²/45 + 7²/50) = -2 / √(0.8 + 0.98) = -2 / √1.78 = -2 / 1.334 = -1.499Paso 4: Decisión
|Z| = 1.499 < 1.96 → No rechazamos H₀
Conclusión: No hay evidencia suficiente para afirmar que existe diferencia en la efectividad de ambas terapias.
| Caso | Hipótesis | Estadístico Z | Región de rechazo |
|---|---|---|---|
| Cola superior | H₀: μ₁-μ₂ ≤ D₀, H₁: μ₁-μ₂ > D₀ | (X̄₁-X̄₂-D₀)/√(s₁²/n₁+s₂²/n₂) | Z > z_α |
| Cola inferior | H₀: μ₁-μ₂ ≥ D₀, H₁: μ₁-μ₂ < D₀ | (X̄₁-X̄₂-D₀)/√(s₁²/n₁+s₂²/n₂) | Z < -z_α |
| Dos colas | H₀: μ₁-μ₂ = D₀, H₁: μ₁-μ₂ ≠ D₀ | (X̄₁-X̄₂-D₀)/√(s₁²/n₁+s₂²/n₂) |
Para muestras pequeñas (n₁ < 30 o n₂ < 30), la prueba de hipótesis para la diferencia de medias requiere la distribución t-Student. Se presentan tres escenarios:
Contexto: Se conocen las varianzas poblacionales (σ₁² = 4, σ₂² = 3.6) para la resistencia de dos materiales. Muestras pequeñas: n₁=15, x̄₁=85 MPa; n₂=12, x̄₂=82 MPa. Pruebe si el material A es superior al B (cola superior) con α = 0.05. Varianzas conocidas.
H₀: μ₁ - μ₂ = 0 vs H₁: μ₁ - μ₂ > 0Paso 2: Nivel de significancia
α = 0.05, z_{0.05} = 1.645
Paso 3: Estadístico de prueba
Z = (85 - 82) / √(4/15 + 3.6/12) = 3 / √(0.2667 + 0.3) = 3 / √0.5667 = 3 / 0.7528 = 3.985Paso 4: Decisión
Z = 3.985 > 1.645 → Rechazamos H₀
# Parámetros n1 <- 15; x1 <- 85; sigma1 <- sqrt(4) n2 <- 12; x2 <- 82; sigma2 <- sqrt(3.6) alpha <- 0.05 z_calc <- (x1 - x2) / sqrt(sigma1^2/n1 + sigma2^2/n2) z_crit <- qnorm(1 - alpha) cat("Z =", round(z_calc, 4), "\n") cat("Valor crítico =", round(z_crit, 4), "\n") if (z_calc > z_crit) cat("Rechazamos H₀: μ_A > μ_B")
Contexto: Se conocen σ₁=2.5%, σ₂=3% para dos fondos. Pruebe si el Fondo A es inferior al B con α=0.05 (cola inferior). n₁=10, x̄₁=8.2%; n₂=8, x̄₂=9.5%.
Z = (8.2 - 9.5) / √(2.5²/10 + 3²/8) = -1.3 / √(0.625 + 1.125) = -1.3 / 1.323 = -0.983
Z = -0.983 > -1.645 → No rechazamos H₀
Contexto: Se conocen σ₁=5, σ₂=6 para reducción de ansiedad. Pruebe si hay diferencia entre terapias con α=0.05 (dos colas). n₁=12, x̄₁=32; n₂=10, x̄₂=35.
Z = (32 - 35) / √(5²/12 + 6²/10) = -3 / √(2.083 + 3.6) = -3 / 2.384 = -1.259
|Z| = 1.259 < 1.96 → No rechazamos H₀
Contexto: Se comparan dos métodos de ensamblaje. Método A: n₁=12, x̄₁=45 s, s₁=3.5 s. Método B: n₂=10, x̄₂=48 s, s₂=4 s. Pruebe si el Método A es más rápido (cola superior) con α=0.05. Varianzas desconocidas pero supuestas iguales.
H₀: μ₁ - μ₂ = 0 vs H₁: μ₁ - μ₂ > 0Paso 2: Cálculo de Sₚ²
Sₚ² = [(11)(12.25) + (9)(16)] / (20) = (134.75 + 144)/20 = 278.75/20 = 13.9375, Sₚ = 3.734Paso 3: Estadístico
t = (45 - 48) / [3.734·√(1/12 + 1/10)] = -3 / (3.734·0.428) = -3 / 1.598 = -1.877Paso 4: Región de rechazo (cola superior)
t = -1.877 < 1.725 → No rechazamos H₀ (con t calculado negativo, la diferencia no es en el sentido esperado)
n1 <- 12; x1 <- 45; s1 <- 3.5 n2 <- 10; x2 <- 48; s2 <- 4 alpha <- 0.05 sp2 <- ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1 + n2 - 2) sp <- sqrt(sp2) t_calc <- (x1 - x2) / (sp * sqrt(1/n1 + 1/n2)) t_crit <- qt(1 - alpha, df = n1 + n2 - 2) cat("t =", round(t_calc, 4), "; t_crítico =", round(t_crit, 4)) # Visualización library(ggplot2) x <- seq(-4, 4, length.out = 500) df_plot <- data.frame(x = x, y = dt(x, df = n1+n2-2)) ggplot(df_plot, aes(x = x, y = y)) + geom_line(color = "blue") + geom_area(data = subset(df_plot, x > t_crit), aes(x = x, y = y), fill = "red", alpha = 0.5) + geom_vline(xintercept = t_calc, color = "green", linetype = "dashed") + labs(title = "Prueba t cola superior (varianzas iguales)")
Contexto: Sector Público vs Privado. Pruebe si el salario público es menor (cola inferior). Público: n₁=15, x̄₁=2500, s₁=350; Privado: n₂=12, x̄₂=2700, s₂=380. α=0.05.
Sₚ² = [14·122500 + 11·144400]/25 = (1,715,000 + 1,588,400)/25 = 3,303,400/25 = 132,136, Sₚ = 363.5 t = (2500 - 2700) / [363.5·√(1/15+1/12)] = -200 / (363.5·0.387) = -200 / 140.7 = -1.422 t_crítico (α=0.05, gl=25, cola inferior) = -1.708 -1.422 > -1.708 → No rechazamos H₀
Contexto: Comparar efectividad de dos terapias. Terapia A: n₁=14, x̄₁=25, s₁=5; Terapia B: n₂=12, x̄₂=28, s₂=6. Pruebe si hay diferencia (dos colas) con α=0.05.
Sₚ² = [13·25 + 11·36]/24 = (325 + 396)/24 = 721/24 = 30.042, Sₚ = 5.481 t = (25 - 28) / [5.481·√(1/14+1/12)] = -3 / (5.481·0.396) = -3 / 2.170 = -1.382 t_crítico (α/2=0.025, gl=24) = ±2.064 |t| = 1.382 < 2.064 → No rechazamos H₀
Contexto: Se sospecha que las varianzas de dos materiales son diferentes. Material A: n₁=10, x̄₁=88 MPa, s₁=6 MPa. Material B: n₂=12, x̄₂=83 MPa, s₂=3 MPa. Pruebe si el Material A es superior (cola superior) con α=0.05. Varianzas desiguales.
Grados de libertad (Satterthwaite): gl = (s₁²/n₁ + s₂²/n₂)² / [ (s₁²/n₁)²/(n₁-1) + (s₂²/n₂)²/(n₂-1) ]
Paso 1: HipótesisH₀: μ₁ - μ₂ = 0 vs H₁: μ₁ - μ₂ > 0Paso 2: Estadístico
t = (88 - 83) / √(6²/10 + 3²/12) = 5 / √(3.6 + 0.75) = 5 / √4.35 = 5 / 2.086 = 2.397Paso 3: Grados de libertad
gl = (3.6 + 0.75)² / [3.6²/9 + 0.75²/11] = (4.35)² / (12.96/9 + 0.5625/11) = 18.9225 / (1.44 + 0.051) = 18.9225 / 1.491 = 12.69 ≈ 12Paso 4: Decisión
t_crítico = t_{0.05,12} = 1.782, t = 2.397 > 1.782 → Rechazamos H₀
import numpy as np from scipy.stats import t n1, x1, s1 = 10, 88, 6 n2, x2, s2 = 12, 83, 3 alpha = 0.05 t_calc = (x1 - x2) / np.sqrt(s1**2/n1 + s2**2/n2) numerador = (s1**2/n1 + s2**2/n2)**2 denominador = (s1**2/n1)**2/(n1-1) + (s2**2/n2)**2/(n2-1) gl = numerador / denominador t_crit = t.ppf(1 - alpha, gl) print(f"t = {t_calc:.4f}, gl = {gl:.2f}, t_crítico = {t_crit:.4f}") # Visualización import matplotlib.pyplot as plt x = np.linspace(-4, 4, 500) y = t.pdf(x, gl) plt.plot(x, y, color='blue') x_fill = np.linspace(t_crit, 4, 200) plt.fill_between(x_fill, 0, t.pdf(x_fill, gl), color='red', alpha=0.3) plt.axvline(x=t_calc, color='green', linestyle='dashed') plt.axvline(x=t_crit, color='red', linestyle='dotted') plt.title('Prueba t de Welch (cola superior)') plt.show()
Contexto: Pruebe si la rentabilidad de empresas grandes es inferior a la de pequeñas (cola inferior). Grandes: n₁=10, x̄₁=12%, s₁=4%; Pequeñas: n₂=15, x̄₂=14%, s₂=5%. α=0.05.
t = (12 - 14) / √(16/10 + 25/15) = -2 / √(1.6 + 1.667) = -2 / 1.807 = -1.107 gl ≈ 20.5, t_crítico (col.inferior) = -1.725, -1.107 > -1.725 → No rechazamos H₀
Contexto: Pruebe si hay diferencia en la reducción de síntomas entre dos intervenciones. Interv.A: n₁=8, x̄₁=30, s₁=7; Interv.B: n₂=10, x̄₂=35, s₂=4. α=0.05.
t = (30 - 35) / √(49/8 + 16/10) = -5 / √(6.125 + 1.6) = -5 / 2.779 = -1.799 gl ≈ 10.2, t_crítico (α/2=0.025) = ±2.228, |t| = 1.799 < 2.228 → No rechazamos H₀
| Escenario | Varianzas | Estadístico | Distribución | Grados de libertad |
|---|---|---|---|---|
| Caso 1 | Conocidas | Z = (X̄₁-X̄₂)/√(σ₁²/n₁+σ₂²/n₂) | Normal | No aplica |
| Caso 2 | Desconocidas, iguales | t = (X̄₁-X̄₂)/[Sₚ√(1/n₁+1/n₂)] | t-Student | n₁+n₂-2 |
| Caso 3 | Desconocidas, desiguales | t’ = (X̄₁-X̄₂)/√(s₁²/n₁+s₂²/n₂) | t-Student (Welch) | Satterthwaite |
| Tipo de prueba | Región de rechazo (H₁) |
|---|---|
| Cola superior (μ₁ - μ₂ > D₀) | t > t_{α, gl} |
| Cola inferior (μ₁ - μ₂ < D₀) | t < -t_{α, gl} |
| Dos colas (μ₁ - μ₂ ≠ D₀) |
t.test(x, y, var.equal=TRUE/FALSE)
permite elegir entre t de Student (TRUE) o t de Welch (FALSE)
scipy.stats.ttest_ind(a, b,
equal_var=True/False) cumple la misma función
En las pruebas para muestras pareadas, las observaciones están emparejadas o relacionadas entre sí. Ejemplos típicos incluyen:
El estadístico de prueba se basa en las diferencias entre pares: Dᵢ = X₁ᵢ - X₂ᵢ
t = D̄ / (s_D/√n)
donde D̄ es la media de las diferencias, s_D es la desviación estándar de las diferencias, y n es el número de pares. Los grados de libertad son gl = n - 1.
Contexto: Se mide el tiempo de diseño (horas) de 8 ingenieros antes y después de implementar un nuevo software. ¿El software reduce el tiempo de diseño? (Reducción = diferencia positiva). Pruebe con α = 0.05.
Datos (tiempo en horas):
| Ingeniero | Antes (X₁) | Después (X₂) | Diferencia (D = X₁ - X₂) |
|---|---|---|---|
| 1 | 12 | 10 | 2 |
| 2 | 15 | 13 | 2 |
| 3 | 10 | 9 | 1 |
| 4 | 14 | 11 | 3 |
| 5 | 13 | 12 | 1 |
| 6 | 11 | 10 | 1 |
| 7 | 16 | 14 | 2 |
| 8 | 9 | 8 | 1 |
H₀: μ_D = 0 vs H₁: μ_D > 0 (el software reduce el tiempo)Paso 2: Cálculos
n = 8 D̄ = (2+2+1+3+1+1+2+1)/8 = 13/8 = 1.625 s_D = √[Σ(D - D̄)²/(n-1)] = √[(0.1406+0.1406+0.3906+1.8906+0.3906+0.3906+0.1406+0.3906)/7] = √[3.8748/7] = √0.5535 = 0.744Paso 3: Estadístico de prueba
t = D̄ / (s_D/√n) = 1.625 / (0.744/√8) = 1.625 / (0.744/2.828) = 1.625 / 0.263 = 6.178Paso 4: Decisión (α=0.05, gl=7, t_crítico=1.895)
t = 6.178 > 1.895 → Rechazamos H₀
Conclusión: El nuevo software reduce significativamente el tiempo de diseño.
# Datos antes <- c(12, 15, 10, 14, 13, 11, 16, 9) despues <- c(10, 13, 9, 11, 12, 10, 14, 8) diferencias <- antes - despues # Prueba t pareada (cola superior) t_test <- t.test(antes, despues, alternative = "greater", paired = TRUE) print(t_test) # Visualización library(ggplot2) df_plot <- data.frame( Ingeniero = 1:8, Antes = antes, Despues = despues ) df_long <- reshape2::melt(df_plot, id.vars = "Ingeniero", variable.name = "Tiempo", value.name = "Horas") ggplot(df_long, aes(x = factor(Ingeniero), y = Horas, fill = Tiempo)) + geom_bar(stat = "identity", position = "dodge") + labs(title = "Comparación de tiempos antes vs después", x = "Ingeniero", y = "Horas") + theme_minimal() + scale_fill_manual(values = c("blue", "lightgreen"))
Contexto: Se mide la productividad (unidades/día) de 10 trabajadores antes y después de una capacitación. ¿La capacitación aumenta la productividad? (Aumento = diferencia positiva). Pruebe con α = 0.01.
Datos resumen:
n = 10, D̄ = 5.2, s_D = 4.8
t = 5.2 / (4.8/√10) = 5.2 / 1.518 = 3.425
t_crítico (α=0.01, gl=9, cola superior) = 2.821
3.425 > 2.821 →
Rechazamos H₀
import numpy as np from scipy.stats import ttest_rel # Datos simulados np.random.seed(123) antes = np.random.normal(50, 10, 10) despues = antes + np.random.normal(5.2, 4.8, 10) t_stat, p_valor = ttest_rel(despues, antes, alternative='greater') print(f"t = {t_stat:.4f}, p-valor = {p_valor:.4f}")
Contexto: Se mide la presión arterial sistólica de 12 pacientes antes y después de administrar un fármaco. ¿El fármaco reduce la presión arterial? (Reducción = diferencia positiva). Pruebe con α = 0.05.
Datos diferencias (antes - después): [8, 12, 5, 15, 6, 10, 9, 11, 7, 13, 8, 9]
n = 12, D̄ = 9.42, s_D = 2.81 t = 9.42 / (2.81/√12) = 9.42 / 0.811 = 11.62
t_crítico (α=0.05, gl=11, cola superior) = 1.796
11.62 > 1.796 →
Rechazamos H₀ (el fármaco reduce la
presión)
Contexto: Se mide la eficiencia de 6 máquinas antes y después de 6 meses de uso. ¿La eficiencia disminuye con el uso? (disminución = diferencia positiva, pero aquí definimos D = antes - después, H₁: μ_D < 0 indica que después es mayor??). Replanteo: D = después - antes. H₁: μ_D > 0 si aumenta, μ_D < 0 si disminuye.
Definimos D = eficiencia_antes - eficiencia_después. Si la máquina pierde eficiencia, D > 0. Prueba cola superior (ya visto). Para cola inferior, podemos definir D = eficiencia_despues - eficiencia_antes, y probar μ_D < 0 (disminución).
Contexto: Ventas mensuales (millones $) de 8 tiendas antes y después de una crisis económica. ¿Las ventas disminuyeron? Pruebe con α = 0.05.
D = ventas_antes - ventas_despues, n=8, D̄=3.5, s_D=2.1 t = 3.5 / (2.1/√8) = 3.5 / 0.742 = 4.717 t_crítico (α=0.05, gl=7, cola superior) = 1.895 4.717 > 1.895 → Rechazamos H₀ (las ventas disminuyeron)
Contexto: Se miden 10 piezas con dos instrumentos diferentes. ¿Hay diferencia sistemática entre los instrumentos? Pruebe con α = 0.05 (dos colas).
Datos (diferencias Instrumento1 - Instrumento2): [0.2, -0.1, 0.3, 0.1, -0.2, 0.2, 0.0, -0.1, 0.2, 0.1]
n = 10, D̄ = 0.07, s_D = 0.155 t = 0.07 / (0.155/√10) = 0.07 / 0.049 = 1.429
t_crítico (α/2=0.025, gl=9) = ±2.262
|t| = 1.429 < 2.262 →
No rechazamos H₀
Conclusión: No hay evidencia de diferencia sistemática entre los instrumentos.
# Datos de diferencias diferencias <- c(0.2, -0.1, 0.3, 0.1, -0.2, 0.2, 0.0, -0.1, 0.2, 0.1) # Prueba t para una muestra (sobre las diferencias) t_test <- t.test(diferencias, mu = 0, alternative = "two.sided") print(t_test) # Visualización library(ggplot2) df_plot <- data.frame(Diferencias = diferencias) ggplot(df_plot, aes(x = Diferencias)) + geom_histogram(bins = 5, fill = "lightblue", color = "black") + geom_vline(xintercept = mean(diferencias), color = "red", linewidth = 1.2) + labs(title = "Distribución de diferencias entre instrumentos", x = "Diferencia (Instrumento1 - Instrumento2)") + theme_minimal()
Contexto: Se miden las ventas (miles $) de 15 clientes antes y después de un programa de fidelización. ¿El programa cambió las ventas (puede aumentar o disminuir)? Pruebe dos colas con α = 0.05.
D = ventas_despues - ventas_antes, n=15, D̄=1.8, s_D=3.2 t = 1.8 / (3.2/√15) = 1.8 / 0.826 = 2.179 t_crítico (α/2=0.025, gl=14) = ±2.145 |t| = 2.179 > 2.145 → Rechazamos H₀ (el programa sí cambió las ventas)
Contexto: Se miden los puntajes de depresión (escala BDI) de 12 pacientes antes y después de 8 semanas de terapia. ¿El tratamiento modifica los puntajes (puede aumentar o disminuir)? Pruebe dos colas con α = 0.01.
D = antes - después (reducción), n=12, D̄=4.5, s_D=3.8 t = 4.5 / (3.8/√12) = 4.5 / 1.097 = 4.101 t_crítico (α/2=0.005, gl=11) = ±3.106 |t| = 4.101 > 3.106 → Rechazamos H₀ (el tratamiento modifica significativamente los puntajes)
# Datos simulados set.seed(456) antes <- rnorm(12, 25, 5) despues <- antes - rnorm(12, 4.5, 3.8) # Prueba t pareada dos colas t_test <- t.test(antes, despues, paired = TRUE, alternative = "two.sided") print(t_test) # Gráfico de líneas library(ggplot2) df_plot <- data.frame( Paciente = 1:12, Antes = antes, Despues = despues ) ggplot(df_plot, aes(x = factor(Paciente))) + geom_line(aes(y = Antes, group = 1), color = "blue") + geom_line(aes(y = Despues, group = 1), color = "red") + labs(title = "Evolución de puntajes de depresión", x = "Paciente", y = "Puntaje BDI") + theme_minimal()
| Tipo de prueba | Hipótesis | Estadístico t | Región de rechazo | Grados de libertad |
|---|---|---|---|---|
| Cola superior | H₀: μ_D ≤ D₀, H₁: μ_D > D₀ | t = (D̄ - D₀)/(s_D/√n) | t > t_{α, n-1} | n-1 |
| Cola inferior | H₀: μ_D ≥ D₀, H₁: μ_D < D₀ | t = (D̄ - D₀)/(s_D/√n) | t < -t_{α, n-1} | n-1 |
| Dos colas | H₀: μ_D = D₀, H₁: μ_D ≠ D₀ | t = (D̄ - D₀)/(s_D/√n) | t |
Se mide el peso (kg) de 10 personas antes y después de 3 meses de ejercicio. ¿El programa reduce el peso? (Diferencias: [3, 2.5, 4, 1.5, 2, 3.5, 1, 2.5, 3, 2])
t_calculado = ______? t_crítico = ______? ¿Rechaza H₀?
Se miden las calificaciones de 8 estudiantes antes y después de un curso de estadística. Pruebe si el curso cambió las calificaciones. Datos:
Antes: 65, 70, 55, 80, 60, 75, 50, 85 Después: 75, 72, 60, 85, 65, 80, 55, 88
Se mide el tiempo de procesamiento (segundos) de 12 tareas ejecutadas con un software estándar y con un software optimizado. ¿El software optimizado reduce el tiempo?
Diferencias (estándar - optimizado): [2, 0.5, 1.5, 3, 1, 2.5, 0.8, 1.2, 2.2, 1.8, 2.8, 0.3]
t.test(x, y, paired=TRUE) realiza la
prueba pareada
scipy.stats.ttest_rel(a, b)
cumple la misma función