Con Mi Profe: Julio Hurtado Marquez; EMAIL_TAREAS:

1 📊 APLICACIONES DE PRUEBAS DE HIPÓTESIS PARA LA MEDIA POBLACIONAL CON MUESTRAS GRANDES

📐 INTRODUCCIÓN

Para muestras grandes (n ≥ 30), el Teorema Central del Límite garantiza que la distribución muestral de la media es aproximadamente normal, incluso si la población no es normal. El estadístico de prueba es:

Z = (X̄ - μ₀) / (σ/√n)

Cuando σ es desconocida, se reemplaza por la desviación estándar muestral s (válido para n grande).


1.1 📊 CASO I: PRUEBA DE COLA SUPERIOR (H₁: μ > μ₀)

🏭 ÁREA DE INGENIERÍAS: Control de calidad en producción

Contexto: Una fábrica de componentes electrónicos afirma que la resistencia media de sus componentes es de 100 MPa (megapascales). Un ingeniero de control de calidad sospecha que la resistencia media es mayor que el valor afirmado. Toma una muestra de 36 componentes y obtiene una media de 103 MPa con una desviación estándar de 9 MPa. Pruebe la hipótesis con α = 0.05.

📐 Solución

Paso 1: Hipótesis
H₀: μ = 100 MPa   vs   H₁: μ > 100 MPa
Paso 2: Nivel de significancia
α = 0.05,  z_{0.05} = 1.645
Paso 3: Estadístico de prueba
Z = (103 - 100) / (9/√36) = 3 / 1.5 = 2.00
Paso 4: Región de rechazo y decisión

Z = 2.00 > 1.645 → Rechazamos H₀

Conclusión: Existe evidencia suficiente para afirmar que la resistencia media de los componentes es superior a 100 MPa.

📊 Código en R

# Parámetros
n <- 36
x_bar <- 103
mu0 <- 100
s <- 9
alpha <- 0.05

# Estadístico de prueba
z_calculado <- (x_bar - mu0) / (s / sqrt(n))
cat("Estadístico Z:", round(z_calculado, 4), "\n")

# Valor crítico
z_critico <- qnorm(1 - alpha)
cat("Valor crítico:", round(z_critico, 4), "\n")

# p-valor
p_valor <- 1 - pnorm(z_calculado)
cat("p-valor:", round(p_valor, 4), "\n")

# Decisión
if (z_calculado > z_critico) {
  cat("Rechazamos H₀: la media es mayor que 100 MPa")
} else {
  cat("No rechazamos H₀")
}

# Visualización
library(ggplot2)
x <- seq(-3, 4, length.out = 500)
df <- data.frame(x = x, y = dnorm(x))
ggplot(df, aes(x = x, y = y)) +
  geom_line(color = "blue", linewidth = 1) +
  geom_area(data = subset(df, x > z_critico), aes(x = x, y = y), fill = "red", alpha = 0.5) +
  geom_vline(xintercept = z_calculado, color = "darkgreen", linewidth = 1.2, linetype = "dashed") +
  geom_vline(xintercept = z_critico, color = "red", linewidth = 1, linetype = "dotted") +
  annotate("text", x = z_critico + 0.3, y = 0.1, label = "z_crítico", color = "red") +
  annotate("text", x = z_calculado + 0.3, y = 0.35, label = "z_calculado", color = "darkgreen") +
  labs(title = "Prueba de cola superior (Ingeniería)", x = "Z", y = "Densidad") +
  theme_minimal()
Prueba de cola superior (α=0.05) 1.645 2.00

💰 ÁREA DE CIENCIAS ECONÓMICAS: Rentabilidad de inversiones

Contexto: Un fondo de inversión afirma que su rendimiento medio anual es del 12%. Un analista sospecha que el rendimiento medio es superior al afirmado. Analiza una muestra de 40 meses y obtiene un rendimiento medio del 13.5% con una desviación estándar del 4%. Pruebe la hipótesis con α = 0.01.

📐 Solución

Paso 1: Hipótesis
H₀: μ = 12%   vs   H₁: μ > 12%
Paso 2: Nivel de significancia
α = 0.01,  z_{0.01} = 2.326
Paso 3: Estadístico de prueba
Z = (13.5 - 12) / (4/√40) = 1.5 / 0.6325 = 2.37
Paso 4: Región de rechazo y decisión

Z = 2.37 > 2.326 → Rechazamos H₀

Conclusión: Existe evidencia suficiente para afirmar que el rendimiento medio del fondo es superior al 12%.

📊 Código en Python

# -*- coding: utf-8 -*-
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Parámetros
n = 40
x_bar = 13.5
mu0 = 12
s = 4
alpha = 0.01

# Estadístico de prueba
z_calculado = (x_bar - mu0) / (s / np.sqrt(n))
print(f"Estadístico Z: {z_calculado:.4f}")

# Valor crítico
z_critico = norm.ppf(1 - alpha)
print(f"Valor crítico: {z_critico:.4f}")

# p-valor
p_valor = 1 - norm.cdf(z_calculado)
print(f"p-valor: {p_valor:.4f}")

# Decisión
if z_calculado > z_critico:
    print("Rechazamos H₀: la media es mayor que 12%")
else:
    print("No rechazamos H₀")

# Visualización
x = np.linspace(-3, 4, 500)
y = norm.pdf(x, 0, 1)
plt.figure(figsize=(10, 5))
plt.plot(x, y, color='blue', linewidth=2)
x_fill = np.linspace(z_critico, 4, 200)
plt.fill_between(x_fill, 0, norm.pdf(x_fill), color='red', alpha=0.3)
plt.axvline(x=z_calculado, color='green', linestyle='dashed', linewidth=2)
plt.axvline(x=z_critico, color='red', linestyle='dotted', linewidth=1.5)
plt.title('Prueba de cola superior (Ciencias Económicas)')
plt.xlabel('Z')
plt.ylabel('Densidad')
plt.show()

🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO Y LA SALUD: Eficacia de un tratamiento

Contexto: Un psicólogo afirma que una nueva terapia reduce el nivel de ansiedad. La escala de ansiedad tiene una media poblacional de 50 puntos. Se aplica la terapia a 35 pacientes y se obtiene una media de 46 puntos con una desviación estándar de 12 puntos. ¿Existe evidencia de que la terapia reduce el nivel de ansiedad? Pruebe con α = 0.05.

Nota: Este es un caso de cola inferior (menor ansiedad es mejor).

Paso 1: Hipótesis
H₀: μ = 50   vs   H₁: μ < 50
Paso 2: Nivel de significancia
α = 0.05,  -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (46 - 50) / (12/√35) = -4 / 2.028 = -1.97
Paso 4: Región de rechazo y decisión

Z = -1.97 < -1.645 → Rechazamos H₀

Conclusión: Existe evidencia suficiente para afirmar que la terapia reduce significativamente el nivel de ansiedad.

📊 Código en R

# Parámetros
n <- 35
x_bar <- 46
mu0 <- 50
s <- 12
alpha <- 0.05

# Estadístico de prueba
z_calculado <- (x_bar - mu0) / (s / sqrt(n))
cat("Estadístico Z:", round(z_calculado, 4), "\n")

# Valor crítico (cola inferior)
z_critico <- qnorm(alpha)
cat("Valor crítico:", round(z_critico, 4), "\n")

# p-valor
p_valor <- pnorm(z_calculado)
cat("p-valor:", round(p_valor, 4), "\n")

# Decisión
if (z_calculado < z_critico) {
  cat("Rechazamos H₀: la terapia reduce la ansiedad")
} else {
  cat("No rechazamos H₀")
}

# Visualización
x <- seq(-4, 3, length.out = 500)
df <- data.frame(x = x, y = dnorm(x))
ggplot(df, aes(x = x, y = y)) +
  geom_line(color = "blue", linewidth = 1) +
  geom_area(data = subset(df, x < z_critico), aes(x = x, y = y), fill = "red", alpha = 0.5) +
  geom_vline(xintercept = z_calculado, color = "darkgreen", linewidth = 1.2, linetype = "dashed") +
  geom_vline(xintercept = z_critico, color = "red", linewidth = 1, linetype = "dotted") +
  labs(title = "Prueba de cola inferior (Ciencias de la Salud)", x = "Z", y = "Densidad") +
  theme_minimal()

1.2 📊 CASO II: PRUEBA DE COLA INFERIOR (H₁: μ < μ₀)

🏭 ÁREA DE INGENIERÍAS: Consumo energético

Contexto: Un fabricante afirma que sus nuevos motores consumen en promedio 15 kWh por hora de operación. Un ingeniero sospecha que el consumo es menor al afirmado. Prueba 32 motores y obtiene un consumo medio de 14.2 kWh con una desviación estándar de 2.5 kWh. Pruebe con α = 0.01.

Paso 1: Hipótesis
H₀: μ = 15 kWh   vs   H₁: μ < 15 kWh
Paso 2: Nivel de significancia
α = 0.01,  -z_{0.01} = -2.326
Paso 3: Estadístico de prueba
Z = (14.2 - 15) / (2.5/√32) = -0.8 / 0.442 = -1.81
Paso 4: Decisión

Z = -1.81 > -2.326 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que el consumo medio es menor a 15 kWh.


💰 ÁREA DE CIENCIAS ECONÓMICAS: Costos operativos

Contexto: Una empresa afirma que sus costos operativos medios son de $500 por unidad. Un analista sospecha que los costos son menores. Analiza 45 unidades y obtiene un costo medio de $485 con una desviación estándar de $45. Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ = 500   vs   H₁: μ < 500
Paso 2: Nivel de significancia
α = 0.05,  -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (485 - 500) / (45/√45) = -15 / 6.708 = -2.236
Paso 4: Decisión

Z = -2.236 < -1.645 → Rechazamos H₀

Conclusión: Existe evidencia suficiente para afirmar que los costos operativos medios son menores a $500.


🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO: Estrés laboral

Contexto: Un estudio previo indica que el nivel medio de estrés en empleados es de 65 puntos. Se implementa un programa de bienestar y se mide el estrés en 50 empleados, obteniendo una media de 62 puntos con desviación estándar de 10 puntos. ¿Existe evidencia de que el programa reduce el estrés? α = 0.05.

Paso 1: Hipótesis
H₀: μ = 65   vs   H₁: μ < 65
Paso 2: Nivel de significancia
α = 0.05,  -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (62 - 65) / (10/√50) = -3 / 1.414 = -2.12
Paso 4: Decisión

Z = -2.12 < -1.645 → Rechazamos H₀

Conclusión: El programa de bienestar reduce significativamente los niveles de estrés.


1.3 📊 CASO III: PRUEBA DE DOS COLAS (H₁: μ ≠ μ₀)

🏭 ÁREA DE INGENIERÍAS: Precisión de máquinas

Contexto: Una máquina debe producir piezas con longitud media de 10 cm. Un ingeniero sospecha que la máquina está descalibrada (la media es diferente). Toma 36 piezas y obtiene una media de 10.3 cm con desviación estándar de 1.2 cm. Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ = 10 cm   vs   H₁: μ ≠ 10 cm
Paso 2: Nivel de significancia
α = 0.05,  z_{0.025} = 1.96
Paso 3: Estadístico de prueba
Z = (10.3 - 10) / (1.2/√36) = 0.3 / 0.2 = 1.50
Paso 4: Región de rechazo y decisión

|Z| = 1.50 < 1.96 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que la máquina está descalibrada.


💰 ÁREA DE CIENCIAS ECONÓMICAS: Salarios

Contexto: Un economista afirma que el salario medio en un sector es de $2,500. Se toma una muestra de 64 trabajadores y se obtiene una media de $2,400 con una desviación estándar de $400. ¿Existe evidencia de que el salario medio es diferente? α = 0.01.

Paso 1: Hipótesis
H₀: μ = 2500   vs   H₁: μ ≠ 2500
Paso 2: Nivel de significancia
α = 0.01,  z_{0.005} = 2.576
Paso 3: Estadístico de prueba
Z = (2400 - 2500) / (400/√64) = -100 / 50 = -2.00
Paso 4: Decisión

|Z| = 2.00 < 2.576 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que el salario medio es diferente de $2,500.


🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO: Memoria

Contexto: Un test de memoria tiene una media poblacional de 100 puntos. Se aplica una intervención a 40 personas y se obtiene una media de 105 puntos con desviación estándar de 15 puntos. ¿Existe evidencia de que la intervención cambia la memoria (puede aumentar o disminuir)? α = 0.05.

Paso 1: Hipótesis
H₀: μ = 100   vs   H₁: μ ≠ 100
Paso 2: Nivel de significancia
α = 0.05,  z_{0.025} = 1.96
Paso 3: Estadístico de prueba
Z = (105 - 100) / (15/√40) = 5 / 2.372 = 2.11
Paso 4: Decisión

|Z| = 2.11 > 1.96 → Rechazamos H₀

Conclusión: Existe evidencia suficiente para afirmar que la intervención tiene un efecto significativo sobre la memoria.


1.4 📊 RESUMEN DE PRUEBAS DE HIPÓTESIS PARA LA MEDIA (MUESTRAS GRANDES)

📋 Tabla resumen

Caso Hipótesis Estadístico Z Región de rechazo Regla de decisión
Cola superior H₀: μ ≤ μ₀, H₁: μ > μ₀ (X̄ - μ₀)/(σ/√n) Z > z_α Rechazar si Z > z_α
Cola inferior H₀: μ ≥ μ₀, H₁: μ < μ₀ (X̄ - μ₀)/(σ/√n) Z < -z_α Rechazar si Z < -z_α
Dos colas H₀: μ = μ₀, H₁: μ ≠ μ₀ (X̄ - μ₀)/(σ/√n) Z < -z_{α/2} o Z > z_{α/2} Rechazar si

1.5 📊 VALORES CRÍTICOS COMUNES

📋 Tabla de valores z_α

α z_α (una cola) z_{α/2} (dos colas)
0.10 1.282 1.645
0.05 1.645 1.960
0.025 1.960 2.241
0.01 2.326 2.576
0.005 2.576 2.807

1.6 💡 CONCLUSIONES CLAVE

✅ Puntos importantes

  • Para muestras grandes (n ≥ 30), se puede usar la distribución normal como aproximación, incluso si la población no es normal (TCL)
  • Cuando σ es desconocida, se puede reemplazar por la desviación estándar muestral s sin pérdida significativa de precisión
  • La región de rechazo depende de la hipótesis alternativa (una cola o dos colas)
  • El p-valor cuantifica la evidencia en contra de H₀: a menor p-valor, mayor evidencia
  • En aplicaciones de ingeniería se suele usar α=0.05 o 0.01; en ciencias de la salud se usa frecuentemente α=0.05 para ensayos clínicos; en ciencias económicas se usan ambos dependiendo del riesgo asociado

2 📊 APLICACIONES DE PRUEBAS DE HIPÓTESIS PARA LA MEDIA POBLACIONAL CON MUESTRAS PEQUEÑAS

📐 INTRODUCCIÓN

Para muestras pequeñas (n < 30), cuando la población es aproximadamente normal y la varianza poblacional σ² es desconocida, se utiliza la distribución t-Student. El estadístico de prueba es:

t = (X̄ - μ₀) / (s/√n)

con v = n - 1 grados de libertad. La distribución t tiene colas más pesadas que la normal, lo que proporciona intervalos más amplios para muestras pequeñas.


2.1 📊 CASO I: PRUEBA DE COLA SUPERIOR (H₁: μ > μ₀)

🏭 ÁREA DE INGENIERÍAS: Resistencia de materiales

Contexto: Un ingeniero civil afirma que la resistencia a la compresión de un nuevo concreto es superior a 28 MPa. Se prueban 15 muestras y se obtiene una media de 29.5 MPa con una desviación estándar de 2.8 MPa. Pruebe la hipótesis con α = 0.05. Suponga normalidad.

📐 Solución

Paso 1: Hipótesis
H₀: μ = 28 MPa   vs   H₁: μ > 28 MPa
Paso 2: Nivel de significancia
α = 0.05,  gl = 14,  t_{0.05,14} = 1.761
Paso 3: Estadístico de prueba
t = (29.5 - 28) / (2.8/√15) = 1.5 / 0.723 = 2.075
Paso 4: Región de rechazo y decisión

t = 2.075 > 1.761 → Rechazamos H₀

Conclusión: Existe evidencia suficiente para afirmar que la resistencia media del nuevo concreto es superior a 28 MPa.

📊 Código en R

# Parámetros
n <- 15
x_bar <- 29.5
mu0 <- 28
s <- 2.8
alpha <- 0.05
gl <- n - 1

# Estadístico de prueba
t_calculado <- (x_bar - mu0) / (s / sqrt(n))
cat("Estadístico t:", round(t_calculado, 4), "\n")

# Valor crítico
t_critico <- qt(1 - alpha, df = gl)
cat("Valor crítico:", round(t_critico, 4), "\n")

# p-valor
p_valor <- 1 - pt(t_calculado, df = gl)
cat("p-valor:", round(p_valor, 4), "\n")

# Decisión
if (t_calculado > t_critico) {
  cat("Rechazamos H₀: la media es mayor que 28 MPa")
} else {
  cat("No rechazamos H₀")
}

# Visualización
library(ggplot2)
x <- seq(-4, 4, length.out = 500)
df_plot <- data.frame(x = x, y = dt(x, df = gl))
ggplot(df_plot, aes(x = x, y = y)) +
  geom_line(color = "blue", linewidth = 1) +
  geom_area(data = subset(df_plot, x > t_critico), aes(x = x, y = y), fill = "red", alpha = 0.5) +
  geom_vline(xintercept = t_calculado, color = "darkgreen", linewidth = 1.2, linetype = "dashed") +
  geom_vline(xintercept = t_critico, color = "red", linewidth = 1, linetype = "dotted") +
  labs(title = "Prueba t de cola superior (Ingeniería)", x = "t", y = "Densidad") +
  theme_minimal()
Prueba t cola superior (gl=14) 1.761 2.075

💰 ÁREA DE CIENCIAS ECONÓMICAS: Rendimiento de inversiones

Contexto: Un analista afirma que el rendimiento medio de un fondo de inversión es superior al 8% anual. Se toman datos de 12 meses y se obtiene una media del 9.2% con una desviación estándar del 2.5%. Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ = 8%   vs   H₁: μ > 8%
Paso 2: Nivel de significancia
α = 0.05,  gl = 11,  t_{0.05,11} = 1.796
Paso 3: Estadístico de prueba
t = (9.2 - 8) / (2.5/√12) = 1.2 / 0.722 = 1.662
Paso 4: Decisión

t = 1.662 < 1.796 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que el rendimiento medio supera el 8%.

📊 Código en Python

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import t

# Parámetros
n = 12
x_bar = 9.2
mu0 = 8
s = 2.5
alpha = 0.05
gl = n - 1

# Estadístico de prueba
t_calculado = (x_bar - mu0) / (s / np.sqrt(n))
print(f"Estadístico t: {t_calculado:.4f}")

# Valor crítico
t_critico = t.ppf(1 - alpha, gl)
print(f"Valor crítico: {t_critico:.4f}")

# p-valor
p_valor = 1 - t.cdf(t_calculado, gl)
print(f"p-valor: {p_valor:.4f}")

# Visualización
x = np.linspace(-4, 4, 500)
y = t.pdf(x, gl)
plt.figure(figsize=(10, 5))
plt.plot(x, y, color='blue', linewidth=2)
x_fill = np.linspace(t_critico, 4, 200)
plt.fill_between(x_fill, 0, t.pdf(x_fill, gl), color='red', alpha=0.3)
plt.axvline(x=t_calculado, color='green', linestyle='dashed', linewidth=2)
plt.axvline(x=t_critico, color='red', linestyle='dotted', linewidth=1.5)
plt.title('Prueba t de cola superior (Ciencias Económicas)')
plt.xlabel('t')
plt.ylabel('Densidad')
plt.show()

🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO Y LA SALUD: Eficacia de un medicamento

Contexto: Se desarrolla un nuevo medicamento para reducir la presión arterial sistólica. Se sabe que la presión media en pacientes hipertensos es de 145 mmHg. Se prueba el medicamento en 10 pacientes y se obtiene una presión media de 138 mmHg con una desviación estándar de 8 mmHg. ¿Existe evidencia de que el medicamento reduce la presión? α = 0.01. (Nota: reducción significa presión menor)

Nota: Este es un caso de cola inferior (menor presión es mejor).

Paso 1: Hipótesis
H₀: μ = 145 mmHg   vs   H₁: μ < 145 mmHg
Paso 2: Nivel de significancia
α = 0.01,  gl = 9,  -t_{0.01,9} = -2.821
Paso 3: Estadístico de prueba
t = (138 - 145) / (8/√10) = -7 / 2.529 = -2.77
Paso 4: Región de rechazo y decisión

t = -2.77 > -2.821 → No rechazamos H₀

Conclusión: No hay suficiente evidencia al 1% para afirmar que el medicamento reduce la presión arterial.


2.2 📊 CASO II: PRUEBA DE COLA INFERIOR (H₁: μ < μ₀)

🏭 ÁREA DE INGENIERÍAS: Tiempo de ensamblaje

Contexto: Un ingeniero industrial afirma que un nuevo método de ensamblaje reduce el tiempo medio por debajo de 12 minutos. Se prueba el método con 8 trabajadores y se obtiene un tiempo medio de 10.5 minutos con una desviación estándar de 2.2 minutos. Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ = 12 min   vs   H₁: μ < 12 min
Paso 2: Nivel de significancia
α = 0.05,  gl = 7,  -t_{0.05,7} = -1.895
Paso 3: Estadístico de prueba
t = (10.5 - 12) / (2.2/√8) = -1.5 / 0.778 = -1.928
Paso 4: Decisión

t = -1.928 < -1.895 → Rechazamos H₀

Conclusión: Existe evidencia suficiente para afirmar que el nuevo método reduce el tiempo medio de ensamblaje por debajo de 12 minutos.

📊 Código en R

# Parámetros
n <- 8
x_bar <- 10.5
mu0 <- 12
s <- 2.2
alpha <- 0.05
gl <- n - 1

t_calculado <- (x_bar - mu0) / (s / sqrt(n))
cat("Estadístico t:", round(t_calculado, 4), "\n")

t_critico <- qt(alpha, df = gl)
cat("Valor crítico:", round(t_critico, 4), "\n")

p_valor <- pt(t_calculado, df = gl)
cat("p-valor:", round(p_valor, 4), "\n")

# Visualización
x <- seq(-4, 4, length.out = 500)
df_plot <- data.frame(x = x, y = dt(x, df = gl))
ggplot(df_plot, aes(x = x, y = y)) +
  geom_line(color = "blue", linewidth = 1) +
  geom_area(data = subset(df_plot, x < t_critico), aes(x = x, y = y), fill = "red", alpha = 0.5) +
  geom_vline(xintercept = t_calculado, color = "darkgreen", linewidth = 1.2, linetype = "dashed") +
  geom_vline(xintercept = t_critico, color = "red", linewidth = 1, linetype = "dotted") +
  labs(title = "Prueba t de cola inferior (Ingeniería)", x = "t", y = "Densidad") +
  theme_minimal()

💰 ÁREA DE CIENCIAS ECONÓMICAS: Costos de producción

Contexto: Un gerente afirma que los costos medios de producción son inferiores a $500 por unidad. Se toman 9 semanas de datos y se obtiene un costo medio de $480 con una desviación estándar de $35. Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ = 500   vs   H₁: μ < 500
Paso 2: Nivel de significancia
α = 0.05,  gl = 8,  -t_{0.05,8} = -1.860
Paso 3: Estadístico de prueba
t = (480 - 500) / (35/√9) = -20 / 11.667 = -1.714
Paso 4: Decisión

t = -1.714 > -1.860 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que los costos medios son inferiores a $500.


🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO: Niveles de ansiedad

Contexto: Un psicólogo afirma que una terapia reduce la ansiedad por debajo de 30 puntos (escala de ansiedad). Se aplica la terapia a 12 pacientes y se obtiene una media de 27 puntos con una desviación estándar de 4.5 puntos. Pruebe con α = 0.01.

Paso 1: Hipótesis
H₀: μ = 30   vs   H₁: μ < 30
Paso 2: Nivel de significancia
α = 0.01,  gl = 11,  -t_{0.01,11} = -2.718
Paso 3: Estadístico de prueba
t = (27 - 30) / (4.5/√12) = -3 / 1.299 = -2.309
Paso 4: Decisión

t = -2.309 > -2.718 → No rechazamos H₀

Conclusión: No hay suficiente evidencia al 1% para afirmar que la terapia reduce la ansiedad por debajo de 30 puntos.


2.3 📊 CASO III: PRUEBA DE DOS COLAS (H₁: μ ≠ μ₀)

🏭 ÁREA DE INGENIERÍAS: Calibre de piezas

Contexto: Una máquina debe producir piezas con diámetro medio de 5 mm. Se sospecha que la máquina está descalibrada. Se miden 10 piezas y se obtiene un diámetro medio de 5.12 mm con una desviación estándar de 0.18 mm. Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ = 5 mm   vs   H₁: μ ≠ 5 mm
Paso 2: Nivel de significancia
α = 0.05,  gl = 9,  t_{0.025,9} = 2.262
Paso 3: Estadístico de prueba
t = (5.12 - 5) / (0.18/√10) = 0.12 / 0.0569 = 2.109
Paso 4: Decisión

|t| = 2.109 < 2.262 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que la máquina está descalibrada.

📊 Código en Python

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import t

n = 10
x_bar = 5.12
mu0 = 5
s = 0.18
alpha = 0.05
gl = n - 1

t_calculado = (x_bar - mu0) / (s / np.sqrt(n))
print(f"Estadístico t: {abs(t_calculado):.4f}")

t_critico = t.ppf(1 - alpha/2, gl)
print(f"Valor crítico: {t_critico:.4f}")

# Visualización
x = np.linspace(-4, 4, 500)
y = t.pdf(x, gl)
plt.figure(figsize=(10, 5))
plt.plot(x, y, color='blue', linewidth=2)
x_fill_left = np.linspace(-4, -t_critico, 200)
x_fill_right = np.linspace(t_critico, 4, 200)
plt.fill_between(x_fill_left, 0, t.pdf(x_fill_left, gl), color='red', alpha=0.3)
plt.fill_between(x_fill_right, 0, t.pdf(x_fill_right, gl), color='red', alpha=0.3)
plt.axvline(x=t_calculado, color='green', linestyle='dashed', linewidth=2)
plt.axvline(x=-t_calculado, color='green', linestyle='dashed', linewidth=2)
plt.axvline(x=t_critico, color='red', linestyle='dotted', linewidth=1.5)
plt.axvline(x=-t_critico, color='red', linestyle='dotted', linewidth=1.5)
plt.title('Prueba t de dos colas (Ingeniería)')
plt.xlabel('t')
plt.ylabel('Densidad')
plt.show()
Prueba t dos colas (gl=9)

💰 ÁREA DE CIENCIAS ECONÓMICAS: Salarios por hora

Contexto: Un sindicato afirma que el salario medio por hora es de $25. Se toma una muestra de 15 trabajadores y se obtiene un salario medio de $26.5 con una desviación estándar de $3.2. ¿Existe evidencia de que el salario medio es diferente? α = 0.10.

Paso 1: Hipótesis
H₀: μ = 25   vs   H₁: μ ≠ 25
Paso 2: Nivel de significancia
α = 0.10,  gl = 14,  t_{0.05,14} = 1.761
Paso 3: Estadístico de prueba
t = (26.5 - 25) / (3.2/√15) = 1.5 / 0.826 = 1.815
Paso 4: Decisión

|t| = 1.815 > 1.761 → Rechazamos H₀

Conclusión: Existe evidencia para afirmar que el salario medio es diferente de $25.


🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO: Efecto de una intervención educativa

Contexto: Una intervención educativa busca cambiar el rendimiento en una prueba de matemáticas (media poblacional 70 puntos). Se aplica a 8 estudiantes y se obtiene una media de 73 puntos con una desviación estándar de 5 puntos. Pruebe si hubo cambio (aumento o disminución) con α = 0.05.

Paso 1: Hipótesis
H₀: μ = 70   vs   H₁: μ ≠ 70
Paso 2: Nivel de significancia
α = 0.05,  gl = 7,  t_{0.025,7} = 2.365
Paso 3: Estadístico de prueba
t = (73 - 70) / (5/√8) = 3 / 1.768 = 1.697
Paso 4: Decisión

|t| = 1.697 < 2.365 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que la intervención cambió significativamente el rendimiento.


2.4 📊 RESUMEN DE PRUEBAS t PARA LA MEDIA (MUESTRAS PEQUEÑAS)

📋 Tabla resumen

Caso Hipótesis Estadístico t Región de rechazo Grados de libertad
Cola superior H₀: μ ≤ μ₀, H₁: μ > μ₀ (X̄ - μ₀)/(s/√n) t > t_{α, n-1} n-1
Cola inferior H₀: μ ≥ μ₀, H₁: μ < μ₀ (X̄ - μ₀)/(s/√n) t < -t_{α, n-1} n-1
Dos colas H₀: μ = μ₀, H₁: μ ≠ μ₀ (X̄ - μ₀)/(s/√n) t

2.5 📊 VALORES CRÍTICOS COMUNES DE t-STUDENT

📋 Tabla de valores t_{α, v}

gl t_{0.10} t_{0.05} t_{0.025} t_{0.01} t_{0.005}
7 1.415 1.895 2.365 2.998 3.499
8 1.397 1.860 2.306 2.896 3.355
9 1.383 1.833 2.262 2.821 3.250
10 1.372 1.812 2.228 2.764 3.169
11 1.363 1.796 2.201 2.718 3.106
14 1.345 1.761 2.145 2.624 2.977

2.6 💡 CONCLUSIONES CLAVE

✅ Puntos importantes

  • Para muestras pequeñas (n < 30), se utiliza la distribución t-Student en lugar de la normal
  • La distribución t es más dispersa que la normal (colas más pesadas), especialmente con pocos grados de libertad
  • A medida que n aumenta (gl grandes), la distribución t se aproxima a la normal estándar
  • Se requiere que la población sea aproximadamente normal para que la prueba t sea válida
  • El p-valor se calcula usando la función de distribución t (pt en R, t.cdf en Python)

3 📊 APLICACIONES DE PRUEBAS DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS POBLACIONALES CON MUESTRAS GRANDES

📐 INTRODUCCIÓN

Para muestras grandes (n₁ ≥ 30 y n₂ ≥ 30), el Teorema Central del Límite garantiza que la distribución muestral de la diferencia de medias es aproximadamente normal. El estadístico de prueba es:

Z = (X̄₁ - X̄₂) / √(σ₁²/n₁ + σ₂²/n₂)

Cuando las varianzas poblacionales σ₁² y σ₂² son desconocidas, se reemplazan por las varianzas muestrales s₁² y s₂² (válido para n grande).


3.1 📊 CASO I: PRUEBA DE COLA SUPERIOR (H₁: μ₁ - μ₂ > D₀)

🏭 ÁREA DE INGENIERÍAS: Comparación de métodos de producción

Contexto: Un ingeniero industrial quiere determinar si el método A produce mayor resistencia a la tracción que el método B. Se prueban 40 muestras del método A (media = 85 MPa, s = 6 MPa) y 35 muestras del método B (media = 82 MPa, s = 5.5 MPa). Pruebe con α = 0.01.

📐 Solución

Paso 1: Hipótesis
H₀: μ_A - μ_B = 0   vs   H₁: μ_A - μ_B > 0
Paso 2: Nivel de significancia
α = 0.01,  z_{0.01} = 2.326
Paso 3: Estadístico de prueba
Z = (85 - 82) / √(6²/40 + 5.5²/35) = 3 / √(0.9 + 0.864) = 3 / √1.764 = 3 / 1.328 = 2.26
Paso 4: Región de rechazo y decisión

Z = 2.26 < 2.326 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que el método A produce mayor resistencia que el método B.

📊 Código en R

# Parámetros
n1 <- 40; x1 <- 85; s1 <- 6
n2 <- 35; x2 <- 82; s2 <- 5.5
alpha <- 0.01
D0 <- 0

# Estadístico de prueba
z_calculado <- (x1 - x2 - D0) / sqrt(s1^2/n1 + s2^2/n2)
cat("Estadístico Z:", round(z_calculado, 4), "\n")

# Valor crítico
z_critico <- qnorm(1 - alpha)
cat("Valor crítico:", round(z_critico, 4), "\n")

# p-valor
p_valor <- 1 - pnorm(z_calculado)
cat("p-valor:", round(p_valor, 4), "\n")

# Decisión
if (z_calculado > z_critico) {
  cat("Rechazamos H₀: μ_A > μ_B")
} else {
  cat("No rechazamos H₀")
}

# Visualización
library(ggplot2)
x <- seq(-3, 4, length.out = 500)
df_plot <- data.frame(x = x, y = dnorm(x))
ggplot(df_plot, aes(x = x, y = y)) +
  geom_line(color = "blue", linewidth = 1) +
  geom_area(data = subset(df_plot, x > z_critico), aes(x = x, y = y), fill = "red", alpha = 0.5) +
  geom_vline(xintercept = z_calculado, color = "darkgreen", linewidth = 1.2, linetype = "dashed") +
  geom_vline(xintercept = z_critico, color = "red", linewidth = 1, linetype = "dotted") +
  labs(title = "Prueba de diferencia de medias (cola superior) - Ingeniería", 
       x = "Z", y = "Densidad") +
  theme_minimal()
Prueba Z diferencia de medias (α=0.01) 2.326 2.26

💰 ÁREA DE CIENCIAS ECONÓMICAS: Rendimiento de fondos de inversión

Contexto: Un analista afirma que el Fondo A tiene un rendimiento superior al Fondo B. Se toman 50 meses del Fondo A (media = 12.5%, s = 3.2%) y 45 meses del Fondo B (media = 11.8%, s = 3.5%). Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ_A - μ_B = 0   vs   H₁: μ_A - μ_B > 0
Paso 2: Nivel de significancia
α = 0.05,  z_{0.05} = 1.645
Paso 3: Estadístico de prueba
Z = (12.5 - 11.8) / √(3.2²/50 + 3.5²/45) = 0.7 / √(0.2048 + 0.2722) = 0.7 / √0.477 = 0.7 / 0.691 = 1.013
Paso 4: Decisión

Z = 1.013 < 1.645 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que el Fondo A tiene mayor rendimiento que el Fondo B.

📊 Código en Python

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Parámetros
n1, x1, s1 = 50, 12.5, 3.2
n2, x2, s2 = 45, 11.8, 3.5
alpha = 0.05
D0 = 0

# Estadístico
z_calc = (x1 - x2 - D0) / np.sqrt(s1**2/n1 + s2**2/n2)
z_crit = norm.ppf(1 - alpha)
p_valor = 1 - norm.cdf(z_calc)

print(f"Z = {z_calc:.4f}, valor crítico = {z_crit:.4f}, p-valor = {p_valor:.4f}")

# Visualización
x = np.linspace(-3, 4, 500)
y = norm.pdf(x)
plt.figure(figsize=(10, 5))
plt.plot(x, y, color='blue', linewidth=2)
x_fill = np.linspace(z_crit, 4, 200)
plt.fill_between(x_fill, 0, norm.pdf(x_fill), color='red', alpha=0.3)
plt.axvline(x=z_calc, color='green', linestyle='dashed', linewidth=2)
plt.axvline(x=z_crit, color='red', linestyle='dotted', linewidth=1.5)
plt.title('Prueba de diferencia de medias - Fondos de inversión')
plt.xlabel('Z')
plt.ylabel('Densidad')
plt.show()

🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO Y LA SALUD: Eficacia de una terapia

Contexto: Un psicólogo quiere determinar si la Terapia Cognitivo-Conductual (TCC) es más efectiva que la terapia tradicional para reducir la ansiedad (menor puntaje es mejor). Se evalúan 60 pacientes con TCC (media = 32, s = 8) y 55 con terapia tradicional (media = 35, s = 7.5). Compare con α = 0.05. (Nota: menor puntaje indica menos ansiedad)

Paso 1: Hipótesis
H₀: μ_TCC - μ_Trad = 0   vs   H₁: μ_TCC - μ_Trad < 0

Nota: La hipótesis alternativa indica que la TCC produce menor ansiedad (diferencia negativa).

Paso 2: Nivel de significancia
α = 0.05,  -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (32 - 35) / √(8²/60 + 7.5²/55) = -3 / √(1.067 + 1.023) = -3 / √2.09 = -3 / 1.446 = -2.075
Paso 4: Decisión

Z = -2.075 < -1.645 → Rechazamos H₀

Conclusión: Existe evidencia para afirmar que la TCC es más efectiva que la terapia tradicional para reducir la ansiedad.

📊 Código en R

# Datos
n1 <- 60; x1 <- 32; s1 <- 8
n2 <- 55; x2 <- 35; s2 <- 7.5
alpha <- 0.05

z_calc <- (x1 - x2) / sqrt(s1^2/n1 + s2^2/n2)
z_crit <- qnorm(alpha)  # Cola inferior
p_valor <- pnorm(z_calc)

cat("Z =", round(z_calc, 4), "\n")
cat("Valor crítico =", round(z_crit, 4), "\n")
cat("p-valor =", round(p_valor, 4), "\n")

if (z_calc < z_crit) {
  cat("Rechazamos H₀: la TCC reduce más la ansiedad")
} else {
  cat("No rechazamos H₀")
}

3.2 📊 CASO II: PRUEBA DE COLA INFERIOR (H₁: μ₁ - μ₂ < D₀)

🏭 ÁREA DE INGENIERÍAS: Consumo energético

Contexto: Se quiere determinar si el motor A consume menos energía que el motor B. Se prueban 36 motores A (media = 120 kWh, s = 15 kWh) y 40 motores B (media = 125 kWh, s = 14 kWh). Pruebe con α = 0.01.

Paso 1: Hipótesis
H₀: μ_A - μ_B = 0   vs   H₁: μ_A - μ_B < 0
Paso 2: Nivel de significancia
α = 0.01,  -z_{0.01} = -2.326
Paso 3: Estadístico de prueba
Z = (120 - 125) / √(15²/36 + 14²/40) = -5 / √(6.25 + 4.9) = -5 / √11.15 = -5 / 3.339 = -1.497
Paso 4: Decisión

Z = -1.497 > -2.326 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que el motor A consume menos energía que el motor B.


💰 ÁREA DE CIENCIAS ECONÓMICAS: Costos operativos

Contexto: Un gerente afirma que la Planta A tiene costos operativos medios inferiores a la Planta B. Se toman 45 días de la Planta A (media = $520, s = $45) y 50 días de la Planta B (media = $535, s = $50). Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ_A - μ_B = 0   vs   H₁: μ_A - μ_B < 0
Paso 2: Nivel de significancia
α = 0.05,  -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (520 - 535) / √(45²/45 + 50²/50) = -15 / √(45 + 50) = -15 / √95 = -15 / 9.747 = -1.539
Paso 4: Decisión

Z = -1.539 > -1.645 → No rechazamos H₀

Conclusión: No hay suficiente evidencia para afirmar que la Planta A tiene costos inferiores.


🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO: Tiempo de reacción

Contexto: Se quiere determinar si el Grupo A (entrenado) tiene menor tiempo de reacción que el Grupo B (no entrenado). Se miden 60 personas del Grupo A (media = 0.32 s, s = 0.08 s) y 55 del Grupo B (media = 0.35 s, s = 0.09 s). Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ_A - μ_B = 0   vs   H₁: μ_A - μ_B < 0
Paso 2: Nivel de significancia
α = 0.05,  -z_{0.05} = -1.645
Paso 3: Estadístico de prueba
Z = (0.32 - 0.35) / √(0.08²/60 + 0.09²/55) = -0.03 / √(0.000107 + 0.000147) = -0.03 / √0.000254 = -0.03 / 0.01594 = -1.882
Paso 4: Decisión

Z = -1.882 < -1.645 → Rechazamos H₀

Conclusión: El grupo entrenado tiene un tiempo de reacción significativamente menor.


3.3 📊 CASO III: PRUEBA DE DOS COLAS (H₁: μ₁ - μ₂ ≠ D₀)

🏭 ÁREA DE INGENIERÍAS: Calidad de productos

Contexto: Se quiere determinar si hay diferencia en la resistencia media de dos lotes de producción. Lote 1: n₁=38, x̄₁=92 MPa, s₁=5 MPa. Lote 2: n₂=42, x̄₂=90 MPa, s₂=4.8 MPa. Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ₁ - μ₂ = 0   vs   H₁: μ₁ - μ₂ ≠ 0
Paso 2: Nivel de significancia
α = 0.05,  z_{0.025} = 1.96
Paso 3: Estadístico de prueba
Z = (92 - 90) / √(5²/38 + 4.8²/42) = 2 / √(0.6579 + 0.5486) = 2 / √1.2065 = 2 / 1.098 = 1.822
Paso 4: Decisión

|Z| = 1.822 < 1.96 → No rechazamos H₀

Conclusión: No hay evidencia suficiente para afirmar que existe diferencia en la resistencia media.

📊 Código en Python

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

n1, x1, s1 = 38, 92, 5
n2, x2, s2 = 42, 90, 4.8
alpha = 0.05

z_calc = (x1 - x2) / np.sqrt(s1**2/n1 + s2**2/n2)
z_crit = norm.ppf(1 - alpha/2)
p_valor = 2 * (1 - norm.cdf(abs(z_calc)))

print(f"Z = {z_calc:.4f}, valor crítico = {z_crit:.4f}, p-valor = {p_valor:.4f}")

# Visualización
x = np.linspace(-4, 4, 500)
y = norm.pdf(x)
plt.figure(figsize=(10, 5))
plt.plot(x, y, color='blue', linewidth=2)
x_fill_left = np.linspace(-4, -z_crit, 200)
x_fill_right = np.linspace(z_crit, 4, 200)
plt.fill_between(x_fill_left, 0, norm.pdf(x_fill_left), color='red', alpha=0.3)
plt.fill_between(x_fill_right, 0, norm.pdf(x_fill_right), color='red', alpha=0.3)
plt.axvline(x=z_calc, color='green', linestyle='dashed', linewidth=2)
plt.axvline(x=-z_calc, color='green', linestyle='dashed', linewidth=2)
plt.axvline(x=z_crit, color='red', linestyle='dotted', linewidth=1.5)
plt.axvline(x=-z_crit, color='red', linestyle='dotted', linewidth=1.5)
plt.title('Prueba de dos colas para diferencia de medias - Calidad')
plt.xlabel('Z')
plt.ylabel('Densidad')
plt.show()
Prueba dos colas (α=0.05) diff. medias

💰 ÁREA DE CIENCIAS ECONÓMICAS: Salarios por sector

Contexto: Se quiere determinar si hay diferencia en el salario medio entre el sector privado y público. Privado: n₁=100, x̄₁=$2,500, s₁=$400. Público: n₂=80, x̄₂=$2,600, s₂=$450. Pruebe con α = 0.05.

Paso 1: Hipótesis
H₀: μ_Pv - μ_Pb = 0   vs   H₁: μ_Pv - μ_Pb ≠ 0
Paso 2: Nivel de significancia
α = 0.05,  z_{0.025} = 1.96
Paso 3: Estadístico de prueba
Z = (2500 - 2600) / √(400²/100 + 450²/80) = -100 / √(1600 + 2531.25) = -100 / √4131.25 = -100 / 64.28 = -1.556
Paso 4: Decisión

|Z| = 1.556 < 1.96 → No rechazamos H₀

Conclusión: No hay evidencia suficiente de diferencia salarial entre sectores.


🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO: Efectividad de dos tipos de terapia

Contexto: Se quiere comparar la efectividad de la Terapia A (cognitiva) vs Terapia B (conductual) en la reducción de síntomas depresivos (menor puntaje es mejor). Terapia A: n₁=45, x̄₁=28, s₁=6. Terapia B: n₂=50, x̄₂=30, s₂=7. Pruebe si hay diferencia con α = 0.05.

Paso 1: Hipótesis
H₀: μ_A - μ_B = 0   vs   H₁: μ_A - μ_B ≠ 0
Paso 2: Nivel de significancia
α = 0.05,  z_{0.025} = 1.96
Paso 3: Estadístico de prueba
Z = (28 - 30) / √(6²/45 + 7²/50) = -2 / √(0.8 + 0.98) = -2 / √1.78 = -2 / 1.334 = -1.499
Paso 4: Decisión

|Z| = 1.499 < 1.96 → No rechazamos H₀

Conclusión: No hay evidencia suficiente para afirmar que existe diferencia en la efectividad de ambas terapias.


3.4 📊 RESUMEN DE PRUEBAS PARA DIFERENCIA DE MEDIAS (MUESTRAS GRANDES)

📋 Tabla resumen

Caso Hipótesis Estadístico Z Región de rechazo
Cola superior H₀: μ₁-μ₂ ≤ D₀, H₁: μ₁-μ₂ > D₀ (X̄₁-X̄₂-D₀)/√(s₁²/n₁+s₂²/n₂) Z > z_α
Cola inferior H₀: μ₁-μ₂ ≥ D₀, H₁: μ₁-μ₂ < D₀ (X̄₁-X̄₂-D₀)/√(s₁²/n₁+s₂²/n₂) Z < -z_α
Dos colas H₀: μ₁-μ₂ = D₀, H₁: μ₁-μ₂ ≠ D₀ (X̄₁-X̄₂-D₀)/√(s₁²/n₁+s₂²/n₂)

3.5 💡 CONCLUSIONES CLAVE

✅ Puntos importantes

  • Para muestras grandes (n₁,n₂ ≥ 30), se utiliza la distribución normal para la diferencia de medias (TCL)
  • Cuando las varianzas poblacionales son desconocidas, se usan las varianzas muestrales como estimación
  • La prueba Z para dos muestras es robusta incluso si las poblaciones no son estrictamente normales (gracias al TCL)
  • En ingeniería, se usa para comparar procesos, materiales o métodos de producción
  • En ciencias económicas, se aplica para comparar salarios, costos, rendimientos entre grupos
  • En ciencias de la salud y comportamiento, se utiliza para comparar terapias, tratamientos o intervenciones

4 📊 APLICACIONES DE PRUEBAS DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS POBLACIONALES CON MUESTRAS PEQUEÑAS

📐 INTRODUCCIÓN

Para muestras pequeñas (n₁ < 30 o n₂ < 30), la prueba de hipótesis para la diferencia de medias requiere la distribución t-Student. Se presentan tres escenarios:

  • Caso 1: Varianzas poblacionales conocidas → distribución normal (Z) (raro en la práctica)
  • Caso 2: Varianzas poblacionales desconocidas pero iguales → prueba t de Student con varianza combinada (tₚ)
  • Caso 3: Varianzas poblacionales desconocidas y desiguales → prueba t de Welch (tʹ, aproximación de Satterthwaite)

4.1 📊 CASO 1: VARIANZAS CONOCIDAS (Normal)

🏭 ÁREA DE INGENIERÍAS: Comparación de materiales (σ conocidas)

Contexto: Se conocen las varianzas poblacionales (σ₁² = 4, σ₂² = 3.6) para la resistencia de dos materiales. Muestras pequeñas: n₁=15, x̄₁=85 MPa; n₂=12, x̄₂=82 MPa. Pruebe si el material A es superior al B (cola superior) con α = 0.05. Varianzas conocidas.

📐 Fórmula: Z = (X̄₁ - X̄₂) / √(σ₁²/n₁ + σ₂²/n₂)

Paso 1: Hipótesis
H₀: μ₁ - μ₂ = 0   vs   H₁: μ₁ - μ₂ > 0
Paso 2: Nivel de significancia
α = 0.05,  z_{0.05} = 1.645
Paso 3: Estadístico de prueba
Z = (85 - 82) / √(4/15 + 3.6/12) = 3 / √(0.2667 + 0.3) = 3 / √0.5667 = 3 / 0.7528 = 3.985
Paso 4: Decisión

Z = 3.985 > 1.645 → Rechazamos H₀

📊 Código en R

# Parámetros
n1 <- 15; x1 <- 85; sigma1 <- sqrt(4)
n2 <- 12; x2 <- 82; sigma2 <- sqrt(3.6)
alpha <- 0.05

z_calc <- (x1 - x2) / sqrt(sigma1^2/n1 + sigma2^2/n2)
z_crit <- qnorm(1 - alpha)
cat("Z =", round(z_calc, 4), "\n")
cat("Valor crítico =", round(z_crit, 4), "\n")

if (z_calc > z_crit) cat("Rechazamos H₀: μ_A > μ_B")

💰 ÁREA DE CIENCIAS ECONÓMICAS: Retorno de inversiones (σ conocidas)

Contexto: Se conocen σ₁=2.5%, σ₂=3% para dos fondos. Pruebe si el Fondo A es inferior al B con α=0.05 (cola inferior). n₁=10, x̄₁=8.2%; n₂=8, x̄₂=9.5%.

Z = (8.2 - 9.5) / √(2.5²/10 + 3²/8) = -1.3 / √(0.625 + 1.125) = -1.3 / 1.323 = -0.983

Z = -0.983 > -1.645 → No rechazamos H₀

🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO: Eficacia de terapias (σ conocidas)

Contexto: Se conocen σ₁=5, σ₂=6 para reducción de ansiedad. Pruebe si hay diferencia entre terapias con α=0.05 (dos colas). n₁=12, x̄₁=32; n₂=10, x̄₂=35.

Z = (32 - 35) / √(5²/12 + 6²/10) = -3 / √(2.083 + 3.6) = -3 / 2.384 = -1.259

|Z| = 1.259 < 1.96 → No rechazamos H₀


4.2 📊 CASO 2: VARIANZAS DESCONOCIDAS PERO IGUALES (t de Student con varianza combinada)

🏭 ÁREA DE INGENIERÍAS: Comparación de métodos (varianzas iguales)

Contexto: Se comparan dos métodos de ensamblaje. Método A: n₁=12, x̄₁=45 s, s₁=3.5 s. Método B: n₂=10, x̄₂=48 s, s₂=4 s. Pruebe si el Método A es más rápido (cola superior) con α=0.05. Varianzas desconocidas pero supuestas iguales.

📐 Fórmula: t = (X̄₁ - X̄₂) / [Sₚ·√(1/n₁ + 1/n₂)], con gl = n₁+n₂-2, Sₚ² = [(n₁-1)s₁²+(n₂-1)s₂²]/(n₁+n₂-2)

Paso 1: Hipótesis
H₀: μ₁ - μ₂ = 0   vs   H₁: μ₁ - μ₂ > 0
Paso 2: Cálculo de Sₚ²
Sₚ² = [(11)(12.25) + (9)(16)] / (20) = (134.75 + 144)/20 = 278.75/20 = 13.9375, Sₚ = 3.734
Paso 3: Estadístico
t = (45 - 48) / [3.734·√(1/12 + 1/10)] = -3 / (3.734·0.428) = -3 / 1.598 = -1.877
Paso 4: Región de rechazo (cola superior)

t = -1.877 < 1.725 → No rechazamos H₀ (con t calculado negativo, la diferencia no es en el sentido esperado)

📊 Código en R

n1 <- 12; x1 <- 45; s1 <- 3.5
n2 <- 10; x2 <- 48; s2 <- 4
alpha <- 0.05

sp2 <- ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1 + n2 - 2)
sp <- sqrt(sp2)
t_calc <- (x1 - x2) / (sp * sqrt(1/n1 + 1/n2))
t_crit <- qt(1 - alpha, df = n1 + n2 - 2)
cat("t =", round(t_calc, 4), "; t_crítico =", round(t_crit, 4))

# Visualización
library(ggplot2)
x <- seq(-4, 4, length.out = 500)
df_plot <- data.frame(x = x, y = dt(x, df = n1+n2-2))
ggplot(df_plot, aes(x = x, y = y)) +
  geom_line(color = "blue") +
  geom_area(data = subset(df_plot, x > t_crit), aes(x = x, y = y), fill = "red", alpha = 0.5) +
  geom_vline(xintercept = t_calc, color = "green", linetype = "dashed") +
  labs(title = "Prueba t cola superior (varianzas iguales)")

💰 ÁREA DE CIENCIAS ECONÓMICAS: Salarios por sector (varianzas iguales)

Contexto: Sector Público vs Privado. Pruebe si el salario público es menor (cola inferior). Público: n₁=15, x̄₁=2500, s₁=350; Privado: n₂=12, x̄₂=2700, s₂=380. α=0.05.

Sₚ² = [14·122500 + 11·144400]/25 = (1,715,000 + 1,588,400)/25 = 3,303,400/25 = 132,136, Sₚ = 363.5
t = (2500 - 2700) / [363.5·√(1/15+1/12)] = -200 / (363.5·0.387) = -200 / 140.7 = -1.422
t_crítico (α=0.05, gl=25, cola inferior) = -1.708
-1.422 > -1.708 → No rechazamos H₀

🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO: Terapia cognitiva vs conductual (dos colas)

Contexto: Comparar efectividad de dos terapias. Terapia A: n₁=14, x̄₁=25, s₁=5; Terapia B: n₂=12, x̄₂=28, s₂=6. Pruebe si hay diferencia (dos colas) con α=0.05.

Sₚ² = [13·25 + 11·36]/24 = (325 + 396)/24 = 721/24 = 30.042, Sₚ = 5.481
t = (25 - 28) / [5.481·√(1/14+1/12)] = -3 / (5.481·0.396) = -3 / 2.170 = -1.382
t_crítico (α/2=0.025, gl=24) = ±2.064
|t| = 1.382 < 2.064 → No rechazamos H₀

4.3 📊 CASO 3: VARIANZAS DESCONOCIDAS Y DESIGUALES (Prueba t de Welch)

🏭 ÁREA DE INGENIERÍAS: Resistencia de materiales (varianzas diferentes)

Contexto: Se sospecha que las varianzas de dos materiales son diferentes. Material A: n₁=10, x̄₁=88 MPa, s₁=6 MPa. Material B: n₂=12, x̄₂=83 MPa, s₂=3 MPa. Pruebe si el Material A es superior (cola superior) con α=0.05. Varianzas desiguales.

📐 Fórmula t de Welch: t = (X̄₁ - X̄₂) / √(s₁²/n₁ + s₂²/n₂)

Grados de libertad (Satterthwaite): gl = (s₁²/n₁ + s₂²/n₂)² / [ (s₁²/n₁)²/(n₁-1) + (s₂²/n₂)²/(n₂-1) ]

Paso 1: Hipótesis
H₀: μ₁ - μ₂ = 0   vs   H₁: μ₁ - μ₂ > 0
Paso 2: Estadístico
t = (88 - 83) / √(6²/10 + 3²/12) = 5 / √(3.6 + 0.75) = 5 / √4.35 = 5 / 2.086 = 2.397
Paso 3: Grados de libertad
gl = (3.6 + 0.75)² / [3.6²/9 + 0.75²/11] = (4.35)² / (12.96/9 + 0.5625/11) = 18.9225 / (1.44 + 0.051) = 18.9225 / 1.491 = 12.69 ≈ 12
Paso 4: Decisión

t_crítico = t_{0.05,12} = 1.782, t = 2.397 > 1.782 → Rechazamos H₀

📊 Código en Python

import numpy as np
from scipy.stats import t

n1, x1, s1 = 10, 88, 6
n2, x2, s2 = 12, 83, 3
alpha = 0.05

t_calc = (x1 - x2) / np.sqrt(s1**2/n1 + s2**2/n2)
numerador = (s1**2/n1 + s2**2/n2)**2
denominador = (s1**2/n1)**2/(n1-1) + (s2**2/n2)**2/(n2-1)
gl = numerador / denominador
t_crit = t.ppf(1 - alpha, gl)

print(f"t = {t_calc:.4f}, gl = {gl:.2f}, t_crítico = {t_crit:.4f}")

# Visualización
import matplotlib.pyplot as plt
x = np.linspace(-4, 4, 500)
y = t.pdf(x, gl)
plt.plot(x, y, color='blue')
x_fill = np.linspace(t_crit, 4, 200)
plt.fill_between(x_fill, 0, t.pdf(x_fill, gl), color='red', alpha=0.3)
plt.axvline(x=t_calc, color='green', linestyle='dashed')
plt.axvline(x=t_crit, color='red', linestyle='dotted')
plt.title('Prueba t de Welch (cola superior)')
plt.show()

💰 ÁREA DE CIENCIAS ECONÓMICAS: Rentabilidad de empresas (varianzas diferentes)

Contexto: Pruebe si la rentabilidad de empresas grandes es inferior a la de pequeñas (cola inferior). Grandes: n₁=10, x̄₁=12%, s₁=4%; Pequeñas: n₂=15, x̄₂=14%, s₂=5%. α=0.05.

t = (12 - 14) / √(16/10 + 25/15) = -2 / √(1.6 + 1.667) = -2 / 1.807 = -1.107
gl ≈ 20.5, t_crítico (col.inferior) = -1.725, -1.107 > -1.725 → No rechazamos H₀

🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO: Eficacia de dos intervenciones (dos colas, varianzas diferentes)

Contexto: Pruebe si hay diferencia en la reducción de síntomas entre dos intervenciones. Interv.A: n₁=8, x̄₁=30, s₁=7; Interv.B: n₂=10, x̄₂=35, s₂=4. α=0.05.

t = (30 - 35) / √(49/8 + 16/10) = -5 / √(6.125 + 1.6) = -5 / 2.779 = -1.799
gl ≈ 10.2, t_crítico (α/2=0.025) = ±2.228, |t| = 1.799 < 2.228 → No rechazamos H₀

4.4 📊 RESUMEN DE PRUEBAS PARA DIFERENCIA DE MEDIAS (MUESTRAS PEQUEÑAS)

📋 Tabla resumen de casos

Escenario Varianzas Estadístico Distribución Grados de libertad
Caso 1 Conocidas Z = (X̄₁-X̄₂)/√(σ₁²/n₁+σ₂²/n₂) Normal No aplica
Caso 2 Desconocidas, iguales t = (X̄₁-X̄₂)/[Sₚ√(1/n₁+1/n₂)] t-Student n₁+n₂-2
Caso 3 Desconocidas, desiguales t’ = (X̄₁-X̄₂)/√(s₁²/n₁+s₂²/n₂) t-Student (Welch) Satterthwaite

4.5 📊 DECISIÓN POR REGIONES DE RECHAZO

📋 Resumen de reglas de decisión

Tipo de prueba Región de rechazo (H₁)
Cola superior (μ₁ - μ₂ > D₀) t > t_{α, gl}
Cola inferior (μ₁ - μ₂ < D₀) t < -t_{α, gl}
Dos colas (μ₁ - μ₂ ≠ D₀)

4.6 💡 CONCLUSIONES CLAVE

✅ Puntos importantes

  • Para varianzas conocidas (raro en la práctica), se usa la distribución normal Z
  • Para varianzas desconocidas pero iguales, la prueba t con varianza combinada es la más potente
  • Para varianzas desconocidas y desiguales, la prueba t de Welch es la más recomendada (no requiere igualdad de varianzas)
  • La prueba de Welch es más robusta y debe ser la primera opción cuando se duda de la igualdad de varianzas
  • En R, t.test(x, y, var.equal=TRUE/FALSE) permite elegir entre t de Student (TRUE) o t de Welch (FALSE)
  • En Python, scipy.stats.ttest_ind(a, b, equal_var=True/False) cumple la misma función

5 📊 PRUEBAS PARA MUESTRAS PAREADAS (DEPENDIENTES) - MUESTRAS PEQUEÑAS

📐 INTRODUCCIÓN A MUESTRAS PAREADAS (DEPENDIENTES)

En las pruebas para muestras pareadas, las observaciones están emparejadas o relacionadas entre sí. Ejemplos típicos incluyen:

  • Mediciones antes-después en los mismos individuos
  • Pares hermanos gemelos o parejas emparejadas
  • Mediciones en dos métodos aplicados a los mismos sujetos

El estadístico de prueba se basa en las diferencias entre pares: Dᵢ = X₁ᵢ - X₂ᵢ

t = D̄ / (s_D/√n)

donde D̄ es la media de las diferencias, s_D es la desviación estándar de las diferencias, y n es el número de pares. Los grados de libertad son gl = n - 1.


5.1 📊 CASO I: PRUEBA DE COLA SUPERIOR (H₁: μ_D > D₀) - “Antes vs Después” (Mejora)

🏭 ÁREA DE INGENIERÍAS: Eficiencia de un nuevo software de diseño

Contexto: Se mide el tiempo de diseño (horas) de 8 ingenieros antes y después de implementar un nuevo software. ¿El software reduce el tiempo de diseño? (Reducción = diferencia positiva). Pruebe con α = 0.05.

Datos (tiempo en horas):

Ingeniero Antes (X₁) Después (X₂) Diferencia (D = X₁ - X₂)
1 12 10 2
2 15 13 2
3 10 9 1
4 14 11 3
5 13 12 1
6 11 10 1
7 16 14 2
8 9 8 1
Paso 1: Hipótesis
H₀: μ_D = 0   vs   H₁: μ_D > 0 (el software reduce el tiempo)
Paso 2: Cálculos
n = 8
D̄ = (2+2+1+3+1+1+2+1)/8 = 13/8 = 1.625
s_D = √[Σ(D - D̄)²/(n-1)] = √[(0.1406+0.1406+0.3906+1.8906+0.3906+0.3906+0.1406+0.3906)/7] = √[3.8748/7] = √0.5535 = 0.744
Paso 3: Estadístico de prueba
t = D̄ / (s_D/√n) = 1.625 / (0.744/√8) = 1.625 / (0.744/2.828) = 1.625 / 0.263 = 6.178
Paso 4: Decisión (α=0.05, gl=7, t_crítico=1.895)

t = 6.178 > 1.895 → Rechazamos H₀

Conclusión: El nuevo software reduce significativamente el tiempo de diseño.

📊 Código en R

# Datos
antes <- c(12, 15, 10, 14, 13, 11, 16, 9)
despues <- c(10, 13, 9, 11, 12, 10, 14, 8)
diferencias <- antes - despues

# Prueba t pareada (cola superior)
t_test <- t.test(antes, despues, alternative = "greater", paired = TRUE)
print(t_test)

# Visualización
library(ggplot2)
df_plot <- data.frame(
  Ingeniero = 1:8,
  Antes = antes,
  Despues = despues
)
df_long <- reshape2::melt(df_plot, id.vars = "Ingeniero", 
                          variable.name = "Tiempo", value.name = "Horas")

ggplot(df_long, aes(x = factor(Ingeniero), y = Horas, fill = Tiempo)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Comparación de tiempos antes vs después",
       x = "Ingeniero", y = "Horas") +
  theme_minimal() +
  scale_fill_manual(values = c("blue", "lightgreen"))
Distribución t(7) - Prueba pareada cola superior 1.895 t = 6.178

💰 ÁREA DE CIENCIAS ECONÓMICAS: Efecto de una capacitación en productividad

Contexto: Se mide la productividad (unidades/día) de 10 trabajadores antes y después de una capacitación. ¿La capacitación aumenta la productividad? (Aumento = diferencia positiva). Pruebe con α = 0.01.

Datos resumen:

n = 10,  D̄ = 5.2,  s_D = 4.8
t = 5.2 / (4.8/√10) = 5.2 / 1.518 = 3.425

t_crítico (α=0.01, gl=9, cola superior) = 2.821
3.425 > 2.821 → Rechazamos H₀

📊 Código en Python

import numpy as np
from scipy.stats import ttest_rel

# Datos simulados
np.random.seed(123)
antes = np.random.normal(50, 10, 10)
despues = antes + np.random.normal(5.2, 4.8, 10)

t_stat, p_valor = ttest_rel(despues, antes, alternative='greater')
print(f"t = {t_stat:.4f}, p-valor = {p_valor:.4f}")

🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO Y LA SALUD: Efecto de un fármaco en presión arterial

Contexto: Se mide la presión arterial sistólica de 12 pacientes antes y después de administrar un fármaco. ¿El fármaco reduce la presión arterial? (Reducción = diferencia positiva). Pruebe con α = 0.05.

Datos diferencias (antes - después): [8, 12, 5, 15, 6, 10, 9, 11, 7, 13, 8, 9]
n = 12,  D̄ = 9.42,  s_D = 2.81
t = 9.42 / (2.81/√12) = 9.42 / 0.811 = 11.62

t_crítico (α=0.05, gl=11, cola superior) = 1.796
11.62 > 1.796 → Rechazamos H₀ (el fármaco reduce la presión)


5.2 📊 CASO II: PRUEBA DE COLA INFERIOR (H₁: μ_D < D₀) - “Antes vs Después” (Empeoramiento)

🏭 ÁREA DE INGENIERÍAS: Desgaste de maquinaria

Contexto: Se mide la eficiencia de 6 máquinas antes y después de 6 meses de uso. ¿La eficiencia disminuye con el uso? (disminución = diferencia positiva, pero aquí definimos D = antes - después, H₁: μ_D < 0 indica que después es mayor??). Replanteo: D = después - antes. H₁: μ_D > 0 si aumenta, μ_D < 0 si disminuye.

Definimos D = eficiencia_antes - eficiencia_después. Si la máquina pierde eficiencia, D > 0. Prueba cola superior (ya visto). Para cola inferior, podemos definir D = eficiencia_despues - eficiencia_antes, y probar μ_D < 0 (disminución).

💰 ÁREA DE CIENCIAS ECONÓMICAS: Efecto de una crisis en ventas

Contexto: Ventas mensuales (millones $) de 8 tiendas antes y después de una crisis económica. ¿Las ventas disminuyeron? Pruebe con α = 0.05.

D = ventas_antes - ventas_despues, n=8, D̄=3.5, s_D=2.1
t = 3.5 / (2.1/√8) = 3.5 / 0.742 = 4.717
t_crítico (α=0.05, gl=7, cola superior) = 1.895
4.717 > 1.895 → Rechazamos H₀ (las ventas disminuyeron)

5.3 📊 CASO III: PRUEBA DE DOS COLAS (H₁: μ_D ≠ D₀) - Diferencia bilateral

🏭 ÁREA DE INGENIERÍAS: Comparación de dos métodos de medición

Contexto: Se miden 10 piezas con dos instrumentos diferentes. ¿Hay diferencia sistemática entre los instrumentos? Pruebe con α = 0.05 (dos colas).

Datos (diferencias Instrumento1 - Instrumento2): [0.2, -0.1, 0.3, 0.1, -0.2, 0.2, 0.0, -0.1, 0.2, 0.1]

n = 10,  D̄ = 0.07,  s_D = 0.155
t = 0.07 / (0.155/√10) = 0.07 / 0.049 = 1.429

t_crítico (α/2=0.025, gl=9) = ±2.262
|t| = 1.429 < 2.262 → No rechazamos H₀

Conclusión: No hay evidencia de diferencia sistemática entre los instrumentos.

📊 Código en R

# Datos de diferencias
diferencias <- c(0.2, -0.1, 0.3, 0.1, -0.2, 0.2, 0.0, -0.1, 0.2, 0.1)

# Prueba t para una muestra (sobre las diferencias)
t_test <- t.test(diferencias, mu = 0, alternative = "two.sided")
print(t_test)

# Visualización
library(ggplot2)
df_plot <- data.frame(Diferencias = diferencias)
ggplot(df_plot, aes(x = Diferencias)) +
  geom_histogram(bins = 5, fill = "lightblue", color = "black") +
  geom_vline(xintercept = mean(diferencias), color = "red", linewidth = 1.2) +
  labs(title = "Distribución de diferencias entre instrumentos",
       x = "Diferencia (Instrumento1 - Instrumento2)") +
  theme_minimal()
Prueba t pareada dos colas (gl=9)

💰 ÁREA DE CIENCIAS ECONÓMICAS: Evaluación de un programa de fidelización

Contexto: Se miden las ventas (miles $) de 15 clientes antes y después de un programa de fidelización. ¿El programa cambió las ventas (puede aumentar o disminuir)? Pruebe dos colas con α = 0.05.

D = ventas_despues - ventas_antes, n=15, D̄=1.8, s_D=3.2
t = 1.8 / (3.2/√15) = 1.8 / 0.826 = 2.179
t_crítico (α/2=0.025, gl=14) = ±2.145
|t| = 2.179 > 2.145 → Rechazamos H₀ (el programa sí cambió las ventas)

🧠 ÁREA DE CIENCIAS DEL COMPORTAMIENTO: Evaluación de un tratamiento psicológico

Contexto: Se miden los puntajes de depresión (escala BDI) de 12 pacientes antes y después de 8 semanas de terapia. ¿El tratamiento modifica los puntajes (puede aumentar o disminuir)? Pruebe dos colas con α = 0.01.

D = antes - después (reducción), n=12, D̄=4.5, s_D=3.8
t = 4.5 / (3.8/√12) = 4.5 / 1.097 = 4.101
t_crítico (α/2=0.005, gl=11) = ±3.106
|t| = 4.101 > 3.106 → Rechazamos H₀ (el tratamiento modifica significativamente los puntajes)

📊 Código en R

# Datos simulados
set.seed(456)
antes <- rnorm(12, 25, 5)
despues <- antes - rnorm(12, 4.5, 3.8)

# Prueba t pareada dos colas
t_test <- t.test(antes, despues, paired = TRUE, alternative = "two.sided")
print(t_test)

# Gráfico de líneas
library(ggplot2)
df_plot <- data.frame(
  Paciente = 1:12,
  Antes = antes,
  Despues = despues
)
ggplot(df_plot, aes(x = factor(Paciente))) +
  geom_line(aes(y = Antes, group = 1), color = "blue") +
  geom_line(aes(y = Despues, group = 1), color = "red") +
  labs(title = "Evolución de puntajes de depresión",
       x = "Paciente", y = "Puntaje BDI") +
  theme_minimal()

5.4 📊 RESUMEN DE PRUEBAS PARA MUESTRAS PAREADAS

📋 Tabla resumen

Tipo de prueba Hipótesis Estadístico t Región de rechazo Grados de libertad
Cola superior H₀: μ_D ≤ D₀, H₁: μ_D > D₀ t = (D̄ - D₀)/(s_D/√n) t > t_{α, n-1} n-1
Cola inferior H₀: μ_D ≥ D₀, H₁: μ_D < D₀ t = (D̄ - D₀)/(s_D/√n) t < -t_{α, n-1} n-1
Dos colas H₀: μ_D = D₀, H₁: μ_D ≠ D₀ t = (D̄ - D₀)/(s_D/√n) t

5.5 📊 EJERCICIOS PRÁCTICOS ADICIONALES

✏️ Ejercicio 1: Prueba pareada cola superior - Programa de ejercicio físico

Se mide el peso (kg) de 10 personas antes y después de 3 meses de ejercicio. ¿El programa reduce el peso? (Diferencias: [3, 2.5, 4, 1.5, 2, 3.5, 1, 2.5, 3, 2])

t_calculado = ______?   t_crítico = ______?   ¿Rechaza H₀?

✏️ Ejercicio 2: Prueba pareada dos colas - Efecto de un curso de estadística

Se miden las calificaciones de 8 estudiantes antes y después de un curso de estadística. Pruebe si el curso cambió las calificaciones. Datos:

Antes: 65, 70, 55, 80, 60, 75, 50, 85
Después: 75, 72, 60, 85, 65, 80, 55, 88

✏️ Ejercicio 3: Prueba pareada cola inferior - Rendimiento de un software

Se mide el tiempo de procesamiento (segundos) de 12 tareas ejecutadas con un software estándar y con un software optimizado. ¿El software optimizado reduce el tiempo?

Diferencias (estándar - optimizado): [2, 0.5, 1.5, 3, 1, 2.5, 0.8, 1.2, 2.2, 1.8, 2.8, 0.3]

5.6 💡 CONCLUSIONES CLAVE

✅ Puntos importantes

  • Las pruebas pareadas eliminan la variabilidad entre sujetos, aumentando la potencia estadística
  • Se aplican cuando las observaciones están naturalmente emparejadas (antes-después, gemelos, mediciones repetidas)
  • El estadístico se calcula sobre las diferencias Dᵢ, reduciendo el problema a una prueba t de una muestra
  • En R, t.test(x, y, paired=TRUE) realiza la prueba pareada
  • En Python, scipy.stats.ttest_rel(a, b) cumple la misma función
  • Los grados de libertad son gl = n - 1, donde n es el número de pares
  • La prueba pareada es más sensible que la prueba para dos muestras independientes cuando hay correlación natural entre pares