“La distribución normal como lenguaje matemático para comprender la variabilidad natural en fenómenos humanos y sociales”
En salud pública, la distribución normal de medidas antropométricas permite establecer parámetros de referencia para el crecimiento y desarrollo. Por ejemplo, las tablas de crecimiento de la OMS se basan en percentiles derivados de distribuciones normales. Un niño cuya estatura está en el percentil 10 significa que solo el 10% de los niños de su edad son más bajos, mientras que un peso en el percentil 90 indica que solo el 10% pesa más.
El Índice de Masa Corporal (IMC) sigue aproximadamente una distribución normal en poblaciones adultas. Esto permite categorizar a los pacientes en bajo peso, normal, sobrepeso y obesidad usando puntos de corte basados en percentiles. En cardiología, la presión arterial sistólica también muestra distribución normal, con valores por encima de 140 mmHg (percentil ~95) considerados hipertensión.
La industria automotriz utiliza percentiles antropométricos para diseñar vehículos que se ajusten al 95% de la población. Por ejemplo, la posición del pedal del freno se diseña considerando que la longitud de la pierna de los conductores sigue una distribución normal. En aeronáutica, los asientos de avión se dimensionan para acomodar las medidas de cadera que siguen una curva normal.
Un colegio colombiano necesita adquirir uniformes para 1,000 estudiantes. Analizando datos históricos, encuentran que la estatura de los estudiantes de séptimo grado sigue una distribución normal con media 150 cm y desviación estándar 10 cm. Esto significa que: • 680 estudiantes (68%) medirán entre 140-160 cm • 950 estudiantes (95%) medirán entre 130-170 cm • Solo 25 estudiantes (2.5%) medirán menos de 130 cm • Solo 25 estudiantes (2.5%) medirán más de 170 cm
Basado en esto, pueden optimizar la compra: más uniformes en tallas medianas (140-160 cm) y pocos en tallas extremas.Los tests de coeficiente intelectual como el WAIS y el WISC están diseñados para que los puntajes sigan una distribución normal con media 100 y desviación estándar 15. Esto permite interpretaciones percentiles: un CI de 115 está en el percentil 84 (mejor que el 84% de la población), mientras que un CI de 130 está en el percentil 98. Esta estandarización facilita comparaciones internacionales y longitudinales.
En psicología educativa, la distribución normal se utiliza para identificar estudiantes con necesidades especiales. Por ejemplo, en pruebas de lectura, un puntaje más de 1.5 desviaciones estándar por debajo de la media puede indicar dislexia. De manera similar, en pruebas de atención, puntajes persistentemente en el percentil 5 o inferior pueden sugerir TDAH, siempre considerando el contexto cultural y socioeconómico.
Las pruebas de aptitud para orientación vocacional (como las baterías diferenciales) generan perfiles donde cada habilidad (verbal, numérica, espacial) se distribuye normalmente. Esto permite identificar fortalezas relativas: un estudiante con percentil 90 en habilidad espacial pero percentil 40 en verbal podría considerar carreras en arquitectura o ingeniería más que en derecho o periodismo.
Las pruebas Saber 11 en Colombia producen puntajes que siguen aproximadamente una distribución normal. Para el año 2023, el puntaje global promedio fue 250 puntos con desviación estándar de 50 puntos. Las universidades utilizan estos percentiles para la admisión: • Medicina en universidad pública: Percentil 95+ (≥ 332 puntos) • Ingeniería en universidad pública: Percentil 80+ (≥ 292 puntos) • Programas técnicos: Percentil 40+ (≥ 237 puntos)
Este sistema permite comparación justa entre colegios de diferentes contextos socioeconómicos, ya que los puntajes se interpretan en relación con la distribución nacional.En análisis criminológico, el número de delitos por cada 100,000 habitantes en diferentes barrios o ciudades sigue a menudo una distribución normal. Esto permite identificar áreas con tasas significativamente superiores al promedio (outliers positivos) que requieren intervención policial focalizada. Por ejemplo, si la tasa promedio de hurto es 500 por 100,000 con σ=100, áreas con tasas superiores a 700 (μ+2σ) serían prioritarias.
El número mensual de casos atendidos por los juzgados colombianos muestra variación normal estacional. La media histórica puede ser 15,000 casos/mes con σ=2,500. Meses con más de 20,000 casos (μ+2σ) representan una carga excepcional que puede justificar medidas extraordinarias como jornadas especiales o redistribución de casos entre jueces.
Los reportes de violencia intrafamiliar por municipio siguen patrones normales que permiten identificar áreas de riesgo. En Colombia, la tasa promedio nacional es aproximadamente 40 casos por 100,000 habitantes. Municipios con tasas persistentemente superiores a 60 (percentil 90) pueden requerir programas especializados de prevención y atención.
Una Secretaría de Gobierno departamental analiza la distribución de casos de violencia intrafamiliar en 50 municipios. Encuentran que el número mensual de casos sigue N(150, 30). Esto implica: • 34 municipios (68%) tendrán entre 120-180 casos/mes • 47 municipios (95%) tendrán entre 90-210 casos/mes • 2-3 municipios (5%) tendrán más de 210 casos/mes
Basado en esto, pueden asignar más psicólogos y trabajadores sociales a los municipios que sistemáticamente están en el percentil 90+, mientras que municipios consistentemente bajo la media podrían compartir recursos.En la industria alimentaria, el contenido neto de productos como gaseosas, leche o arroz sigue distribución normal alrededor del valor declarado. Por ejemplo, latas de gaseosa de 330 ml pueden tener μ=332 ml y σ=1.5 ml para asegurar que prácticamente todas superen los 330 ml. La Superintendencia de Industria y Comercio establece tolerancias basadas en estas distribuciones para proteger a los consumidores.
En ingeniería mecánica, las dimensiones de piezas producidas en masa (como tornillos o cojinetes) siguen distribuciones normales. Un tornillo especificado como 10±0.1 mm se produce típicamente con μ=10.0 mm y σ=0.03 mm. Esto garantiza que el 99.73% de los tornillos (μ±3σ) estén entre 9.91-10.09 mm, cumpliendo las especificaciones con margen de seguridad.
Las cartas de control de Shewhart, herramienta fundamental en gestión de calidad, asumen que las características del proceso siguen distribución normal cuando está bajo control. Puntos fuera de los límites μ±3σ indican causas especiales de variación que requieren investigación. En Colombia, industrias certificadas ISO 9001 utilizan estas técnicas para monitorear procesos continuamente.
Una fábrica de materiales de construcción produce bloques de concreto de 15x20x40 cm. La resistencia a compresión sigue N(150 kg/cm², 15 kg/cm²). Las normas técnicas colombianas (NTC) requieren resistencia mínima de 120 kg/cm². Con la distribución actual: • P(resistencia < 120) = P(Z < -2) = 2.3% (rechazo) • Para reducir rechazos al 0.1%, necesitan μ=120+3σ=165 kg/cm²
La empresa decide mejorar el proceso para lograr μ=165, σ=12, reduciendo el porcentaje de bloques no conformes de 2.3% a 0.1%, ahorrando en reprocesos y mejorando calidad.En psicología educativa, la frecuencia de problemas como dislexia, discalculia o TDAH sigue distribuciones normales en la población escolar. Por ejemplo, aproximadamente el 5-7% de los niños tienen TDAH (percentil ~95 en escalas de hiperactividad). Los tests estandarizados como el Conners o el BASC-3 generan puntajes T (μ=50, σ=10) para comparar a un niño con su grupo normativo por edad y género.
La severidad de problemas como disfemia (tartamudez) o dislalia se mide en escalas continuas que siguen distribución normal. Un niño con percentil 98 en severidad de tartamudez (2+ desviaciones estándar sobre la media) requiere intervención fonoaudiológica intensiva, mientras que uno en percentil 75 podría beneficiarse de terapia preventiva.
Escalas como el CBCL (Child Behavior Checklist) generan puntajes T para problemas internalizantes (ansiedad, depresión) y externalizantes (agresividad, oposición). Puntajes T > 70 (percentil 98) indican problemas clínicamente significativos. En poblaciones escolares colombianas, estos puntajes permiten identificar niños que requieren apoyo psicológico prioritario.
Un psicólogo infantil evalúa a Juan, 8 años, referido por problemas escolares. Los resultados en escalas estandarizadas muestran: • Atención: Percentil 5 (déficit severo) • Lectura: Percentil 15 (déficit moderado) • Conducta: Percentil 85 (problemas externalizantes) • Ansiedad: Percentil 60 (dentro de lo esperado)
El patrón de percentiles, considerando su distribución normal, sugiere TDAH predominante inatento con dificultades específicas de lectura, más que problemas emocionales primarios. La intervención se focalizará en estrategias para atención y apoyo en lectura, no principalmente en terapia emocional.📊
Distribución Normal
Modelo Universal
La distribución normal trasciende las matemáticas puras para convertirse en una herramienta conceptual fundamental en prácticamente todas las disciplinas científicas. Su capacidad para modelar la variabilidad natural en fenómenos tan diversos como el crecimiento humano, el rendimiento académico, la incidencia delictiva o la calidad industrial, la convierte en el lenguaje común de la investigación cuantitativa.
En el contexto colombiano, desde los percentiles del ICFES hasta las tasas de criminalidad por municipio, desde los estándares de calidad industrial hasta los criterios diagnósticos en psicología clínica, la distribución normal proporciona el marco estadístico para la toma de decisiones basada en evidencia. Su enseñanza y comprensión no son solo un ejercicio matemático, sino una competencia esencial para profesionales en salud, educación, ingeniería, ciencias sociales y más.
La próxima vez que veamos una curva de campana, recordemos que no es solo una abstracción matemática, sino el reflejo estadístico de la diversidad y variabilidad que caracterizan nuestro mundo natural y social.🏥 Salud
Crecimiento, diagnóstico, epidemiológía
🎓 Educación
Evaluación, diagnóstico, orientación
⚖️ Justicia
Criminalidad, planificación, políticas
🏭 Industria
Calidad, control, optimización
Fundamentos teóricos, metodología científica y aplicaciones computacionales
“La estadística es, en principio, una ciencia auxiliar. Los procedimientos estadísticos deben ayudar, por lo tanto, a encontrar, verificar y/o rechazar, si es el caso, ciertos aspectos, relaciones, reglas, propiedades, etc., que pueden ser relevantes para algún problema de interés.”
🏷️ Variables Independientes (X)
📉 Variables Dependientes (Y)
Problema Real
Identificación de variables
Modelo Probabilístico
\(f_Y(y, \theta)\)
Recolección de Datos
Muestra \(Y_1, ..., Y_n\)
Análisis Estadístico
Inferencia sobre θ
“Por lo general, no se trabaja con toda la muestra \(Y\), sino con funciones \(S(Y)\), llamadas estadísticas, que consisten en una reducción de la dimensión de la observación.”
1️⃣
2️⃣
3️⃣
\[ \text{Problema} \Rightarrow \text{Modelo} \Rightarrow \text{Datos} \Rightarrow \text{Análisis} \]
“El esquema anterior debe mantenerse en mente para estudiar y aprender los conceptos fundamentales de Estadística. El esquema no es de una sola dirección; debe volverse siempre a los pasos anteriores, comprobando, verificando, modificando y, finalmente, interpretando los resultados de los análisis en términos del problema original.”
🔄 Ciclo Iterativo
🎯 Interpretación Contextual
🎓 2.7. FILOSOFÍA DE LA ESTADÍSTICA INFERENCIAL
Ciencia auxiliar • Metodología rigurosa • Pensamiento crítico • Aplicación práctica • Herramienta para la toma de decisiones informadas
1. Problema: Un laboratorio farmacéutico quiere determinar si un nuevo medicamento para reducir la presión arterial es efectivo.
2. Modelo: La variable de interés es la reducción media
de presión (en mmHg) en pacientes. Se asume que esta reducción sigue una
distribución Normal: Y ~ N(μ, σ²), donde μ
(parámetro θ) es la reducción media poblacional real.
3. Datos: Se administra el fármaco a n=100
pacientes seleccionados aleatoriamente y se mide la reducción en cada
uno, obteniendo la muestra y = (y₁, y₂, …, y₁₀₀).
4. Análisis:
x̄ como estimador μ̂.
1. Problema: Un ingeniero de producción necesita asegurar que la proporción de piezas defectuosas en una línea de montaje no supere el 2%.
2. Modelo: La variable es si una pieza es defectuosa
(éxito=1) o no (fracaso=0). El número de defectuosas en una muestra de n
piezas sigue una distribución Binomial: X ~ Binomial(n, p),
donde p (parámetro θ) es la proporción real de defectos
en la población.
3. Datos: Se inspeccionan n=500 piezas al
azar de un día de producción. Se cuenta cuántas son defectuosas, digamos
x=8.
4. Análisis:
p̂ = 8/500 = 0.016 como estimador de p.
1. Problema: Una startup de tecnología quiere saber si el tiempo promedio de respuesta de su aplicación móvil es menor a 3 segundos tras una actualización.
2. Modelo: La variable es el tiempo de respuesta (en
segundos) para una acción específica. Por el Teorema del Límite Central,
la media muestral de estos tiempos tenderá a una distribución Normal,
incluso si los tiempos individuales no la siguen: X̄ ~ N(μ,
σ²/n), donde μ es el tiempo medio poblacional
real.
3. Datos: Se registran automáticamente los tiempos de
n=200 usuarios seleccionados aleatoriamente después de la
actualización.
4. Análisis:
x̄ = 2.8 s.
# Simulación de datos: Reducción de presión arterial en 100 pacientes
set.seed(123)
reduccion <- rnorm(100, mean = 7, sd = 2) # μ=7, σ=2
# 1. Estimación Puntual (Media muestral)
estimacion_puntual <- mean(reduccion)
cat("Estimación puntual (μ̂):", round(estimacion_puntual, 2), "mmHg\n")
# 2. Intervalo de Confianza del 95%
ic <- t.test(reduccion, conf.level = 0.95)$conf.int
cat("IC 95% para μ: [", round(ic[1],2), ", ", round(ic[2],2), "] mmHg\n")
# 3. Prueba de Hipótesis (Unilateral derecha: H1: μ > 0)
prueba <- t.test(reduccion, alternative = "greater", mu = 0)
cat("Prueba H0: μ ≤ 0 vs H1: μ > 0\n")
cat("Estadístico t:", round(prueba$statistic, 3), "\n")
cat("Valor p:", format.pval(prueba$p.value, digits=3), "\n")
if(prueba$p.value < 0.05) {
cat("Conclusión: Rechazamos H0. El fármaco es efectivo.\n")
} else {
cat("Conclusión: No hay evidencia suficiente para rechazar H0.\n")
}
import numpy as np
import statsmodels.stats.proportion as smprop
# Datos: 8 defectuosas en 500 piezas
n, x = 500, 8
p_muestral = x / n
# 1. Estimación Puntual
print(f"Estimación puntual (p̂): {p_muestral:.3%}")
# 2. Intervalo de Confianza del 99% (Método de Wilson)
ic_inf, ic_sup = smprop.proportion_confint(x, n, alpha=0.01, method='wilson')
print(f"IC 99% para p: [{ic_inf:.3%}, {ic_sup:.3%}]")
# 3. Prueba de Hipótesis (Unilateral derecha: H1: p > 0.02)
# Estadístico Z y valor p
from statsmodels.stats.proportion import proportions_ztest
z_stat, p_value = proportions_ztest(x, n, value=0.02, alternative='larger')
print(f"\nPrueba H0: p ≤ 0.02 vs H1: p > 0.02")
print(f"Estadístico Z: {z_stat:.3f}")
print(f"Valor p: {p_value:.4f}")
if p_value < 0.01: # Nivel de significancia del 1%
print("Conclusión: Rechazamos H0. Evidencia de que la tasa de defectos > 2%.")
else:
print("Conclusión: No hay evidencia suficiente para rechazar H0.")
Análisis del comportamiento de las medias muestrales para poblaciones finitas e infinitas
Definición:
Es la distribución de probabilidad
de todas las medias posibles de muestras de tamaño n que pueden ser
extraídas de una población.
Para población infinita o muestreo con
reemplazo:
• Media: μX̄ = μ
• Varianza:
σ²X̄ = σ²/n
• Desviación estándar: σX̄ =
σ/√n
Teorema del Límite Central:
Para muestras
grandes (n ≥ 30 generalmente), la distribución muestral de la media se
aproxima a una distribución normal, independientemente de la
forma de la distribución poblacional.
Condiciones:
• n ≥ 30 (regla general)
•
Muestreo aleatorio
• Observaciones independientes
Características clave:
1.
Normalidad: La distribución es aproximadamente
normal
2. Media: μX̄ = μ (igual a la
media poblacional)
3. Error estándar: σX̄
= σ/√n
4. Independencia de forma: No importa la
distribución original
Contexto:
Ingresos anuales en una ciudad tienen
distribución sesgada a la derecha con μ = $45,000 y σ =
$15,000.
Problema:
Si tomamos muestras de n = 100
empleados:
• ¿Distribución de X̄?
• P(X̄ > $47,000) =
?
Contexto:
Una máquina produce tornillos con
longitud μ = 50mm, σ = 2mm. Distribución desconocida.
Problema:
Muestras de n = 36 tornillos:
•
Intervalo del 95% para X̄?
• P(49.5 < X̄ < 50.5) = ?
Contexto:
Puntaje SAT tiene μ = 1050, σ = 200.
Distribución bimodal.
Problema:
Muestras de n = 50 estudiantes:
•
Error estándar de X̄?
• P(X̄ < 1000) = ?
Cuándo usar distribución t:
1. Muestra
pequeña: n < 30 generalmente
2. Población
normal: Se asume distribución normal
3. σ
desconocida: Se usa desviación muestral s
4.
Muestreo aleatorio
Características:
• Forma acampanada como la
normal
• Más dispersa que N(0,1)
• Depende de grados de libertad
(gl)
• gl = n - 1
Contexto:
Empresa envía paquetes. Peso
normalmente distribuido.
Muestra: n = 10 paquetes
X̄ = 2.1 kg, s
= 0.3 kg
Problema:
• IC 95% para μ?
• ¿μ = 2.0 kg
plausible?
Contexto:
Estudio médico sobre glucosa en
sangre.
Población normal, σ desconocida.
Muestra: n = 15
pacientes
X̄ = 95 mg/dL, s = 12 mg/dL
Problema:
• P(X̄ > 100 mg/dL)?
• IC 90%
para μ?
Contexto:
Tiempo producción piezas ∼ normal.
Muestra: n = 8 observaciones
X̄ = 42.5 min, s = 3.2 min
μ0 = 40 min (hipótesis)
Problema:
• Prueba H0: μ = 40
•
Nivel α = 0.05
| Característica | Muestras Grandes | Muestras Pequeñas |
|---|---|---|
| Tamaño mínimo | n ≥ 30 (general) | n < 30 |
| Distribución | Aprox. Normal (TLC) | t-Student (exacta) |
| Supuesto forma | Cualquier distribución | Población Normal |
| σ conocida | Usar σ/√n (Z) | Siempre usar s (t) |
| Intervalos | Más estrechos | Más amplios |
| Valores críticos | z (tabla normal) | t (tabla t-Student) |
Contexto:
Tienda: ventas diarias con
distribución desconocida.
μ = $2,500, σ = $500
Parte A (n grande):
n = 100 días, calcular:
• P(X̄ > $2,600)
Solución TLC:
σX̄
= 500/√100 = $50
Z = (2600-2500)/50 = 2
P = 0.0228
Contexto:
Producción resistencias
eléctricas.
Valor nominal: 100Ω, distribución normal.
σ
desconocida.
Caso 1 (n=40):
X̄ = 101.2Ω, s = 4.5Ω
• IC 95%
usando Z (aproximado)
σX̄ = 4.5/√40 = 0.711Ω
IC: 101.2
± 1.96×0.711
= [99.81, 102.59]Ω
Contexto:
Test estandarizado nacional.
Distribución asimétrica, μ = 500, σ = 100
Muestra grande (n=200):
• TLC aplicable
•
σX̄ = 100/√200 = 7.07
• P(X̄ < 490) = P(Z < -1.41) =
0.0793
Distribución Muestral de la Media:
Es la base de
la inferencia estadística. Describe cómo se comportan las medias
muestrales alrededor del parámetro poblacional μ.
Para muestras grandes (n ≥ 30):
• TLC garantiza
normalidad aproximada
• No requiere conocimiento de la distribución
poblacional
• Error estándar: σ/√n (o s/√n si σ
desconocida)
En investigación de mercados:
• Encuestas con n
> 30: usar Z
• Estudios piloto pequeños: usar t
• Muestreo de
productos: considerar TLC
En control de calidad:
• Grandes lotes: TLC para
medias
• Pequeñas muestras: gráficos de control especiales
•
Verificación de especificaciones
Si n ≥ 30:
Confiar en el TLC
Usar Z para
intervalos
Asumir normalidad aproximada
Si n < 30:
Verificar normalidad
Usar
t-Student
Ser cauteloso con conclusiones
En todos los casos:
Reportar tamaño muestral
Especificar método usado
Interpretar en contexto
Contexto: Máquina llena botellas con distribución normal, \(\sigma = 1.0\) onza. Muestra de \(n = 9\) botellas.
Calcular \(P(|\bar{Y} - \mu| \leq 0.3)\):
\[ \begin{aligned} P(|\bar{Y} - \mu| \leq 0.3) &= P\left(-\frac{0.3}{\sigma/\sqrt{n}} \leq Z \leq \frac{0.3}{\sigma/\sqrt{n}}\right) \\ &= P\left(-\frac{0.3}{1/\sqrt{9}} \leq Z \leq \frac{0.3}{1/\sqrt{9}}\right) \\ &= P(-0.9 \leq Z \leq 0.9) = 0.6318 \end{aligned} \]
Encontrar \(n\) tal que \(P(|\bar{Y} - \mu| \leq 0.3) = 0.95\):
\[ \begin{aligned} \frac{0.3}{\sigma/\sqrt{n}} &= 1.96 \quad (\text{valor crítico para } 95\%) \\ 0.3\sqrt{n} &= 1.96 \\ n &= \left(\frac{1.96}{0.3}\right)^2 = 42.68 \approx 43 \end{aligned} \]
# Parámetros sigma <- 1.0; n <- 9; delta <- 0.3 # (a) Probabilidad z_score <- delta / (sigma / sqrt(n)) prob_a <- pnorm(z_score) - pnorm(-z_score) # Resultado: 0.6318 # (b) Tamaño muestral z_alpha <- qnorm(0.975) # 1.96 para 95% n_b <- ceiling((z_alpha * sigma / delta)^2) # Resultado: 43
# Parámetros dados
sigma <- 1.0 # Desviación estándar poblacional
n <- 9 # Tamaño de la muestra
delta <- 0.3 # Margen de error (0.3 onzas)
mu <- 0 # Media real (asumimos μ = 0 para la gráfica)
# Error estándar de la media
se <- sigma / sqrt(n)
# Límites del área a sombrear
lower_limit <- mu - delta
upper_limit <- mu + delta
# Crear una secuencia de valores para la distribución normal
x <- seq(mu - 4 * se, mu + 4 * se, length.out = 1000)
# Calcular la densidad de la distribución normal
y <- dnorm(x, mean = mu, sd = se)
# Graficar la distribución normal
plot(x, y, type = "l", lwd = 2, col = "blue",
xlab = "Media muestral (Ȳ)", ylab = "Densidad",
main = "Distribución normal de la media muestral -Julio Hurtado")
# Sombrear el área entre lower_limit y upper_limit
x_shade <- seq(lower_limit, upper_limit, length.out = 1000)
y_shade <- dnorm(x_shade, mean = mu, sd = se)
polygon(c(lower_limit, x_shade, upper_limit), c(0, y_shade, 0), col = "lightblue", border = NA)
# Añadir líneas verticales para los límites
abline(v = lower_limit, col = "red", lty = 2, lwd = 2)
abline(v = upper_limit, col = "red", lty = 2, lwd = 2)
# Añadir leyenda
legend("topright", legend = c("Distribución normal", "Área sombreada (P(|Ȳ - μ| ≤ 0.3))"),
col = c("blue", "lightblue"), lwd = 2, lty = c(1, NA), fill = c(NA, "lightblue"), border = NA)
# Parámetros dados
sigma <- 1.0 # Desviación estándar poblacional
n <- 9 # Tamaño de la muestra (inciso a)
delta <- 0.3 # Margen de error (0.3 onzas)
prob <- 0.95 # Probabilidad deseada (inciso b)
# (a) Probabilidad de que la media muestral esté a lo más 0.3 onzas de μ
z_score <- delta / (sigma / sqrt(n)) # Cálculo del puntaje Z
prob_a <- pnorm(z_score) - pnorm(-z_score) # Probabilidad usando la distribución normal
# Mostrar resultado del inciso (a)
print(paste("(a) La probabilidad de que la media muestral esté a lo más 0.3 onzas de μ es:", round(prob_a, 4)))
## [1] "(a) La probabilidad de que la media muestral esté a lo más 0.3 onzas de μ es: 0.6319"
# (b) Tamaño de la muestra para que la media esté a lo más 0.3 onzas de μ con probabilidad 0.95
z_alpha <- qnorm((1 + prob) / 2) # Valor crítico de Z para una probabilidad de 0.95
n_b <- ceiling((z_alpha * sigma / delta)^2) # Cálculo del tamaño de la muestra
# Mostrar resultado del inciso (b)
print(paste("(b) El tamaño de la muestra necesario para que la media esté a lo más 0.3 onzas de μ con una probabilidad de 0.95 es:", n_b))
## [1] "(b) El tamaño de la muestra necesario para que la media esté a lo más 0.3 onzas de μ con una probabilidad de 0.95 es: 43"
Análisis probabilístico del contenido promedio de medicamentos usando distribución normal
“El contenido en gramos de un determinado medicamento sigue una distribución normal N(7.5, 0.3). Calcular la probabilidad de que en una muestra de tamaño 5 se obtenga que la media muestral sea menor que 7 gramos.”
A
0.0681
B
0.1587
C
0.0001
D
0.3085
E
0.0228
Datos proporcionados:
• Distribución poblacional: X
~ N(μ, σ²)
• Media poblacional: μ = 7.5 gramos
• Varianza
poblacional: σ² = 0.3
• Desviación estándar: σ = √0.3 ≈ 0.5477
•
Tamaño muestral: n = 5
• Pregunta: P(\(\bar{X}\) < 7)
Contexto
farmacéutico:
• Medicamento con contenido específico
•
Control de calidad en producción
• Muestreo para verificación
•
Cumplimiento de especificaciones
Teorema fundamental:
Si X ~ N(μ, σ²) entonces:
\(\bar{X}\) ~ N(μ, σ²/n)
Aplicación al problema:
• Media muestral:
μ\(\bar{X}\) = μ = 7.5
•
Varianza muestral: σ²\(\bar{X}\) = σ²/n = 0.3/5
•
Desviación estándar muestral:
σ\(\bar{X}\) = σ/√n = √0.3/√5
Cálculo detallado:
σ\(\bar{X}\) = √(0.3/5) = √0.06 ≈ 0.2449
Fórmula de estandarización:
Z = \(\frac{\bar{X} - \mu}{\sigma/\sqrt{n}}\)
Sustitución de valores:
Z = \(\frac{7 - 7.5}{\sqrt{0.3}/\sqrt{5}}\)
Z
= \(\frac{-0.5}{\sqrt{0.3/5}}\)
Z =
\(\frac{-0.5}{\sqrt{0.06}}\)
Z =
\(\frac{-0.5}{0.2449}\)
Resultado:
Z ≈ -2.041
Interpretación:
El valor 7 está aproximadamente
2.041 desviaciones estándar
por debajo de la media
Probabilidad requerida:
P(\(\bar{X}\) < 7) = P(Z < -2.041)
Uso de tabla normal:
P(Z < -2.04) =
0.0207
P(Z < -2.05) = 0.0202
Interpolación
lineal:
Para Z = -2.041:
P = 0.0207 - 0.0001×0.1
P
≈ 0.0206
Resultado exacto:
P(\(\bar{X}\) < 7) = 0.0206
Interpretación:
Solo 2.06% de muestras de tamaño
5
tendrán media menor que 7 gramos
Para un solo medicamento:
Zindividual =
(7 - 7.5)/√0.3
Zindividual = -0.5/0.5477
Zindividual ≈ -0.9129
P(X < 7) = P(Z <
-0.9129)
P(X < 7) ≈ 0.1808 (18.08%)
Comparación:
• Individual: 18.08% probabilidad
• Muestral (n=5): 2.06% probabilidad
Reducción: 18.08% → 2.06%
Factor:
8.8 veces menos probable
Explicación:
La
media muestral tiene menor
variabilidad que observaciones
individuales
Cálculo exacto:
σ\(\bar{X}\) = √(0.3/5) = √0.06
σ\(\bar{X}\) =
0.244948974
Z = (7 - 7.5)/0.244948974
Z =
-0.5/0.244948974
Z = -2.041241452
Probabilidad
exacta:
P(Z < -2.041241452) = 0.02061
Redondeo a 4 decimales:
P = 0.0206
Comparación con opciones:
A) 0.0681 ✗
B) 0.1587
✗
C) 0.0001 ✗
D) 0.3085 ✗
E) 0.0228 ✓ (más cercano)
Respuesta correcta: Opción E
Implicaciones prácticas:
1. Límites de
aceptación:
Si se establece límite inferior en 7g
Solo
2.06% de lotes serían rechazados
cuando el proceso está en
control
2. Tamaño muestral:
n=5 es pequeño
pero suficiente
para detectar desviaciones grandes
3.
Especificaciones:
Media objetivo: 7.5g ±
tolerancia
Proceso capaz si variación es baja
4.
Monitoreo:
Gráficos de control para medias
Límites de control: μ ± 3σ/√n
Respuesta correcta:
0.0228
Opción E
Probabilidad ≈ 2.28%
Verificación:
pnorm(7, 7.5, sqrt(0.3/5)) =
0.0206
Opción E (0.0228) es la más cercana
Interpretación en contexto farmacéutico: En la producción de medicamentos, el contenido debe cumplir especificaciones estrictas. Una probabilidad de 2.28% significa que aproximadamente 1 de cada 44 muestras de 5 unidades tendrá un contenido promedio inferior a 7 gramos cuando el proceso está operando correctamente con media 7.5g. Esto es importante para establecer límites de control estadístico de procesos y determinar cuándo una desviación requiere investigación y corrección del proceso.
💊
Fórmulas clave:
• Distribución muestral: \(\bar{X}\) ~ N(μ, σ²/n)
• Error
estándar: SE = σ/√n
• Puntuación Z: Z = (\(\bar{X}\) - μ)/(σ/√n)
• Probabilidad:
P(\(\bar{X}\) < a) = P(Z <
(a-μ)/(σ/√n))
• Reducción variabilidad: σ/√n vs σ
Resultado interpretado:
Probabilidad: 2.28%
Interpretación: Baja probabilidad
Contexto: Control de calidad
Implicación: Proceso estable
Acción: Monitoreo continuo
Conclusión clave: Este problema ilustra la aplicación práctica del Teorema de Distribución Muestral en control de calidad farmacéutico. La probabilidad de obtener una media muestral menor a 7 gramos es aproximadamente 2.28%, lo cual indica que si el proceso está bajo control (media 7.5g, varianza 0.3), sería relativamente raro encontrar una muestra de 5 unidades con promedio tan bajo. Esta información es crucial para establecer límites de control estadístico y tomar decisiones informadas sobre la calidad del producto.
✅ SOLUCIÓN CORRECTA: OPCIÓN E - 0.0228
Distribución Muestral • Normal Estándar • Control de Calidad • Probabilidad ≈ 2.28%
Análisis probabilístico de defectos en producción alimentaria usando aproximación normal a binomial
“Una fábrica de pasteles elabora, en su producción habitual, un 3% de pasteles defectuosos. Un cliente recibe un pedido de 500 pasteles de la fábrica. Calcular la probabilidad de que encuentre más del 5% de pasteles defectuosos.”
A
0.0235
B
0.0082
C
0.0015
D
0.0002
E
0.0392
Contexto del problema:
• Producto: Pasteles
•
Tamaño del lote: n = 500 pasteles
• Proporción defectuosa habitual:
p = 3% = 0.03
• Proporción crítica: p_crítica = 5% = 0.05
•
Pregunta: P(\(\hat{p}\) > 0.05)
Modelo binomial:
X ~ Binomial(n=500,
p=0.03)
donde X = número de pasteles defectuosos
Cantidad crítica:
5% de 500 = 0.05 × 500 = 25
pasteles
Pregunta equivalente: P(X > 25)
Condiciones para aproximación normal:
1. n × p ≥
5
2. n × (1-p) ≥ 5
Verificación:
• n ×
p = 500 × 0.03 = 15 ≥ 5 ✓
• n × (1-p) = 500 × 0.97 = 485 ≥ 5 ✓
Parámetros distribución aproximada:
• Media: μ
= n × p = 15
• Varianza: σ² = n × p × (1-p)
• Desviación
estándar: σ = √[n × p × (1-p)]
Cálculo
exacto:
σ = √[500 × 0.03 × 0.97]
σ = √[14.55]
σ ≈
3.8144
Corrección por continuidad:
Para P(X > 25) en
distribución discreta
usamos P(X > 25.5) en aproximación
normal
Parámetros distribución normal:
X ~
N(μ = 15, σ = 3.8144)
Cálculo de Z:
Z = (x
- μ)/σ
Z = (25.5 - 15)/3.8144
Z = 10.5/3.8144
Resultado:
Z ≈ 2.753
Interpretación:
25.5 pasteles defectuosos está
2.753 desviaciones estándar
por encima de la media esperada
Probabilidad requerida:
P(X > 25) ≈ P(Z >
2.753)
Uso de propiedades de simetría:
P(Z
> 2.753) = 1 - P(Z < 2.753)
Valores de tabla
normal:
P(Z < 2.75) = 0.99702
P(Z < 2.76) =
0.99711
Interpolación lineal:
Para Z =
2.753:
P = 0.99702 + 0.00009 × 0.3
P ≈ 0.997047
Probabilidad final:
P(Z > 2.753) = 1 -
0.997047
P ≈ 0.002953 ≈ 0.0030
Cálculo exacto de σ:
σ = √[500 × 0.03 × 0.97]
σ
= √[500 × 0.0291]
σ = √[14.55]
σ = 3.814446
Cálculo exacto de Z:
Z = (25.5 - 15)/3.814446
Z
= 10.5/3.814446
Z = 2.752676
Probabilidad
exacta:
P(Z > 2.752676) = 0.002958
Redondeo a 4 decimales:
P ≈ 0.0030
Porcentaje: 0.30%
Interpretación:
Muy baja probabilidad
Distribución binomial exacta:
P(X > 25) = 1 -
P(X ≤ 25)
P(X ≤ 25) = Σ[k=0 a 25]
C(500,k)×0.03k×0.97(500-k)
Valores
aproximados:
P(X > 25) ≈ 0.00298 (exacto)
P(Z >
2.753) ≈ 0.00296 (aproximado)
Error de
aproximación:
Error = |0.00298 - 0.00296| = 0.00002
Error relativo = 0.67%
Comparación con
opciones:
A) 0.0235 ✗ (7.9 veces mayor)
B) 0.0082 ✗
(2.8 veces mayor)
C) 0.0015 ✗ (mitad del valor)
D) 0.0002 ✗ (15
veces menor)
E) 0.0392 ✗ (13.2 veces mayor)
Ninguna
coincide exactamente
Implicaciones prácticas:
1. Límites de
aceptación:
Si cliente rechaza >5% defectuosos
Probabilidad de rechazo ≈ 0.30%
→ Muy baja probabilidad de rechazo
injustificado
2. Capacidad del proceso:
Proceso capaz con 3% defectos
Dificil superar 5% por variación
aleatoria
3. Inspección por muestreo:
Con
n=500, detecta problemas reales
Baja probabilidad de falsa
alarma
4. Garantía de calidad:
Fábrica
puede garantizar ≤5% defectos
Con alta confianza estadística
Probabilidad calculada:
0.0030
≈ 0.30%
(ninguna opción coincide exactamente)
Opción más cercana:
C) 0.0015 (mitad del valor
real)
Interpretación en contexto de producción alimentaria: En la fabricación de pasteles, mantener un 3% de defectos es un estándar razonable. La probabilidad de que en un lote de 500 pasteles se encuentren más del 5% de defectuosos (más de 25 pasteles) es solo del 0.30%. Esto significa que si el proceso está funcionando correctamente al 3% de defectos, sería muy inusual (1 en 333 lotes aproximadamente) encontrar más del 5% de defectos por variación aleatoria. Esta baja probabilidad permite establecer límites de control estadístico confiables.
🎂
Fórmulas clave aplicadas:
• Media binomial: μ =
n × p
• Varianza binomial: σ² = n × p × (1-p)
• Corrección
continuidad: k → k ± 0.5
• Estandarización: Z = (x - μ)/σ
•
Probabilidad cola derecha: P(Z > z)
• Condiciones aproximación:
np ≥ 5, n(1-p) ≥ 5
Resultados obtenidos:
Probabilidad exacta:
0.00296
Porcentaje: 0.30%
Interpretación: Muy baja
1 en 338
lotes aproximadamente
Proceso bajo control
Límite 5% es
conservador
Conclusión clave: La probabilidad de encontrar más del 5% de pasteles defectuosos en un lote de 500, cuando el proceso produce habitualmente 3% de defectos, es aproximadamente 0.30%. Esta probabilidad extremadamente baja indica que si un cliente encuentra más del 5% de defectos, es muy probable que el proceso de producción haya experimentado un cambio significativo y no se trate solo de variación aleatoria. Ninguna de las opciones proporcionadas coincide exactamente con el cálculo, siendo la opción C (0.0015) la más cercana aunque representa aproximadamente la mitad del valor real.
📊 RESULTADO: PROBABILIDAD ≈ 0.0030 (0.30%)
Aproximación Normal-Binomial • Corrección Continuidad • Control de Calidad • Probabilidad Muy Baja
Nota: Ninguna opción coincide exactamente, la más cercana es C) 0.0015