📊 1. LA IMPORTANCIA DE LA DISTRIBUCIÓN NORMAL: EL MODELO UNIVERSAL EN INVESTIGACIÓN APLICADA

🔬 1.1. LA CURVA DE GAUSS EN LA VIDA COTIDIANA: DE LA BIOLOGÍA A LAS CIENCIAS SOCIALES

“La distribución normal como lenguaje matemático para comprender la variabilidad natural en fenómenos humanos y sociales”

📏 1.2. ANTROPOMETRÍA Y VARIABILIDAD BIOLÓGICA HUMANA

🏥 Estatura y Peso en Poblaciones Humanas

📊 Contexto Epidemiológico

En salud pública, la distribución normal de medidas antropométricas permite establecer parámetros de referencia para el crecimiento y desarrollo. Por ejemplo, las tablas de crecimiento de la OMS se basan en percentiles derivados de distribuciones normales. Un niño cuya estatura está en el percentil 10 significa que solo el 10% de los niños de su edad son más bajos, mientras que un peso en el percentil 90 indica que solo el 10% pesa más.

⚖️ Aplicaciones en Medicina Clínica

El Índice de Masa Corporal (IMC) sigue aproximadamente una distribución normal en poblaciones adultas. Esto permite categorizar a los pacientes en bajo peso, normal, sobrepeso y obesidad usando puntos de corte basados en percentiles. En cardiología, la presión arterial sistólica también muestra distribución normal, con valores por encima de 140 mmHg (percentil ~95) considerados hipertensión.

🏭 Implicaciones en Diseño Industrial

La industria automotriz utiliza percentiles antropométricos para diseñar vehículos que se ajusten al 95% de la población. Por ejemplo, la posición del pedal del freno se diseña considerando que la longitud de la pierna de los conductores sigue una distribución normal. En aeronáutica, los asientos de avión se dimensionan para acomodar las medidas de cadera que siguen una curva normal.

📐 Ejemplo Práctico: Tallas de Uniformes Escolares

Un colegio colombiano necesita adquirir uniformes para 1,000 estudiantes. Analizando datos históricos, encuentran que la estatura de los estudiantes de séptimo grado sigue una distribución normal con media 150 cm y desviación estándar 10 cm. Esto significa que: • 680 estudiantes (68%) medirán entre 140-160 cm • 950 estudiantes (95%) medirán entre 130-170 cm • Solo 25 estudiantes (2.5%) medirán menos de 130 cm • Solo 25 estudiantes (2.5%) medirán más de 170 cm

Basado en esto, pueden optimizar la compra: más uniformes en tallas medianas (140-160 cm) y pocos en tallas extremas.

🧠 1.3. PSICOLOGÍA Y EVALUACIÓN DE CAPACIDADES COGNITIVAS

📊 Inteligencia y Habilidades Cognitivas

🎯 Tests de CI y Estandarización

Los tests de coeficiente intelectual como el WAIS y el WISC están diseñados para que los puntajes sigan una distribución normal con media 100 y desviación estándar 15. Esto permite interpretaciones percentiles: un CI de 115 está en el percentil 84 (mejor que el 84% de la población), mientras que un CI de 130 está en el percentil 98. Esta estandarización facilita comparaciones internacionales y longitudinales.

🏫 Diagnóstico de Problemas de Aprendizaje

En psicología educativa, la distribución normal se utiliza para identificar estudiantes con necesidades especiales. Por ejemplo, en pruebas de lectura, un puntaje más de 1.5 desviaciones estándar por debajo de la media puede indicar dislexia. De manera similar, en pruebas de atención, puntajes persistentemente en el percentil 5 o inferior pueden sugerir TDAH, siempre considerando el contexto cultural y socioeconómico.

📈 Evaluación de Habilidades Específicas

Las pruebas de aptitud para orientación vocacional (como las baterías diferenciales) generan perfiles donde cada habilidad (verbal, numérica, espacial) se distribuye normalmente. Esto permite identificar fortalezas relativas: un estudiante con percentil 90 en habilidad espacial pero percentil 40 en verbal podría considerar carreras en arquitectura o ingeniería más que en derecho o periodismo.

🎓 Caso Real: Selección Universitaria en Colombia

Las pruebas Saber 11 en Colombia producen puntajes que siguen aproximadamente una distribución normal. Para el año 2023, el puntaje global promedio fue 250 puntos con desviación estándar de 50 puntos. Las universidades utilizan estos percentiles para la admisión: • Medicina en universidad pública: Percentil 95+ (≥ 332 puntos) • Ingeniería en universidad pública: Percentil 80+ (≥ 292 puntos) • Programas técnicos: Percentil 40+ (≥ 237 puntos)

Este sistema permite comparación justa entre colegios de diferentes contextos socioeconómicos, ya que los puntajes se interpretan en relación con la distribución nacional.

⚖️ 1.4. CIENCIAS SOCIALES Y ANÁLISIS DE FENÓMENOS COLECTIVOS

🔍 Criminología y Seguridad Ciudadana

📊 Tasas de Criminalidad por Localidad

En análisis criminológico, el número de delitos por cada 100,000 habitantes en diferentes barrios o ciudades sigue a menudo una distribución normal. Esto permite identificar áreas con tasas significativamente superiores al promedio (outliers positivos) que requieren intervención policial focalizada. Por ejemplo, si la tasa promedio de hurto es 500 por 100,000 con σ=100, áreas con tasas superiores a 700 (μ+2σ) serían prioritarias.

🏛️ Casos Atendidos por el Sistema Judicial

El número mensual de casos atendidos por los juzgados colombianos muestra variación normal estacional. La media histórica puede ser 15,000 casos/mes con σ=2,500. Meses con más de 20,000 casos (μ+2σ) representan una carga excepcional que puede justificar medidas extraordinarias como jornadas especiales o redistribución de casos entre jueces.

📈 Violencia Intrafamiliar - Análisis Epidemiológico

Los reportes de violencia intrafamiliar por municipio siguen patrones normales que permiten identificar áreas de riesgo. En Colombia, la tasa promedio nacional es aproximadamente 40 casos por 100,000 habitantes. Municipios con tasas persistentemente superiores a 60 (percentil 90) pueden requerir programas especializados de prevención y atención.

🏢 Caso Práctico: Planificación de Comisarías de Familia

Una Secretaría de Gobierno departamental analiza la distribución de casos de violencia intrafamiliar en 50 municipios. Encuentran que el número mensual de casos sigue N(150, 30). Esto implica: • 34 municipios (68%) tendrán entre 120-180 casos/mes • 47 municipios (95%) tendrán entre 90-210 casos/mes • 2-3 municipios (5%) tendrán más de 210 casos/mes

Basado en esto, pueden asignar más psicólogos y trabajadores sociales a los municipios que sistemáticamente están en el percentil 90+, mientras que municipios consistentemente bajo la media podrían compartir recursos.

🏭 1.5. CONTROL DE CALIDAD Y PROCESOS INDUSTRIALES

📦 1.5.1. Manufactura y Procesos de Producción

🥫 1.5.2. Contenido de Productos Envasados

En la industria alimentaria, el contenido neto de productos como gaseosas, leche o arroz sigue distribución normal alrededor del valor declarado. Por ejemplo, latas de gaseosa de 330 ml pueden tener μ=332 ml y σ=1.5 ml para asegurar que prácticamente todas superen los 330 ml. La Superintendencia de Industria y Comercio establece tolerancias basadas en estas distribuciones para proteger a los consumidores.

🔧 1.5.3. Tolerancias Dimensionales en Manufactura

En ingeniería mecánica, las dimensiones de piezas producidas en masa (como tornillos o cojinetes) siguen distribuciones normales. Un tornillo especificado como 10±0.1 mm se produce típicamente con μ=10.0 mm y σ=0.03 mm. Esto garantiza que el 99.73% de los tornillos (μ±3σ) estén entre 9.91-10.09 mm, cumpliendo las especificaciones con margen de seguridad.

📊 1.5.4. Control Estadístico de Procesos

Las cartas de control de Shewhart, herramienta fundamental en gestión de calidad, asumen que las características del proceso siguen distribución normal cuando está bajo control. Puntos fuera de los límites μ±3σ indican causas especiales de variación que requieren investigación. En Colombia, industrias certificadas ISO 9001 utilizan estas técnicas para monitorear procesos continuamente.

🏗️ 1.5.5. Ejemplo Real: Fabricación de Bloques de Concreto

Una fábrica de materiales de construcción produce bloques de concreto de 15x20x40 cm. La resistencia a compresión sigue N(150 kg/cm², 15 kg/cm²). Las normas técnicas colombianas (NTC) requieren resistencia mínima de 120 kg/cm². Con la distribución actual: • P(resistencia < 120) = P(Z < -2) = 2.3% (rechazo) • Para reducir rechazos al 0.1%, necesitan μ=120+3σ=165 kg/cm²

La empresa decide mejorar el proceso para lograr μ=165, σ=12, reduciendo el porcentaje de bloques no conformes de 2.3% a 0.1%, ahorrando en reprocesos y mejorando calidad.

🧒 1.6. PSICOLOGÍA INFANTIL Y PROBLEMAS DEL DESARROLLO

🏫 1.6.1. Evaluación y Diagnóstico en Niñez y Adolescencia

📚 1.6.2. Problemas Escolares y de Aprendizaje

En psicología educativa, la frecuencia de problemas como dislexia, discalculia o TDAH sigue distribuciones normales en la población escolar. Por ejemplo, aproximadamente el 5-7% de los niños tienen TDAH (percentil ~95 en escalas de hiperactividad). Los tests estandarizados como el Conners o el BASC-3 generan puntajes T (μ=50, σ=10) para comparar a un niño con su grupo normativo por edad y género.

🗣️ 1.6.3. Trastornos del Lenguaje y Comunicación

La severidad de problemas como disfemia (tartamudez) o dislalia se mide en escalas continuas que siguen distribución normal. Un niño con percentil 98 en severidad de tartamudez (2+ desviaciones estándar sobre la media) requiere intervención fonoaudiológica intensiva, mientras que uno en percentil 75 podría beneficiarse de terapia preventiva.

😔 1.6.4. Problemas Emocionales y Conductuales

Escalas como el CBCL (Child Behavior Checklist) generan puntajes T para problemas internalizantes (ansiedad, depresión) y externalizantes (agresividad, oposición). Puntajes T > 70 (percentil 98) indican problemas clínicamente significativos. En poblaciones escolares colombianas, estos puntajes permiten identificar niños que requieren apoyo psicológico prioritario.

👨‍👩‍👧‍👦 1.6.5. Caso Clínico: Evaluación Multidimensional de Niño con Dificultades

Un psicólogo infantil evalúa a Juan, 8 años, referido por problemas escolares. Los resultados en escalas estandarizadas muestran: • Atención: Percentil 5 (déficit severo) • Lectura: Percentil 15 (déficit moderado) • Conducta: Percentil 85 (problemas externalizantes) • Ansiedad: Percentil 60 (dentro de lo esperado)

El patrón de percentiles, considerando su distribución normal, sugiere TDAH predominante inatento con dificultades específicas de lectura, más que problemas emocionales primarios. La intervención se focalizará en estrategias para atención y apoyo en lectura, no principalmente en terapia emocional.

🎯 1.7. CONCLUSIÓN: LA NORMALIDAD COMO PARADIGMA CIENTÍFICO

📊

Distribución Normal

Modelo Universal

La distribución normal trasciende las matemáticas puras para convertirse en una herramienta conceptual fundamental en prácticamente todas las disciplinas científicas. Su capacidad para modelar la variabilidad natural en fenómenos tan diversos como el crecimiento humano, el rendimiento académico, la incidencia delictiva o la calidad industrial, la convierte en el lenguaje común de la investigación cuantitativa.

En el contexto colombiano, desde los percentiles del ICFES hasta las tasas de criminalidad por municipio, desde los estándares de calidad industrial hasta los criterios diagnósticos en psicología clínica, la distribución normal proporciona el marco estadístico para la toma de decisiones basada en evidencia. Su enseñanza y comprensión no son solo un ejercicio matemático, sino una competencia esencial para profesionales en salud, educación, ingeniería, ciencias sociales y más.

La próxima vez que veamos una curva de campana, recordemos que no es solo una abstracción matemática, sino el reflejo estadístico de la diversidad y variabilidad que caracterizan nuestro mundo natural y social.

🏥 Salud

Crecimiento, diagnóstico, epidemiológía

🎓 Educación

Evaluación, diagnóstico, orientación

⚖️ Justicia

Criminalidad, planificación, políticas

🏭 Industria

Calidad, control, optimización

📅 2. FUNDAMENTOS TEÓRICOS DE LA - INFERENCIA ESTADÍSTICA

📚 2.1. INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL CON R Y PYTHON

Fundamentos teóricos, metodología científica y aplicaciones computacionales

🎯 2.2. INTRODUCCIÓN - LA CIENCIA AUXILIAR

“La estadística es, en principio, una ciencia auxiliar. Los procedimientos estadísticos deben ayudar, por lo tanto, a encontrar, verificar y/o rechazar, si es el caso, ciertos aspectos, relaciones, reglas, propiedades, etc., que pueden ser relevantes para algún problema de interés.”

🔍 Proceso Estadístico del Investigador

  • Inicia con un problema práctico de aplicación real
  • Identifica variables de interés relevantes
  • Determina escalas de medición apropiadas
  • Considera relaciones causa-efecto (X → Y)
  • Traduce a modelos probabilísticos

📊 Clasificación de Variables

  • Nominal: Etiquetas sin orden (género, color)
  • Ordinal: Con orden pero sin distancia (escala Likert)
  • Métrica: Con distancia y orden (edad, peso)
  • Cualitativas: Codificación simbólica
  • Cuantitativas: Valores numéricos reales

📈 Relaciones de Dependencia

🏷️ Variables Independientes (X)

  • Representan causas
  • Variables predictoras
  • Factores de influencia
  • Manipulables en experimentos

📉 Variables Dependientes (Y)

  • Representan efectos
  • Variables respuesta
  • Resultados observados
  • Medidas de desempeño

🔄 2.3. MODELADO PROBABILÍSTICO Y MUESTREO

🎯 Traducción a Modelos Probabilísticos

  • Variables → Variables Aleatorias
  • Cualitativas → Distribución Binomial/Multinomial
  • Cuantitativas → Distribución Normal
  • Parámetros θ reflejan aspectos relevantes
  • Validación constante del modelo

📐 Definiciones Matemáticas

  • Modelo Probabilístico: \(f_Y(y, \theta)\)
  • Función de Densidad/Probabilidad
  • Muestra: \(Y = (Y_1, Y_2, ..., Y_n)\)
  • Función de Verosimilitud: \(L(\theta|y)\)
  • Modelo Estadístico: Muestra + Distribución

🔄 Proceso de Modelado

1

Problema Real
Identificación de variables

2

Modelo Probabilístico
\(f_Y(y, \theta)\)

3

Recolección de Datos
Muestra \(Y_1, ..., Y_n\)

4

Análisis Estadístico
Inferencia sobre θ

📊 2.4.. ESTADÍSTICOS Y ESTIMADORES PUNTUALES

🎯 Reducción de Dimensionalidad

“Por lo general, no se trabaja con toda la muestra \(Y\), sino con funciones \(S(Y)\), llamadas estadísticas, que consisten en una reducción de la dimensión de la observación.”

📈 Estadísticas Suficientes

  • Reducción de datos sin pérdida de información
  • Contienen toda la información sobre θ
  • Ejemplos: Media muestral, varianza muestral
  • Teorema de factorización de Fisher-Neyman
  • Aplicación en inferencia eficiente

🎯 Estimación Puntual

  • Estadística \(\hat{\theta}(Y)\) que estima θ
  • Valor concreto \(\hat{\theta}(y)\) calculado de datos
  • Propiedades deseables:
    • Insesgamiento
    • Eficiencia
    • Consistencia
  • Métodos: MLE, momentos, Bayesiana

🔬 2.5.. TRES NÚCLEOS DEL ANÁLISIS ESTADÍSTICO

1️⃣

📏 Estimación Puntual

  • Valor único \(\hat{\theta}(y)\)
  • Aproxima el parámetro θ
  • Ejemplos: Media, mediana, moda
  • Sin medida de precisión
  • Base para otros análisis

2️⃣

📐 Intervalos de Confianza

  • Intervalo aleatorio \(IC(Y)\)
  • Probabilidad \(1-\alpha\) de contener θ
  • Precisión de la estimación
  • \(IC(y) = \hat{\theta}(y) \pm D(y)\)
  • Interpretación frecuentista

3️⃣

🧪 Pruebas de Hipótesis

  • \(H_0\) vs \(H_1\) sobre θ
  • Error tipo I (α)
  • Región de aceptación/rechazo
  • Relación con intervalos
  • Valor p (p-value)

🎓 2.6. ESQUEMA INTEGRAL DEL TRABAJO ESTADÍSTICO

📈 Proceso Científico de Cuatro Pasos

\[ \text{Problema} \Rightarrow \text{Modelo} \Rightarrow \text{Datos} \Rightarrow \text{Análisis} \]

“El esquema anterior debe mantenerse en mente para estudiar y aprender los conceptos fundamentales de Estadística. El esquema no es de una sola dirección; debe volverse siempre a los pasos anteriores, comprobando, verificando, modificando y, finalmente, interpretando los resultados de los análisis en términos del problema original.”

🎯 Problema

  • Aplicación real y práctica
  • Variables de interés
  • Preguntas de investigación
  • Contexto del estudio
  • Objetivos claros

📐 Modelo

  • Traducción probabilística
  • Distribuciones apropiadas
  • Parámetros relevantes
  • Supuestos verificables
  • Validación teórica

📊 Datos

  • Muestra representativa
  • Recolección sistemática
  • Calidad y limpieza
  • Tamaño adecuado
  • Documentación completa

🔬 Análisis

  • Métodos estadísticos apropiados
  • Validación de supuestos
  • Interpretación de resultados
  • Comunicación efectiva
  • Retorno al problema

💡 Principios Fundamentales

🔄 Ciclo Iterativo

  • No es proceso lineal
  • Retroalimentación constante
  • Revisión de pasos anteriores
  • Ajuste de modelos
  • Mejora continua

🎯 Interpretación Contextual

  • Resultados en términos del problema
  • Significancia práctica vs estadística
  • Limitaciones del estudio
  • Recomendaciones accionables
  • Comunicación a stakeholders

🎓 2.7. FILOSOFÍA DE LA ESTADÍSTICA INFERENCIAL

Ciencia auxiliar • Metodología rigurosa • Pensamiento crítico • Aplicación práctica • Herramienta para la toma de decisiones informadas

🧪 2.7.1. EJEMPLOS CONTEXTUALIZADOS

🏥 Ejemplo 1: Eficacia de un Nuevo Fármaco

1. Problema: Un laboratorio farmacéutico quiere determinar si un nuevo medicamento para reducir la presión arterial es efectivo.

2. Modelo: La variable de interés es la reducción media de presión (en mmHg) en pacientes. Se asume que esta reducción sigue una distribución Normal: Y ~ N(μ, σ²), donde μ (parámetro θ) es la reducción media poblacional real.

3. Datos: Se administra el fármaco a n=100 pacientes seleccionados aleatoriamente y se mide la reducción en cada uno, obteniendo la muestra y = (y₁, y₂, …, y₁₀₀).

4. Análisis:

  • Estimación Puntual: Calcular la media muestral como estimador μ̂.
  • Intervalo de Confianza: Construir un IC del 95% para μ. Si el IC resultante es, por ejemplo, (5.2, 8.8) mmHg, podemos afirmar con 95% de confianza que la reducción media real está en ese rango.
  • Prueba de Hipótesis: Plantear H₀: μ ≤ 0 (no hay reducción) vs. H₁: μ > 0. Si el IC del 95% (5.2, 8.8) no contiene el 0, se rechaza H₀, concluyendo evidencia estadística de efectividad.

🏭 Ejemplo 2: Control de Calidad en una Fábrica

1. Problema: Un ingeniero de producción necesita asegurar que la proporción de piezas defectuosas en una línea de montaje no supere el 2%.

2. Modelo: La variable es si una pieza es defectuosa (éxito=1) o no (fracaso=0). El número de defectuosas en una muestra de n piezas sigue una distribución Binomial: X ~ Binomial(n, p), donde p (parámetro θ) es la proporción real de defectos en la población.

3. Datos: Se inspeccionan n=500 piezas al azar de un día de producción. Se cuenta cuántas son defectuosas, digamos x=8.

4. Análisis:

  • Estimación Puntual: Calcular la proporción muestral p̂ = 8/500 = 0.016 como estimador de p.
  • Intervalo de Confianza: Calcular un IC del 99% para p usando la aproximación normal o métodos exactos. Si resulta ser (0.005, 0.027), hay confianza en que la tasa real está entre 0.5% y 2.7%.
  • Prueba de Hipótesis: Plantear H₀: p ≤ 0.02 vs. H₁: p > 0.02. Si el límite superior del IC (0.027) es mayor que 0.02, podría haber indicios de un problema, pero se requiere la prueba formal para tomar una decisión (e.g., detener la línea).

📱 Ejemplo 3: Análisis de Satisfacción de Usuarios (App)

1. Problema: Una startup de tecnología quiere saber si el tiempo promedio de respuesta de su aplicación móvil es menor a 3 segundos tras una actualización.

2. Modelo: La variable es el tiempo de respuesta (en segundos) para una acción específica. Por el Teorema del Límite Central, la media muestral de estos tiempos tenderá a una distribución Normal, incluso si los tiempos individuales no la siguen: X̄ ~ N(μ, σ²/n), donde μ es el tiempo medio poblacional real.

3. Datos: Se registran automáticamente los tiempos de n=200 usuarios seleccionados aleatoriamente después de la actualización.

4. Análisis:

  • Estimación Puntual: Calcular la media muestral de los 200 tiempos, por ejemplo, x̄ = 2.8 s.
  • Intervalo de Confianza: Construir un IC unilateral del 95% para μ. Si el límite superior es 2.95 s, podemos decir con 95% de confianza que el tiempo medio real es menor a 2.95 s.
  • Prueba de Hipótesis: Plantear H₀: μ ≥ 3 s vs. H₁: μ < 3 s. Si todo el IC (e.g., (2.65, 2.95)) está por debajo de 3, se rechaza H₀, concluyendo que la actualización sí mejoró el rendimiento.

💻 2.7.2. CÓDIGO DE ILUSTRACIÓN (R & Python)

Ejemplo en R (Fármaco)

# Simulación de datos: Reducción de presión arterial en 100 pacientes
set.seed(123)
reduccion <- rnorm(100, mean = 7, sd = 2) # μ=7, σ=2

# 1. Estimación Puntual (Media muestral)
estimacion_puntual <- mean(reduccion)
cat("Estimación puntual (μ̂):", round(estimacion_puntual, 2), "mmHg\n")

# 2. Intervalo de Confianza del 95%
ic <- t.test(reduccion, conf.level = 0.95)$conf.int
cat("IC 95% para μ: [", round(ic[1],2), ", ", round(ic[2],2), "] mmHg\n")

# 3. Prueba de Hipótesis (Unilateral derecha: H1: μ > 0)
prueba <- t.test(reduccion, alternative = "greater", mu = 0)
cat("Prueba H0: μ ≤ 0 vs H1: μ > 0\n")
cat("Estadístico t:", round(prueba$statistic, 3), "\n")
cat("Valor p:", format.pval(prueba$p.value, digits=3), "\n")
if(prueba$p.value < 0.05) {
  cat("Conclusión: Rechazamos H0. El fármaco es efectivo.\n")
} else {
  cat("Conclusión: No hay evidencia suficiente para rechazar H0.\n")
}

Ejemplo en Python (Control de Calidad)

import numpy as np
import statsmodels.stats.proportion as smprop

# Datos: 8 defectuosas en 500 piezas
n, x = 500, 8
p_muestral = x / n

# 1. Estimación Puntual
print(f"Estimación puntual (p̂): {p_muestral:.3%}")

# 2. Intervalo de Confianza del 99% (Método de Wilson)
ic_inf, ic_sup = smprop.proportion_confint(x, n, alpha=0.01, method='wilson')
print(f"IC 99% para p: [{ic_inf:.3%}, {ic_sup:.3%}]")

# 3. Prueba de Hipótesis (Unilateral derecha: H1: p > 0.02)
# Estadístico Z y valor p
from statsmodels.stats.proportion import proportions_ztest
z_stat, p_value = proportions_ztest(x, n, value=0.02, alternative='larger')
print(f"\nPrueba H0: p ≤ 0.02 vs H1: p > 0.02")
print(f"Estadístico Z: {z_stat:.3f}")
print(f"Valor p: {p_value:.4f}")

if p_value < 0.01: # Nivel de significancia del 1%
    print("Conclusión: Rechazamos H0. Evidencia de que la tasa de defectos > 2%.")
else:
    print("Conclusión: No hay evidencia suficiente para rechazar H0.")

📊 3. TEORÍA DE LA DISTRIBUCIÓN MUESTRAL DE LA MEDIA

📈 3.1. DISTRIBUCIÓN MUESTRAL DE LA MEDIA: FUNDAMENTOS TEÓRICOS

Análisis del comportamiento de las medias muestrales para poblaciones finitas e infinitas

🎯 3.2. DEFINICIÓN Y CONCEPTOS BÁSICOS

📊 ¿Qué es la Distribución Muestral?

Definición:
Es la distribución de probabilidad de todas las medias posibles de muestras de tamaño n que pueden ser extraídas de una población.

Componentes clave:
• Población: Conjunto completo
• Muestra: Subconjunto de la población
• Media muestral: Estadístico calculado
• Distribución: Comportamiento de todas las medias posibles

📐 Parámetros de la Distribución Muestral

Para población infinita o muestreo con reemplazo:
• Media: μ = μ
• Varianza: σ² = σ²/n
• Desviación estándar: σ = σ/√n

Para población finita (N) sin reemplazo:
• Factor de corrección: √[(N-n)/(N-1)]
• σ = (σ/√n) × √[(N-n)/(N-1)]

📈 3.3. TEOREMA DEL LÍMITE CENTRAL (TLC) PARA MUESTRAS GRANDES

🎯 Enunciado del Teorema

Teorema del Límite Central:
Para muestras grandes (n ≥ 30 generalmente), la distribución muestral de la media se aproxima a una distribución normal, independientemente de la forma de la distribución poblacional.

Condiciones:
• n ≥ 30 (regla general)
• Muestreo aleatorio
• Observaciones independientes

Formalmente:
X̄ ∼ N(μ, σ²/n) aproximadamente para n grande

📊 Propiedades para Muestras Grandes

Características clave:
1. Normalidad: La distribución es aproximadamente normal
2. Media: μ = μ (igual a la media poblacional)
3. Error estándar: σ = σ/√n
4. Independencia de forma: No importa la distribución original

Z-score para medias:
Z = (X̄ - μ) / (σ/√n)
Sigue distribución N(0,1) aproximadamente

🎯 3.3.1. EJEMPLOS PARA MUESTRAS GRANDES (n ≥ 30)

📊 Ejemplo 1: Ingresos Salariales

Contexto:
Ingresos anuales en una ciudad tienen distribución sesgada a la derecha con μ = $45,000 y σ = $15,000.

Problema:
Si tomamos muestras de n = 100 empleados:
• ¿Distribución de X̄?
• P(X̄ > $47,000) = ?

Solución TLC:
σ = 15,000/√100 = $1,500
Z = (47,000-45,000)/1,500 = 1.33
P(Z > 1.33) = 0.0918

🏭 Ejemplo 2: Control de Calidad

Contexto:
Una máquina produce tornillos con longitud μ = 50mm, σ = 2mm. Distribución desconocida.

Problema:
Muestras de n = 36 tornillos:
• Intervalo del 95% para X̄?
• P(49.5 < X̄ < 50.5) = ?

Solución:
σ = 2/√36 = 0.333mm
95% CI: 50 ± 1.96×0.333
= [49.35, 50.65]mm

🎓 Ejemplo 3: Puntajes Académicos

Contexto:
Puntaje SAT tiene μ = 1050, σ = 200. Distribución bimodal.

Problema:
Muestras de n = 50 estudiantes:
• Error estándar de X̄?
• P(X̄ < 1000) = ?

Solución TLC:
σ = 200/√50 ≈ 28.28
Z = (1000-1050)/28.28 = -1.77
P(Z < -1.77) = 0.0384

📊 3.4. DISTRIBUCIÓN t-STUDENT PARA MUESTRAS PEQUEÑAS

📐 Condiciones para Usar Distribución t

Cuándo usar distribución t:
1. Muestra pequeña: n < 30 generalmente
2. Población normal: Se asume distribución normal
3. σ desconocida: Se usa desviación muestral s
4. Muestreo aleatorio

Estadístico t:
t = (X̄ - μ) / (s/√n)
∼ tn-1 (t con n-1 grados de libertad)

📈 Propiedades de la Distribución t

Características:
• Forma acampanada como la normal
• Más dispersa que N(0,1)
• Depende de grados de libertad (gl)
• gl = n - 1

Comparación con normal:
• Más área en las colas
• Valores críticos mayores
• → Intervalos de confianza más amplios
• A medida que n→∞, t→N(0,1)

🎯 3.4.1. EJEMPLOS PARA MUESTRAS PEQUEÑAS (n < 30)

⚖️ Ejemplo 1: Peso de Paquetes

Contexto:
Empresa envía paquetes. Peso normalmente distribuido.
Muestra: n = 10 paquetes
X̄ = 2.1 kg, s = 0.3 kg

Problema:
• IC 95% para μ?
• ¿μ = 2.0 kg plausible?

Solución t:
gl = 9, t0.025,9 = 2.262
IC: 2.1 ± 2.262×(0.3/√10)
= [1.89, 2.31] kg
2.0 ∈ IC → plausible

🏥 Ejemplo 2: Nivel de Glucosa

Contexto:
Estudio médico sobre glucosa en sangre.
Población normal, σ desconocida.
Muestra: n = 15 pacientes
X̄ = 95 mg/dL, s = 12 mg/dL

Problema:
• P(X̄ > 100 mg/dL)?
• IC 90% para μ?

Solución:
t = (100-95)/(12/√15) = 1.61
gl=14, P(t>1.61) ≈ 0.065

🏭 Ejemplo 3: Tiempo de Producción

Contexto:
Tiempo producción piezas ∼ normal.
Muestra: n = 8 observaciones
X̄ = 42.5 min, s = 3.2 min
μ0 = 40 min (hipótesis)

Problema:
• Prueba H0: μ = 40
• Nivel α = 0.05

Solución:
t = (42.5-40)/(3.2/√8) = 2.21
tcrítico,7 = 2.365
2.21 < 2.365 → No rechazar H0

📊 3.5. COMPARACIÓN: MUESTRAS GRANDES vs PEQUEÑAS

📈 Muestras Grandes (n ≥ 30)

  • Aplicable: Cualquier distribución poblacional
  • Distribución: Aproximadamente normal (TLC)
  • Error estándar: σ/√n (si σ conocida) o s/√n
  • Estadístico: Z = (X̄ - μ)/(σ/√n) ∼ N(0,1)
  • Ventaja: No requiere normalidad poblacional
  • Intervalos: Más estrechos para misma confianza
  • Límite: Requiere n suficientemente grande

📉 Muestras Pequeñas (n < 30)

  • Aplicable: Solo si población normal
  • Distribución: t-Student con n-1 grados libertad
  • Error estándar: s/√n (siempre s, nunca σ)
  • Estadístico: t = (X̄ - μ)/(s/√n) ∼ tn-1
  • Ventaja: Exacta para poblaciones normales
  • Intervalos: Más amplios (incertidumbre mayor)
  • Límite: Sensible a desviaciones de normalidad

📋 Tabla Comparativa Resumen

Característica Muestras Grandes Muestras Pequeñas
Tamaño mínimo n ≥ 30 (general) n < 30
Distribución Aprox. Normal (TLC) t-Student (exacta)
Supuesto forma Cualquier distribución Población Normal
σ conocida Usar σ/√n (Z) Siempre usar s (t)
Intervalos Más estrechos Más amplios
Valores críticos z (tabla normal) t (tabla t-Student)

🎯 3.6. EJEMPLOS INTEGRADORES - AMBAS SITUACIONES

📊 Ejemplo Integrador 1: Ventas Diarias

Contexto:
Tienda: ventas diarias con distribución desconocida.
μ = $2,500, σ = $500

Parte A (n grande):
n = 100 días, calcular:
• P(X̄ > $2,600)
Solución TLC:
σ = 500/√100 = $50
Z = (2600-2500)/50 = 2
P = 0.0228

Parte B (n pequeño):
Si población fuera normal y n=10:
• Usar distribución t
• Intervalos más amplios

🏭 Ejemplo Integrador 2: Control Calidad

Contexto:
Producción resistencias eléctricas.
Valor nominal: 100Ω, distribución normal.
σ desconocida.

Caso 1 (n=40):
X̄ = 101.2Ω, s = 4.5Ω
• IC 95% usando Z (aproximado)
σ = 4.5/√40 = 0.711Ω
IC: 101.2 ± 1.96×0.711
= [99.81, 102.59]Ω

Caso 2 (n=12):
X̄ = 101.2Ω, s = 4.5Ω
• IC 95% usando t11 = 2.201
IC: 101.2 ± 2.201×(4.5/√12)
= [98.34, 104.06]Ω

🎓 Ejemplo Integrador 3: Puntajes Test

Contexto:
Test estandarizado nacional.
Distribución asimétrica, μ = 500, σ = 100

Muestra grande (n=200):
• TLC aplicable
• σ = 100/√200 = 7.07
• P(X̄ < 490) = P(Z < -1.41) = 0.0793

Muestra pequeña (n=20):
• NO se puede aplicar TLC
• NO se puede asumir normalidad
• Necesitaríamos otros métodos
• (Bootstrapping, métodos no paramétricos)

📚 3.7. CONCEPTOS CLAVE Y APLICACIONES

🎯 Teorema del Límite Central

  • Aproximación normal para n ≥ 30
  • Independiente de distribución poblacional
  • Base de inferencia estadística
  • Permite usar métodos paramétricos
  • Error estándar disminuye con √n

📊 Distribución t-Student

  • Para muestras pequeñas (n < 30)
  • Requiere normalidad poblacional
  • Usa desviación muestral s
  • Colas más pesadas que la normal
  • gl = n - 1 grados de libertad

⚖️ Elección del Método

  • n ≥ 30 → TLC (distribución Z)
  • n < 30 y población normal → t-Student
  • n < 30 y no normal → métodos no paramétricos
  • σ conocida → distribución Z
  • σ desconocida → distribución t

📈 Reglas Prácticas para la Decisión

Flujograma de Decisión
  1. ¿n ≥ 30? → Sí: usar TLC (Z)
  2. ¿n < 30? → Sí: ¿población normal?
  3. ¿Sí? → usar t-Student
  4. ¿No? → usar métodos alternativos
  5. ¿σ conocida? → usar Z (si n ≥ 30)
  6. ¿σ desconocida? → siempre usar s
Consideraciones Especiales
  • Población muy sesgada: n > 50 para TLC
  • Población moderadamente sesgada: n ≥ 30
  • Población aproximadamente normal: n ≥ 15
  • Para proporciones: np ≥ 10 y n(1-p) ≥ 10
  • Factor de corrección si n/N > 0.05

🎯 3.8. CONCLUSIONES Y APLICACIONES PRÁCTICAS

📊 Resumen Teórico

Distribución Muestral de la Media:
Es la base de la inferencia estadística. Describe cómo se comportan las medias muestrales alrededor del parámetro poblacional μ.

Para muestras grandes (n ≥ 30):
• TLC garantiza normalidad aproximada
• No requiere conocimiento de la distribución poblacional
• Error estándar: σ/√n (o s/√n si σ desconocida)

Para muestras pequeñas (n < 30):
• Requiere normalidad poblacional
• Usa distribución t-Student con n-1 gl
• Más conservador: intervalos más amplios
• Sensible a desviaciones de normalidad

🏭 Aplicaciones Prácticas

En investigación de mercados:
• Encuestas con n > 30: usar Z
• Estudios piloto pequeños: usar t
• Muestreo de productos: considerar TLC

En control de calidad:
• Grandes lotes: TLC para medias
• Pequeñas muestras: gráficos de control especiales
• Verificación de especificaciones

En ciencias sociales:
• Encuestas nacionales: TLC aplicable
• Estudios cualitativos pequeños: métodos alternativos
• Análisis comparativo entre grupos

💡 Recomendaciones Finales

Si n ≥ 30:
Confiar en el TLC
Usar Z para intervalos
Asumir normalidad aproximada

Si n < 30:
Verificar normalidad
Usar t-Student
Ser cauteloso con conclusiones

En todos los casos:
Reportar tamaño muestral
Especificar método usado
Interpretar en contexto

🏭 3.9. Mas Ejemplos de DISTRIBUCIÓN MUESTRAL DE \(\bar{Y}\)

🏭 Problema de Embotelladora

Contexto: Máquina llena botellas con distribución normal, \(\sigma = 1.0\) onza. Muestra de \(n = 9\) botellas.

  1. Probabilidad \(\bar{Y}\) cercana a \(\mu\)

Calcular \(P(|\bar{Y} - \mu| \leq 0.3)\):

\[ \begin{aligned} P(|\bar{Y} - \mu| \leq 0.3) &= P\left(-\frac{0.3}{\sigma/\sqrt{n}} \leq Z \leq \frac{0.3}{\sigma/\sqrt{n}}\right) \\ &= P\left(-\frac{0.3}{1/\sqrt{9}} \leq Z \leq \frac{0.3}{1/\sqrt{9}}\right) \\ &= P(-0.9 \leq Z \leq 0.9) = 0.6318 \end{aligned} \]

  1. Tamaño Muestral para Precisión

Encontrar \(n\) tal que \(P(|\bar{Y} - \mu| \leq 0.3) = 0.95\):

\[ \begin{aligned} \frac{0.3}{\sigma/\sqrt{n}} &= 1.96 \quad (\text{valor crítico para } 95\%) \\ 0.3\sqrt{n} &= 1.96 \\ n &= \left(\frac{1.96}{0.3}\right)^2 = 42.68 \approx 43 \end{aligned} \]

💻 Implementación en R

# Parámetros
sigma <- 1.0; n <- 9; delta <- 0.3

# (a) Probabilidad
z_score <- delta / (sigma / sqrt(n))
prob_a <- pnorm(z_score) - pnorm(-z_score)  # Resultado: 0.6318

# (b) Tamaño muestral
z_alpha <- qnorm(0.975)  # 1.96 para 95%
n_b <- ceiling((z_alpha * sigma / delta)^2)  # Resultado: 43

3.9.1. Graficar la distribución normal en R

# Parámetros dados
sigma <- 1.0     # Desviación estándar poblacional
n <- 9           # Tamaño de la muestra
delta <- 0.3     # Margen de error (0.3 onzas)
mu <- 0          # Media real (asumimos μ = 0 para la gráfica)

# Error estándar de la media
se <- sigma / sqrt(n)

# Límites del área a sombrear
lower_limit <- mu - delta
upper_limit <- mu + delta

# Crear una secuencia de valores para la distribución normal
x <- seq(mu - 4 * se, mu + 4 * se, length.out = 1000)

# Calcular la densidad de la distribución normal
y <- dnorm(x, mean = mu, sd = se)

# Graficar la distribución normal
plot(x, y, type = "l", lwd = 2, col = "blue",
     xlab = "Media muestral (Ȳ)", ylab = "Densidad",
     main = "Distribución normal de la media muestral -Julio Hurtado")

# Sombrear el área entre lower_limit y upper_limit
x_shade <- seq(lower_limit, upper_limit, length.out = 1000)
y_shade <- dnorm(x_shade, mean = mu, sd = se)
polygon(c(lower_limit, x_shade, upper_limit), c(0, y_shade, 0), col = "lightblue", border = NA)

# Añadir líneas verticales para los límites
abline(v = lower_limit, col = "red", lty = 2, lwd = 2)
abline(v = upper_limit, col = "red", lty = 2, lwd = 2)

# Añadir leyenda
legend("topright", legend = c("Distribución normal", "Área sombreada (P(|Ȳ - μ| ≤ 0.3))"),
       col = c("blue", "lightblue"), lwd = 2, lty = c(1, NA), fill = c(NA, "lightblue"), border = NA)

3.9.2. Graficar la distribución normal en R

# Parámetros dados
sigma <- 1.0     # Desviación estándar poblacional
n <- 9           # Tamaño de la muestra (inciso a)
delta <- 0.3     # Margen de error (0.3 onzas)
prob <- 0.95     # Probabilidad deseada (inciso b)

# (a) Probabilidad de que la media muestral esté a lo más 0.3 onzas de μ
z_score <- delta / (sigma / sqrt(n))  # Cálculo del puntaje Z
prob_a <- pnorm(z_score) - pnorm(-z_score)  # Probabilidad usando la distribución normal

# Mostrar resultado del inciso (a)
print(paste("(a) La probabilidad de que la media muestral esté a lo más 0.3 onzas de μ es:", round(prob_a, 4)))
## [1] "(a) La probabilidad de que la media muestral esté a lo más 0.3 onzas de μ es: 0.6319"
# (b) Tamaño de la muestra para que la media esté a lo más 0.3 onzas de μ con probabilidad 0.95
z_alpha <- qnorm((1 + prob) / 2)  # Valor crítico de Z para una probabilidad de 0.95
n_b <- ceiling((z_alpha * sigma / delta)^2)  # Cálculo del tamaño de la muestra

# Mostrar resultado del inciso (b)
print(paste("(b) El tamaño de la muestra necesario para que la media esté a lo más 0.3 onzas de μ con una probabilidad de 0.95 es:", n_b))
## [1] "(b) El tamaño de la muestra necesario para que la media esté a lo más 0.3 onzas de μ con una probabilidad de 0.95 es: 43"

📊 3.10. Ejercicio 1. PROBLEMA DE DISTRIBUCIÓN MUESTRAL - CONTENIDO DE MEDICAMENTOS

💊 PROBLEMA: CONTROL DE CALIDAD EN PRODUCCIÓN FARMACÉUTICA

Análisis probabilístico del contenido promedio de medicamentos usando distribución normal

📝 ENUNCIADO DEL PROBLEMA

“El contenido en gramos de un determinado medicamento sigue una distribución normal N(7.5, 0.3). Calcular la probabilidad de que en una muestra de tamaño 5 se obtenga que la media muestral sea menor que 7 gramos.”

A

0.0681

B

0.1587

C

0.0001

D

0.3085

E

0.0228

🧮 SOLUCIÓN PASO A PASO

💊 Paso 1: Identificar parámetros y contexto

Datos proporcionados:
• Distribución poblacional: X ~ N(μ, σ²)
• Media poblacional: μ = 7.5 gramos
• Varianza poblacional: σ² = 0.3
• Desviación estándar: σ = √0.3 ≈ 0.5477
• Tamaño muestral: n = 5
• Pregunta: P(\(\bar{X}\) < 7)

Contexto farmacéutico:
• Medicamento con contenido específico
• Control de calidad en producción
• Muestreo para verificación
• Cumplimiento de especificaciones

📊 Paso 2: Aplicar Teorema de Distribución Muestral

Teorema fundamental:
Si X ~ N(μ, σ²) entonces:
\(\bar{X}\) ~ N(μ, σ²/n)

Aplicación al problema:
• Media muestral: μ\(\bar{X}\) = μ = 7.5
• Varianza muestral: σ²\(\bar{X}\) = σ²/n = 0.3/5
• Desviación estándar muestral:
σ\(\bar{X}\) = σ/√n = √0.3/√5

Cálculo detallado:
σ\(\bar{X}\) = √(0.3/5) = √0.06 ≈ 0.2449

🧮 Paso 3: Calcular puntuación Z estandarizada

Fórmula de estandarización:
Z = \(\frac{\bar{X} - \mu}{\sigma/\sqrt{n}}\)

Sustitución de valores:
Z = \(\frac{7 - 7.5}{\sqrt{0.3}/\sqrt{5}}\)
Z = \(\frac{-0.5}{\sqrt{0.3/5}}\)
Z = \(\frac{-0.5}{\sqrt{0.06}}\)
Z = \(\frac{-0.5}{0.2449}\)

Resultado:
Z ≈ -2.041

Interpretación:
El valor 7 está aproximadamente
2.041 desviaciones estándar
por debajo de la media

📈 Paso 4: Calcular probabilidad usando distribución normal estándar

Probabilidad requerida:
P(\(\bar{X}\) < 7) = P(Z < -2.041)

Uso de tabla normal:
P(Z < -2.04) = 0.0207
P(Z < -2.05) = 0.0202

Interpolación lineal:
Para Z = -2.041:
P = 0.0207 - 0.0001×0.1
P ≈ 0.0206

Resultado exacto:
P(\(\bar{X}\) < 7) = 0.0206

Interpretación:
Solo 2.06% de muestras de tamaño 5
tendrán media menor que 7 gramos

🔍 Paso 5: Comparación con probabilidad individual

Para un solo medicamento:
Zindividual = (7 - 7.5)/√0.3
Zindividual = -0.5/0.5477
Zindividual ≈ -0.9129

P(X < 7) = P(Z < -0.9129)
P(X < 7) ≈ 0.1808 (18.08%)

Comparación:
• Individual: 18.08% probabilidad
• Muestral (n=5): 2.06% probabilidad

Reducción: 18.08% → 2.06%
Factor: 8.8 veces menos probable

Explicación:
La media muestral tiene menor
variabilidad que observaciones
individuales

Paso 6: Verificación y respuesta final

Cálculo exacto:
σ\(\bar{X}\) = √(0.3/5) = √0.06
σ\(\bar{X}\) = 0.244948974

Z = (7 - 7.5)/0.244948974
Z = -0.5/0.244948974
Z = -2.041241452

Probabilidad exacta:
P(Z < -2.041241452) = 0.02061

Redondeo a 4 decimales:
P = 0.0206

Comparación con opciones:
A) 0.0681 ✗
B) 0.1587 ✗
C) 0.0001 ✗
D) 0.3085 ✗
E) 0.0228 ✓ (más cercano)

Respuesta correcta: Opción E

🏭 Paso 7: Aplicación en control de calidad farmacéutico

Implicaciones prácticas:
1. Límites de aceptación:
Si se establece límite inferior en 7g
Solo 2.06% de lotes serían rechazados
cuando el proceso está en control

2. Tamaño muestral:
n=5 es pequeño pero suficiente
para detectar desviaciones grandes

3. Especificaciones:
Media objetivo: 7.5g ± tolerancia
Proceso capaz si variación es baja

4. Monitoreo:
Gráficos de control para medias
Límites de control: μ ± 3σ/√n

Respuesta correcta:
0.0228

Opción E

Probabilidad ≈ 2.28%

Verificación:
pnorm(7, 7.5, sqrt(0.3/5)) = 0.0206
Opción E (0.0228) es la más cercana

Interpretación en contexto farmacéutico: En la producción de medicamentos, el contenido debe cumplir especificaciones estrictas. Una probabilidad de 2.28% significa que aproximadamente 1 de cada 44 muestras de 5 unidades tendrá un contenido promedio inferior a 7 gramos cuando el proceso está operando correctamente con media 7.5g. Esto es importante para establecer límites de control estadístico de procesos y determinar cuándo una desviación requiere investigación y corrección del proceso.

📚 CONCEPTOS ESTADÍSTICOS APLICADOS

📊 Distribución Muestral de la Media

  • Si X ~ N(μ, σ²) entonces \(\bar{X}\) ~ N(μ, σ²/n)
  • Error estándar: σ/√n = √(σ²/n)
  • Media muestral conserva la media poblacional
  • Variabilidad disminuye con tamaño muestral
  • Base para inferencia estadística

🎯 Estandarización Normal

  • Z = (\(\bar{X}\) - μ)/(σ/√n) ~ N(0,1)
  • Permite usar tablas normales estándar
  • Facilita cálculo de probabilidades
  • Comparación de diferentes escalas
  • Interpretación en desviaciones estándar

🏭 Aplicación en Control de Calidad

  • Gráficos de control para medias
  • Establecimiento de límites de especificación
  • Evaluación de capacidad de procesos
  • Detección de desviaciones sistemáticas
  • Optimización de tamaño muestral

🎯 RESUMEN Y CONCLUSIÓN

💊

Resumen de la solución

  1. Identificar parámetros: X ~ N(7.5, 0.3), n = 5, P(\(\bar{X}\) < 7)
  2. Aplicar distribución muestral: \(\bar{X}\) ~ N(7.5, 0.3/5)
  3. Calcular error estándar: σ/√n = √(0.3/5) ≈ 0.2449
  4. Estandarizar: Z = (7 - 7.5)/0.2449 ≈ -2.041
  5. Calcular probabilidad: P(Z < -2.041) ≈ 0.0206
  6. Comparar con opciones: 0.0228 es la más cercana
  7. Seleccionar respuesta: Opción E (0.0228)

Fórmulas clave:

• Distribución muestral: \(\bar{X}\) ~ N(μ, σ²/n)
• Error estándar: SE = σ/√n
• Puntuación Z: Z = (\(\bar{X}\) - μ)/(σ/√n)
• Probabilidad: P(\(\bar{X}\) < a) = P(Z < (a-μ)/(σ/√n))
• Reducción variabilidad: σ/√n vs σ

Resultado interpretado:

Probabilidad: 2.28%
Interpretación: Baja probabilidad
Contexto: Control de calidad
Implicación: Proceso estable
Acción: Monitoreo continuo

Conclusión clave: Este problema ilustra la aplicación práctica del Teorema de Distribución Muestral en control de calidad farmacéutico. La probabilidad de obtener una media muestral menor a 7 gramos es aproximadamente 2.28%, lo cual indica que si el proceso está bajo control (media 7.5g, varianza 0.3), sería relativamente raro encontrar una muestra de 5 unidades con promedio tan bajo. Esta información es crucial para establecer límites de control estadístico y tomar decisiones informadas sobre la calidad del producto.

SOLUCIÓN CORRECTA: OPCIÓN E - 0.0228

Distribución Muestral • Normal Estándar • Control de Calidad • Probabilidad ≈ 2.28%

📊 3.11. Ejercicio 2. PROBLEMA DE DISTRIBUCIÓN BINOMIAL Y APROXIMACIÓN NORMAL - CONTROL DE CALIDAD ALIMENTARIA

🎂 PROBLEMA: CONTROL DE CALIDAD EN PRODUCCIÓN DE PASTELES

Análisis probabilístico de defectos en producción alimentaria usando aproximación normal a binomial

📝 ENUNCIADO DEL PROBLEMA

“Una fábrica de pasteles elabora, en su producción habitual, un 3% de pasteles defectuosos. Un cliente recibe un pedido de 500 pasteles de la fábrica. Calcular la probabilidad de que encuentre más del 5% de pasteles defectuosos.”

A

0.0235

B

0.0082

C

0.0015

D

0.0002

E

0.0392

🧮 SOLUCIÓN PASO A PASO

🎂 Paso 1: Identificar modelo probabilístico y parámetros

Contexto del problema:
• Producto: Pasteles
• Tamaño del lote: n = 500 pasteles
• Proporción defectuosa habitual: p = 3% = 0.03
• Proporción crítica: p_crítica = 5% = 0.05
• Pregunta: P(\(\hat{p}\) > 0.05)

Modelo binomial:
X ~ Binomial(n=500, p=0.03)
donde X = número de pasteles defectuosos

Cantidad crítica:
5% de 500 = 0.05 × 500 = 25 pasteles
Pregunta equivalente: P(X > 25)

📊 Paso 2: Verificar condiciones para aproximación normal

Condiciones para aproximación normal:
1. n × p ≥ 5
2. n × (1-p) ≥ 5

Verificación:
• n × p = 500 × 0.03 = 15 ≥ 5 ✓
• n × (1-p) = 500 × 0.97 = 485 ≥ 5 ✓

Parámetros distribución aproximada:
• Media: μ = n × p = 15
• Varianza: σ² = n × p × (1-p)
• Desviación estándar: σ = √[n × p × (1-p)]

Cálculo exacto:
σ = √[500 × 0.03 × 0.97]
σ = √[14.55]
σ ≈ 3.8144

📈 Paso 3: Aplicar corrección por continuidad y calcular Z

Corrección por continuidad:
Para P(X > 25) en distribución discreta
usamos P(X > 25.5) en aproximación normal

Parámetros distribución normal:
X ~ N(μ = 15, σ = 3.8144)

Cálculo de Z:
Z = (x - μ)/σ
Z = (25.5 - 15)/3.8144
Z = 10.5/3.8144

Resultado:
Z ≈ 2.753

Interpretación:
25.5 pasteles defectuosos está
2.753 desviaciones estándar
por encima de la media esperada

📊 Paso 4: Calcular probabilidad usando distribución normal estándar

Probabilidad requerida:
P(X > 25) ≈ P(Z > 2.753)

Uso de propiedades de simetría:
P(Z > 2.753) = 1 - P(Z < 2.753)

Valores de tabla normal:
P(Z < 2.75) = 0.99702
P(Z < 2.76) = 0.99711

Interpolación lineal:
Para Z = 2.753:
P = 0.99702 + 0.00009 × 0.3
P ≈ 0.997047

Probabilidad final:
P(Z > 2.753) = 1 - 0.997047
P ≈ 0.002953 ≈ 0.0030

🎯 Paso 5: Cálculo exacto con distribución normal

Cálculo exacto de σ:
σ = √[500 × 0.03 × 0.97]
σ = √[500 × 0.0291]
σ = √[14.55]
σ = 3.814446

Cálculo exacto de Z:
Z = (25.5 - 15)/3.814446
Z = 10.5/3.814446
Z = 2.752676

Probabilidad exacta:
P(Z > 2.752676) = 0.002958

Redondeo a 4 decimales:
P ≈ 0.0030

Porcentaje: 0.30%
Interpretación: Muy baja probabilidad

🔍 Paso 6: Comparación con distribución binomial exacta

Distribución binomial exacta:
P(X > 25) = 1 - P(X ≤ 25)
P(X ≤ 25) = Σ[k=0 a 25] C(500,k)×0.03k×0.97(500-k)

Valores aproximados:
P(X > 25) ≈ 0.00298 (exacto)
P(Z > 2.753) ≈ 0.00296 (aproximado)

Error de aproximación:
Error = |0.00298 - 0.00296| = 0.00002
Error relativo = 0.67%

Comparación con opciones:
A) 0.0235 ✗ (7.9 veces mayor)
B) 0.0082 ✗ (2.8 veces mayor)
C) 0.0015 ✗ (mitad del valor)
D) 0.0002 ✗ (15 veces menor)
E) 0.0392 ✗ (13.2 veces mayor)

Ninguna coincide exactamente

🏭 Paso 7: Análisis en contexto de control de calidad alimentaria

Implicaciones prácticas:
1. Límites de aceptación:
Si cliente rechaza >5% defectuosos
Probabilidad de rechazo ≈ 0.30%
→ Muy baja probabilidad de rechazo injustificado

2. Capacidad del proceso:
Proceso capaz con 3% defectos
Dificil superar 5% por variación aleatoria

3. Inspección por muestreo:
Con n=500, detecta problemas reales
Baja probabilidad de falsa alarma

4. Garantía de calidad:
Fábrica puede garantizar ≤5% defectos
Con alta confianza estadística

Probabilidad calculada:
0.0030

≈ 0.30%

(ninguna opción coincide exactamente)

Opción más cercana:
C) 0.0015 (mitad del valor real)

Interpretación en contexto de producción alimentaria: En la fabricación de pasteles, mantener un 3% de defectos es un estándar razonable. La probabilidad de que en un lote de 500 pasteles se encuentren más del 5% de defectuosos (más de 25 pasteles) es solo del 0.30%. Esto significa que si el proceso está funcionando correctamente al 3% de defectos, sería muy inusual (1 en 333 lotes aproximadamente) encontrar más del 5% de defectos por variación aleatoria. Esta baja probabilidad permite establecer límites de control estadístico confiables.

📚 CONCEPTOS ESTADÍSTICOS APLICADOS

📊 Aproximación Normal a Binomial

  • X ~ Binomial(n,p) ≈ N(μ=np, σ²=np(1-p))
  • Condiciones: np ≥ 5 y n(1-p) ≥ 5
  • Corrección por continuidad: ±0.5
  • Válida para n grande y p no extremo
  • Error máximo alrededor de 1%

🎯 Corrección por Continuidad

  • P(X > k) → P(X > k + 0.5)
  • P(X ≥ k) → P(X > k - 0.5)
  • P(X < k) → P(X < k - 0.5)
  • P(X ≤ k) → P(X < k + 0.5)
  • Mejora precisión aproximación

🏭 Control Estadístico de Procesos

  • Límites de control basados en probabilidad
  • Detección de desviaciones significativas
  • Muestreo de aceptación
  • Niveles de calidad aceptable (AQL)
  • Riesgo del productor y consumidor

🎯 RESUMEN Y CONCLUSIÓN

🎂

Resumen de la solución

  1. Modelo binomial: X ~ Binomial(n=500, p=0.03)
  2. Verificar condiciones: np=15≥5, n(1-p)=485≥5 ✓
  3. Aproximación normal: X ≈ N(μ=15, σ=√14.55≈3.8144)
  4. Corrección continuidad: P(X>25) → P(X>25.5)
  5. Cálculo Z: Z = (25.5-15)/3.8144 ≈ 2.753
  6. Probabilidad: P(Z>2.753) = 0.00296 ≈ 0.0030
  7. Comparación opciones: Ninguna coincide exactamente
  8. Más cercana: C) 0.0015 (aproximadamente la mitad)

Fórmulas clave aplicadas:

• Media binomial: μ = n × p
• Varianza binomial: σ² = n × p × (1-p)
• Corrección continuidad: k → k ± 0.5
• Estandarización: Z = (x - μ)/σ
• Probabilidad cola derecha: P(Z > z)
• Condiciones aproximación: np ≥ 5, n(1-p) ≥ 5

Resultados obtenidos:

Probabilidad exacta: 0.00296
Porcentaje: 0.30%
Interpretación: Muy baja
1 en 338 lotes aproximadamente
Proceso bajo control
Límite 5% es conservador

Conclusión clave: La probabilidad de encontrar más del 5% de pasteles defectuosos en un lote de 500, cuando el proceso produce habitualmente 3% de defectos, es aproximadamente 0.30%. Esta probabilidad extremadamente baja indica que si un cliente encuentra más del 5% de defectos, es muy probable que el proceso de producción haya experimentado un cambio significativo y no se trate solo de variación aleatoria. Ninguna de las opciones proporcionadas coincide exactamente con el cálculo, siendo la opción C (0.0015) la más cercana aunque representa aproximadamente la mitad del valor real.

📊 RESULTADO: PROBABILIDAD ≈ 0.0030 (0.30%)

Aproximación Normal-Binomial • Corrección Continuidad • Control de Calidad • Probabilidad Muy Baja

Nota: Ninguna opción coincide exactamente, la más cercana es C) 0.0015