INTEGRANTES

Johanna Carolina Matías Olabe
Jaime Antonio Granda Espinoza
Lady Katherine Guerrero Amaya
Delgado Briones Janela Tamy

INTRODUCCIÓN

La Ley de los Grandes Números establece que, a medida que aumenta el tamaño de una muestra, la media muestral tiende a aproximarse al valor esperado de la población. Este principio constituye uno de los fundamentos más importantes de la estadística y la probabilidad, debido a que permite comprender cómo las simulaciones y experimentos aleatorios logran estabilizar sus resultados cuando el número de observaciones crece considerablemente. En este informe se analizará el comportamiento de una variable discreta y una variable continua mediante simulaciones en R, utilizando diferentes tamaños muestrales para evidenciar el proceso de convergencia estadística.

El desarrollo del trabajo incluirá simulaciones con tamaños de muestra n = 10, 50, 100, 1000 y 10000, acompañadas de gráficos de convergencia e interpretaciones técnicas de los resultados obtenidos. Para la variable discreta se propondrá una distribución adecuada con sus respectivos parámetros y espacio muestral, mientras que para la variable continua se aplicará una distribución probabilística continua que permita observar el comportamiento de las medias muestrales conforme incrementa el tamaño de la muestra. Finalmente, se realizará una comparación entre ambos casos para analizar cómo se manifiesta la convergencia en distribuciones discretas y continuas bajo la Ley de los Grandes Números.

JUSTIFICACIÓN

Para el análisis de la variable discreta se utilizará una distribución Binomial, debido a que permite modelar experimentos en los cuales únicamente existen dos posibles resultados: éxito o fracaso. En este caso, se simulará el número de estudiantes que aprueban una evaluación de estadística en un grupo académico, considerando una probabilidad de aprobación constante en cada intento. Esta distribución es adecuada para evidenciar el comportamiento de variables discretas bajo la Ley de los Grandes Números.

La distribución Binomial estará definida por los parámetros n y p, donde n representa el número de ensayos realizados y p la probabilidad de éxito. Para la simulación se considerará una probabilidad de aprobación de p=0.7, asumiendo que el 70% de los estudiantes tienen posibilidades de aprobar la evaluación. El espacio muestral estará conformado por valores enteros no negativos, correspondientes a la cantidad de estudiantes aprobados en cada simulación.

Fase 1: Definición de Variables


Variable discreta: Distribución Binomial Negativa
DESRIPCIÓN DEL CASO:

Un empleado de una fábrica textil borda logos en prendas deportivas. Se ha identificado que la probabilidad de que un bordado presente fallas es del 20%. El supervisor revisará los bordados hasta encontrar 3 bordados defectuosos.

a) ¿Cuál es la probabilidad de que el tercer bordado defectuoso se encuentre exactamente en el quinto bordado revisado?

b) ¿Cuál es la probabilidad de que se deban revisar más de 8 bordados para encontrar los 3 defectuosos requeridos?

c) Calcule el número esperado de bordados revisados hasta encontrar los 3 defectuosos y la desviación estándar del proceso.

Desarrollo del ejercicio
a) Probabilidad de que el tercer defectuoso esté en el quinto bordado
p <- 0.20
r <- 3

prob_a <- dnbinom(5 - r, size = r, prob = p)
prob_a
## [1] 0.03072

Resultado:

\(P(X = 5) = 0.03072\)

Análsis interpretativo

La probabilidad de que el tercer bordado defectuoso se encuentre exactamente en el quinto bordado revisado es 0.03072, equivalente al 3.07%.

b) Probabilidad de revisar más de 8 bordados
prob_b <- 1 - pnbinom(8 - r, size = r, prob = p)
prob_b
## [1] 0.7969178

Resultado:

\(P(X > 8) = 0.7969178\)

Análsis interpretativo

La probabilidad de que se deban revisar más de 8 bordados para encontrar los 3 defectuosos es 0.7969, equivalente al 79.69%.

c) Esperanza y desviación estándar
esperanza <- r / p
desviacion <- sqrt((r * (1 - p)) / p^2)

esperanza
## [1] 15
desviacion
## [1] 7.745967

Resultado:

\(E(X) = 15\)

\(\sigma \approx 7.746\)

En promedio, el supervisor deberá revisar 15 bordados para encontrar 3 defectuosos. La desviación estándar es aproximadamente 7.75, lo que indica una alta variabilidad en el número de bordados que podrían revisarse antes de alcanzar los 3 defectuosos.

Simulación para la Ley de los Grandes Números

Para verificar el comportamiento de la Ley de los Grandes Números en una variable discreta, se realizarán simulaciones incrementando progresivamente el tamaño de la muestra. Se analizará cómo la media muestral de los bordados defectuosos tiende a estabilizarse conforme aumenta el número de observaciones.

set.seed(123)

# Parámetros
r <- 3
p <- 0.20
media_teorica <- r / p

# Tamaños muestrales
n_muestras <- c(10, 50, 100, 1000, 10000)

# Simulación
resultados <- data.frame(
  n = n_muestras,
  media_muestral = numeric(length(n_muestras))
)

for(i in seq_along(n_muestras)){
  
  n <- n_muestras[i]
  
  # rnbinom genera el número de NO defectuosos antes de encontrar r defectuosos
  no_defectuosos <- rnbinom(n, size = r, prob = p)
  
  # Total de bordados revisados
  total_bordados <- no_defectuosos + r
  
  # Media muestral
  resultados$media_muestral[i] <- mean(total_bordados)
}

resultados

Gráficos de simulación de la Ley de los Grandes Números en bordados defectuosos

Convergencia de la media muestral en bordados defectuosos

# =====================================================
# Ley de los Grandes Números
# Bordados defectuosos
# =====================================================
set.seed(2026)

B <- 5000
r <- 3
p <- 0.20

esperanza <- r / p
varianza <- r * (1 - p) / p^2
desviacion <- sqrt(varianza)

muestras <- c(10, 50, 100, 1000, 10000)

par(mfrow = c(3, 2),
    mar = c(3, 3, 3, 1))

for(n in muestras){
  
  medias_muestrales <- replicate(B, {
    muestra <- rnbinom(n, size = r, prob = p) + r
    mean(muestra)
  })
  
  media_simulada <- mean(medias_muestrales)
  error_estandar <- desviacion / sqrt(n)
  
  hist(medias_muestrales,
       breaks = 35,
       probability = TRUE,
       col = "gray80",
       border = "white",
       main = paste("n =", n),
       xlab = "Promedio muestral",
       ylab = "Densidad",
       cex.main = 0.9,
       cex.lab = 0.75,
       cex.axis = 0.70)
  
  curve(dnorm(x, mean = esperanza, sd = error_estandar),
        add = TRUE,
        col = "darkblue",
        lwd = 2)
  
  abline(v = esperanza,
         col = "darkgreen",
         lwd = 2,
         lty = 2)
  
  abline(v = media_simulada,
         col = "red",
         lwd = 2,
         lty = 2)
  
  legend("topright",
         legend = c("Curva normal",
                    "E[X]",
                    "Media"),
         col = c("darkblue", "darkgreen", "red"),
         lwd = 2,
         lty = c(1, 2, 2),
         cex = 0.50,
         bty = "n")
}

Análsis interpretativo

La simulación evidencia la Ley de los Grandes Números en el proceso de revisión de bordados defectuosos. Para tamaños muestrales pequeños, como n = 10, las medias muestrales presentan mayor dispersión y fluctuación respecto al valor esperado teórico E(X) = 15. Sin embargo, conforme aumenta el tamaño de la muestra (n = 50, 100, 1000 y 10000), las medias se concentran progresivamente alrededor de la esperanza matemática, reduciendo la variabilidad y mostrando una distribución más estable y suave.

En el contexto del caso textil, esto demuestra que al incrementar la cantidad de observaciones, el promedio de bordados revisados hasta encontrar 3 defectuosos se aproxima consistentemente al valor teórico esperado.

Gráfico Convergencia Estócastica - GAMMA

set.seed(5313)

# Parámetros de la distribución
alpha_g <- 3
beta_g  <- 0.5

# Esperanza teórica
mu_g <- alpha_g / beta_g

# Tamaño máximo de simulación
N_max_g <- 10000

# Cortes de muestra
cortes_n <- c(10, 50, 100, 1000, 10000)

# Simulación aleatoria
muestra_gamma <- rgamma(N_max_g,
                        shape = alpha_g,
                        rate = beta_g)

# Promedio acumulado
prom_acum_g <- cumsum(muestra_gamma) / seq_along(muestra_gamma)

# ==========================================
# GRÁFICO
# ==========================================

# Márgenes
par(mar = c(5, 5, 6, 2))

plot(prom_acum_g,
     type = "l",
     col = "#1b5e20",
     lwd = 1.8,
     log = "x",

     main = "Convergencia estocástica de la distribución Gamma\nDemostración empírica de la Ley de los Grandes Números",

     xlab = "Tamaño de muestra acumulado (n) - escala logarítmica",

     ylab = expression(bar(X)[n] ~ "(promedio acumulado en días)"),

     las = 1,

     cex.main = 0.85,
     cex.lab  = 0.90,
     cex.axis = 0.80)

# ==========================================
# VALOR ESPERADO TEÓRICO
# ==========================================

abline(h = mu_g,
       col = "firebrick",
       lwd = 2.2,
       lty = 2)

# ==========================================
# BANDAS DE REFERENCIA
# ==========================================

abline(h = mu_g + 0.5,
       col = "gray60",
       lwd = 1,
       lty = 3)

abline(h = mu_g - 0.5,
       col = "gray60",
       lwd = 1,
       lty = 3)

# ==========================================
# LÍNEAS VERTICALES DE CORTE
# ==========================================

for (nc in cortes_n) {

  abline(v = nc,
         col = "#aab7b8",
         lwd = 1,
         lty = 3)

  text(nc,
       max(prom_acum_g) * 0.98,
       labels = paste0("n=", nc),
       col = "#555555",
       srt = 90,
       adj = 1,
       cex = 0.65)
}

# ==========================================
# LEYENDA
# ==========================================

legend("topright",

       legend = c(expression(bar(X)[n] ~ "simulado"),
                  paste0("E[X] = ", mu_g, " días"),
                  "Banda ±0.5"),

       col = c("#1b5e20",
               "firebrick",
               "gray60"),

       lwd = c(1.8, 2.2, 1),

       lty = c(1, 2, 3),

       cex = 0.75,

       bg = "white",

       bty = "o")

Análsis interpretativo

El gráfico evidencia la convergencia del promedio acumulado de la muestra simulada hacia el valor esperado teórico de la distribución Gamma, \(E[X] = 6\) días. Al inicio, con tamaños de muestra pequeños, se observa mayor variabilidad; sin embargo, conforme aumenta el número de observaciones, el promedio muestral se estabiliza alrededor del valor esperado.

CASO PRÁCTICO 2: DISTRIBUCIÓN CONTINUA

Distribución Normal – Contexto:
La empresa textilera ASOTEX, dedicada a la confección de uniformes infantiles, registra que la cantidad de uniformes producidos por contrato sigue una distribución normal, con una media de 600 uniformes y una desviación estándar de 50 uniformes.

En este caso:

  • Media: \(\mu = 600\)
  • Desviación estándar: \(\sigma = 50\)
  • Variable aleatoria: \(X\) = cantidad de uniformes infantiles producidos por contrato
  • Distribución: \(X \sim N(600,50)\)

a) Determine la probabilidad de que en un contrato seleccionado al azar se confeccionen menos de 550 uniformes infantiles.

b) Calcule la esperanza matemática y la desviación estándar de la producción de uniformes por contrato.

Desarrollo del ejercicio

  1. La probabilidad de que en un contrato seleccionado al azar se confeccionen menos de 550 uniformes infantiles es:

\[ P(X < 550) = 0.1587 \]

mu <- 600
sigma <- 50

prob_a <- pnorm(550, mean = mu, sd = sigma)

prob_a
## [1] 0.1586553

Análisis

El resultado obtenido indica que la probabilidad de que la empresa ASOTEX confeccione menos de 550 uniformes infantiles en un contrato es de aproximadamente 15.87%. Esto evidencia que la mayoría de los contratos tienden a mantenerse cercanos al promedio de producción establecido en 600 uniformes, mientras que producciones considerablemente menores representan eventos menos frecuentes dentro del comportamiento normal del proceso productivo.

  1. Esperanza matemática y desviación estándar:

\[ E(X)=600 \]

\[ \sigma = 50 \]

# Parámetros
mu <- 600
sigma <- 50

# Esperanza matemática
esperanza <- mu

# Varianza
varianza <- sigma^2

# Desviación estándar
desviacion <- sqrt(varianza)

# Resultados
esperanza
## [1] 600
varianza
## [1] 2500
desviacion
## [1] 50

Análisis

La esperanza matemática indica que, en promedio, la empresa ASOTEX confecciona 600 uniformes infantiles por contrato. Asimismo, la desviación estándar de 50 uniformes refleja la variabilidad de la producción respecto al promedio esperado.

Simulación para la Ley de los Grandes Números

Para verificar el comportamiento de la Ley de los Grandes Números en una variable continua, se realizarán simulaciones incrementando progresivamente el tamaño de la muestra. Se analizará cómo la media muestral de la producción de uniformes infantiles por contrato tiende a estabilizarse alrededor del valor esperado conforme aumenta el número de observaciones.

set.seed(123)

# ==========================================
# Parámetros de la distribución normal
# ==========================================

mu <- 600
sigma <- 50

# Media teórica
media_teorica <- mu

# Tamaños muestrales
n_muestras <- c(10, 50, 100, 1000, 10000)

# ==========================================
# Simulación
# ==========================================

resultados <- data.frame(
  n = n_muestras,
  media_muestral = numeric(length(n_muestras))
)

for(i in seq_along(n_muestras)){

  n <- n_muestras[i]

  # Generación de datos normales
  produccion_uniformes <- rnorm(n,
                                mean = mu,
                                sd = sigma)

  # Media muestral
  resultados$media_muestral[i] <- mean(produccion_uniformes)
}

# Resultados
resultados

Convergencia de las medias muestrales en la producción de uniformes infantiles — Ley de los Grandes Números

set.seed(2026)

# Número de simulaciones
B <- 5000

# Parámetros de la distribución normal
mu <- 600
sigma <- 50

# Esperanza y desviación estándar
esperanza <- mu
desviacion <- sigma

# Tamaños muestrales
muestras <- c(10, 50, 100, 1000, 10000)

# Panel de gráficos
par(mfrow = c(3, 2),
    mar = c(3, 3, 3, 1))

for(n in muestras){
  
  # Simulación de medias muestrales
  medias_muestrales <- replicate(B, {
    muestra <- rnorm(n, mean = mu, sd = sigma)
    mean(muestra)
  })
  
  # Media simulada
  media_simulada <- mean(medias_muestrales)
  
  # Error estándar
  error_estandar <- desviacion / sqrt(n)
  
  # Histograma
  hist(medias_muestrales,
       breaks = 35,
       probability = TRUE,
       col = "gray80",
       border = "white",
       main = paste("n =", n),
       xlab = "Promedio muestral de uniformes",
       ylab = "Densidad",
       cex.main = 0.9,
       cex.lab = 0.70,
       cex.axis = 0.65)
  
  # Curva normal teórica de la media muestral
  curve(dnorm(x, mean = esperanza, sd = error_estandar),
        add = TRUE,
        col = "darkblue",
        lwd = 2)
  
  # Línea de esperanza teórica
  abline(v = esperanza,
         col = "darkgreen",
         lwd = 2,
         lty = 2)
  
  # Línea de media simulada
  abline(v = media_simulada,
         col = "red",
         lwd = 2,
         lty = 2)
  
  # Leyenda
  legend("topright",
         legend = c("Curva normal",
                    "E[X] = 600",
                    "Media simulada"),
         col = c("darkblue", "darkgreen", "red"),
         lwd = 2,
         lty = c(1, 2, 2),
         cex = 0.50,
         bty = "n")
}

Análisis

El gráfico evidencia el comportamiento de las medias muestrales de la producción de uniformes infantiles en la empresa ASOTEX. Para tamaños de muestra pequeños, como n = 10 y n = 50, las medias presentan mayor dispersión alrededor del valor esperado. Sin embargo, conforme aumenta el tamaño de la muestra, especialmente en n = 1000 y n = 10000, las medias muestrales se concentran cada vez más cerca de E(X) = 600 uniformes.

CONVERGENCIA ESTOCÁSTICA - DISTRIBUCIÓN NORMAL

set.seed(5313)

# Parámetros de la distribución normal
mu <- 600
sigma <- 50

# Esperanza teórica
mu_teorica <- mu

# Tamaño máximo de simulación
N_max <- 10000

# Cortes de muestra
cortes_n <- c(10, 50, 100, 1000, 10000)

# ==========================================
# SIMULACIÓN ALEATORIA
# ==========================================

muestra_normal <- rnorm(N_max,
                        mean = mu,
                        sd = sigma)

# Promedio acumulado
prom_acum <- cumsum(muestra_normal) / seq_along(muestra_normal)

# ==========================================
# GRÁFICO
# ==========================================

par(mar = c(5, 5, 6, 2))

plot(prom_acum,
     type = "l",
     col = "#1565c0",
     lwd = 1.8,
     log = "x",

     main = "Convergencia estocástica de la distribución Normal\nDemostración empírica de la Ley de los Grandes Números",

     xlab = "Tamaño de muestra acumulado (n) - escala logarítmica",

     ylab = expression(bar(X)[n] ~ "(promedio acumulado de uniformes)"),

     las = 1,

     cex.main = 0.85,
     cex.lab  = 0.90,
     cex.axis = 0.80)

# ==========================================
# VALOR ESPERADO TEÓRICO
# ==========================================

abline(h = mu_teorica,
       col = "firebrick",
       lwd = 2.2,
       lty = 2)

# ==========================================
# BANDAS DE REFERENCIA
# ==========================================

abline(h = mu_teorica + 5,
       col = "gray60",
       lwd = 1,
       lty = 3)

abline(h = mu_teorica - 5,
       col = "gray60",
       lwd = 1,
       lty = 3)

# ==========================================
# LÍNEAS VERTICALES DE CORTE
# ==========================================

for (nc in cortes_n) {

  abline(v = nc,
         col = "#b0bec5",
         lwd = 1,
         lty = 3)

  text(nc,
       max(prom_acum) * 0.985,
       labels = paste0("n=", nc),
       col = "#555555",
       srt = 90,
       adj = 1,
       cex = 0.65)
}

# ==========================================
# LEYENDA
# ==========================================

legend("topright",

       legend = c(expression(bar(X)[n] ~ "simulado"),
                  "E[X] = 600 uniformes",
                  "Banda ±5"),

       col = c("#1565c0",
               "firebrick",
               "gray60"),

       lwd = c(1.8, 2.2, 1),

       lty = c(1, 2, 3),

       cex = 0.75,

       bg = "white",

       bty = "o")

Análisis

La simulación evidencia la Ley de los Grandes Números en el proceso de revisión de bordados defectuosos. Para tamaños muestrales pequeños, como n = 10, las medias muestrales presentan mayor dispersión y fluctuación respecto al valor esperado teórico E(X) = 15. Sin embargo, conforme aumenta el tamaño de la muestra (n = 50, 100, 1000 y 10000), las medias se concentran progresivamente alrededor de la esperanza matemática, reduciendo la variabilidad y mostrando una distribución más estable y suave.

Conclusiones:

Los casos prácticos desarrollados permitieron aplicar distribuciones de probabilidad discretas y continuas en contextos reales relacionados con procesos textiles y productivos, evidenciando la utilidad de la estadística para modelar fenómenos asociados al control de calidad y producción industrial.

Las simulaciones realizadas con tamaños muestrales crecientes demostraron que, conforme aumenta el número de observaciones, las medias muestrales tienden a estabilizarse alrededor del valor esperado teórico. En muestras pequeñas se observaron mayores fluctuaciones; sin embargo, con tamaños grandes las estimaciones presentaron mayor estabilidad y precisión.

Asimismo, los gráficos de convergencia permitieron verificar visual y empíricamente la Ley de los Grandes Números, evidenciando que tanto en variables discretas como continuas el promedio muestral converge progresivamente hacia la media poblacional.