Enunciado: El precio de venta se distribuye normalmente con \(\sigma^2 = 1000\ (\text{pesos})^2\). Muestra de \(n = 12\) ventas con \(\bar{x} = 3250\) pesos.
Fórmula aplicable : Varianza conocida → se usa la distribución normal estándar \(Z\). \[IC_\mu : \bar{x} \pm z_{\alpha/2} \dfrac{\sigma}{\sqrt{n}}\]
xbar <- 3250 # media muestral
sigma2 <- 1000 # varianza poblacional CONOCIDA
sigma <- sqrt(sigma2) # desviación estándar poblacional
n <- 12 # tamaño de muestraalpha <- 0.05
z <- qnorm(1 - alpha / 2) # z_{0.025} = 1.96
LI_95 <- xbar - z * sigma / sqrt(n)
LS_95 <- xbar + z * sigma / sqrt(n)
cat("z_{alpha/2} =", round(z, 4), "\n")## z_{alpha/2} = 1.96
## IC 95% para mu: ( 3232.11 ; 3267.89 )
Interpretación: Con una confianza del 95 %, el precio de venta promedio por unidad se encuentra entre 3232.11 y 3267.89 pesos.
# IC al 90%
z90 <- qnorm(0.95)
LI_90 <- xbar - z90 * sigma / sqrt(n)
LS_90 <- xbar + z90 * sigma / sqrt(n)
ancho_90 <- LS_90 - LI_90
# IC al 99%
z99 <- qnorm(0.995)
LI_99 <- xbar - z99 * sigma / sqrt(n)
LS_99 <- xbar + z99 * sigma / sqrt(n)
ancho_99 <- LS_99 - LI_99
ancho_95 <- LS_95 - LI_95
cat("=== IC al 90 % ===\n")## === IC al 90 % ===
## z_{0.05} = 1.6449
## Intervalo : ( 3234.98 ; 3265.02 )
## Ancho : 30.03
## === IC al 95 % ===
## Intervalo : ( 3232.11 ; 3267.89 )
## Ancho : 35.78
## === IC al 99 % ===
## z_{0.005} = 2.5758
## Intervalo : ( 3226.49 ; 3273.51 )
## Ancho : 47.03
niveles <- c("90%", "95%", "99%")
LIs <- c(LI_90, LI_95, LI_99)
LSs <- c(LS_90, LS_95, LS_99)
plot(NULL, xlim = c(min(LIs) - 2, max(LSs) + 2), ylim = c(0.5, 3.5),
xlab = "Precio (pesos)", ylab = "Confianza",
main = "Comparación de intervalos de confianza — Problema 1",
yaxt = "n", las = 1)
axis(2, at = 1:3, labels = niveles, las = 1)
abline(v = xbar, col = "red", lty = 2, lwd = 2)
cols <- c("steelblue", "pink", "purple")
for (i in 1:3) {
segments(LIs[i], i, LSs[i], i, col = cols[i], lwd = 4)
points(c(LIs[i], LSs[i]), c(i, i), pch = 19, col = cols[i])
}
legend("topleft", legend = niveles, col = cols, lwd = 3, bty = "n")Conclusión: A mayor nivel de confianza, mayor es el ancho del intervalo. Al pasar del 90 % al 99 %, el ancho aumenta de 30.03 a 47.03 pesos, lo que refleja una mayor incertidumbre al garantizar más confianza.
Fórmula (recurso42 — Tamaño de muestra para media): \[n = \dfrac{z^2_{\alpha/2}\,\sigma^2}{e^2}\]
e <- 15 # error de muestreo máximo (pesos)
z99 <- qnorm(0.995) # confianza 99%
n_req <- (z99^2 * sigma2) / e^2
cat("n requerido (exacto) :", round(n_req, 4), "\n")## n requerido (exacto) : 29.4884
## n requerido (entero) : 30
Interpretación: Para estimar el precio de venta con un error menor a 15 pesos y una confianza del 99 %, se requiere una muestra de al menos 30 ventas.
Enunciado: Nivel de ácido graso poliinsaturado en 6 paquetes de margarina.
Fórmula aplicable : Varianza desconocida, muestra pequeña → distribución \(t\)-Student con \(\nu = n-1\) grados de libertad. \[IC_\mu : \bar{x} \pm t_{\alpha/2;\,n-1} \dfrac{s}{\sqrt{n}}\]
x <- c(16.8, 17.2, 17.4, 16.9, 16.5, 17.1)
n <- length(x)
cat("n =", n, " | media =", mean(x), " | sd =", round(sd(x), 4), "\n")## n = 6 | media = 16.98333 | sd = 0.3189
cat("Dado que el tamaño de la muestra es muy pequeño, no se peude afirmar que el nivel de ácido graso poliinsaturado se distribuye normalmente, pues no se cumple el teorema central del limite ", "\n")## Dado que el tamaño de la muestra es muy pequeño, no se peude afirmar que el nivel de ácido graso poliinsaturado se distribuye normalmente, pues no se cumple el teorema central del limite
## IC 99% para mu:
## [ 16.4585 ; 17.5082 ]
## Nivel de confianza: 0.99
Interpretación: Con una confianza del 99 %, el nivel promedio de ácido graso poliinsaturado en la margarina dietética se encuentra entre 16.4585% y 17.5082%.
Enunciado: Red de \(n = 51\) puntos comerciales; desviación estándar muestral \(s = 0.37\).
Fórmula aplicable : \[IC_{\sigma^2} : \left(\dfrac{(n-1)s^2}{\chi^2_{\alpha/2;\,n-1}}\;;\;\dfrac{(n-1)s^2}{\chi^2_{1-\alpha/2;\,n-1}}\right)\]
n <- 51
s <- 0.37
s2 <- s^2
alpha <- 0.05
gl <- n - 1
chi2_sup <- qchisq(1 - alpha/2, gl) # percentil 97.5
chi2_inf <- qchisq(alpha/2, gl) # percentil 2.5
LI_var <- (gl * s2) / chi2_sup
LS_var <- (gl * s2) / chi2_inf
cat("Grados de libertad :", gl, "\n")## Grados de libertad : 50
## Chi2 (97.5%) : 71.4202
## Chi2 (2.5%) : 32.3574
## IC 95% para sigma^2 : ( 0.095841 ; 0.211544 )
## IC 95% para sigma : ( 0.3096 ; 0.4599 )
Interpretación: Con una confianza del 95 %, la varianza del porcentaje de conversión de leads a ventas se encuentra entre 0.095841 y 0.211544; equivalentemente, la desviación estándar se encuentra entre 0.3096 y 0.4599.
ns <- seq(51, 500, by = 10)
anchos <- sapply(ns, function(ni) {
gl_i <- ni - 1
LI_i <- (gl_i * s2) / qchisq(0.975, gl_i)
LS_i <- (gl_i * s2) / qchisq(0.025, gl_i)
LS_i - LI_i
})
plot(ns, anchos, type = "l", col = "steelblue", lwd = 2,
xlab = "Tamaño de muestra (n)", ylab = "Ancho del IC para sigma^2",
main = "Ancho del IC para la varianza vs. tamaño de muestra")
abline(v = 51, col = "red", lty = 2)
grid()Conclusión: Al aumentar el tamaño de muestra manteniendo \(s\) constante, el ancho del intervalo de confianza disminuye, lo que significa una estimación más precisa de la varianza poblacional.
Enunciado: De 1000 casos de cáncer de pulmón, 823 murieron en los 10 años posteriores.
Fórmula aplicable: \[IC_p : \hat{p} \pm z_{\alpha/2}\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}}\]
## Proporción muestral (p_hat) = 0.823
## n * p = 823 (> 5: OK)
## n * (1-p) = 177 (> 5: OK)
## IC 95% para la tasa de mortalidad:
## [ 0.7976 ; 0.8459 ]
Interpretación: Con una confianza del 95 %, la tasa de mortalidad por cáncer de pulmón dentro de los 10 años posteriores al diagnóstico se estima entre 79.76% y 84.59%. Dado que ambos límites superan el 80 %, se puede afirmar que la enfermedad tiene una tasa de mortalidad muy elevada en ese período.
Enunciado: Contenido de alquitrán (en mg) en 30 unidades de tabaco habano. Se observa un posible valor atípico (78).
x <- c(1.542, 1.622, 1.440, 1.459, 1.598, 1.585, 1.466, 1.608, 1.533, 1.498, 1.532, 1.546, 1.520, 1.532, 1.600, 1.466, 1.494, 78, 1.523, 1.504, 1.499, 1.548, 1.542, 1.397, 1.545, 1.611, 1.626, 1.511, 1.487, 1.558)
cat("n =", length(x), "\n")## n = 30
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.397 1.498 1.532 4.080 1.578 78.000
cat("Dado que n es lo suficientemete grande para que se cumpla elteorema central del limite, se peude decir que el contenido de alquitran se distribuye normalmente", "\n")## Dado que n es lo suficientemete grande para que se cumpla elteorema central del limite, se peude decir que el contenido de alquitran se distribuye normalmente
## === Con todos los datos (incluye valor 78) ===
ic_con <- t.test(x, conf.level = 0.99)$conf.int
cat(" IC 99%: [", round(ic_con[1], 4), ";", round(ic_con[2], 4), "]\n\n")## IC 99%: [ -2.9463 ; 11.1057 ]
Interpretación: Con una confianza del 99 %, el contenido promedio de alquitrán en el tabaco habano se encuentra entre -2.9463 mg y 11.1057 mg. El intervalo probablemente es engañoso debido al outlier.
Enunciado: Tiempo de secado (en horas) de una nueva pintura.
x <- c(3,4, 2,5, 4,8, 2,9, 3,6, 2,8, 3,3, 5,6, 3,7, 2,8, 4,4, 4,0, 5,2, 3,0, 4,8)
n <- length(x)
cat("n =", n, " | media =", round(mean(x),4), " | sd =", round(sd(x),4), "\n")## n = 30 | media = 4.2333 | sd = 2.3879
## Se cumple el teorema central del limite por el tamaño de la muestra n=30
ic_media <- t.test(x, conf.level = 0.95)$conf.int
alpha <- 0.05
z <- qnorm(1 - alpha / 2) # z_{0.025} = 1.96
LI_95 <- mean(x) - z * (sd(x)) / sqrt(n)
LS_95 <- mean(x) + z * (sd(x)) / sqrt(n)
cat("IC 95% para la media del tiempo de secado:\n")## IC 95% para la media del tiempo de secado:
## [ 3.3417 ; 5.125 ] horas
Interpretación: Con una confianza del 95 %, el tiempo promedio de secado de la pintura se encuentra entre 3.3417 y 5.125 horas.
Fórmula (recurso42 — caso 5): distribución \(\chi^2\) con \(\nu = n-1\).
alpha <- 0.02
gl <- n - 1
s2 <- var(x)
chi2_sup <- qchisq(1 - alpha/2, gl)
chi2_inf <- qchisq(alpha/2, gl)
LI_var <- (gl * s2) / chi2_sup
LS_var <- (gl * s2) / chi2_inf
cat("Varianza muestral s^2 =", round(s2, 4), "\n")## Varianza muestral s^2 = 5.7023
## Chi2 (99%) = 49.5879
## Chi2 (1%) = 14.2565
## IC 98% para sigma^2 : [ 3.3348 ; 11.5994 ]
## IC 98% para sigma : [ 1.8261 ; 3.4058 ] horas
Interpretación: Con una confianza del 98 %, la varianza del tiempo de secado se encuentra entre 3.3348 y 11.5994 horas², lo que equivale a una desviación estándar entre 1.8261 y 3.4058 horas.
Enunciado: IC al 95 %, error \(e \leq 15\) segundos, \(\sigma = 40\) segundos.
Fórmula: \[n = \dfrac{z^2_{\alpha/2}\,\sigma^2}{e^2}\]
sigma <- 40
e <- 15
alpha <- 0.05
z <- qnorm(1 - alpha/2)
n_req <- (z^2 * sigma^2) / e^2
cat("z_{alpha/2} =", round(z, 4), "\n")## z_{alpha/2} = 1.96
## n (exacto) = 27.317
## n (mínimo) = 28
Interpretación: Para estimar el tiempo promedio de resolución de una solicitud comercial con un error máximo de 15 segundos y una confianza del 95 %, se requiere una muestra de al menos 28 solicitudes.
Enunciado: Comparación del puntaje de respuesta comercial entre campaña estándar y campaña digital.
proc_est <- c(428, 419, 458, 439, 441, 456, 463, 429, 438, 445, 441, 463)
proc_nue <- c(462, 448, 435, 465, 429, 472, 453, 459, 427, 468, 452, 447)
cat("Campaña estándar : media =", round(mean(proc_est),2), " | sd =", round(sd(proc_est),2), "\n")## Campaña estándar : media = 443.33 | sd = 14.28
## Campaña digital : media = 451.42 | sd = 14.94
## Diferencias: -34 -29 23 -26 12 -16 10 -30 11 -23 -11 16
## Media de d : -8.0833
## SD de d : 20.9868
# IC para la diferencia de medias PAREADAS
# Fórmula: d̄ ± t_{α/2, n-1} * (sd / √n)
ic_pareado <- t.test(proc_est, proc_nue,
paired = TRUE,
conf.level = 0.95)$conf.int
cat("IC 95% para (mu_est - mu_nue) [PAREADAS]:\n")## IC 95% para (mu_est - mu_nue) [PAREADAS]:
## [ -21.4177 ; 5.2511 ]
Interpretación: El intervalo para la diferencia \(\mu_{\text{est}} - \mu_{\text{nue}}\) incluye valores negativos, lo que indica que la campaña digital tiende a generar puntajes más altos. Sin embargo, dado que el intervalo contiene el cero, no hay evidencia estadística suficiente al 95 % para afirmar que existe una diferencia real entre las dos campañas en este nivel de confianza. Se recomienda aumentar el tamaño de muestra para mayor precisión.
Enunciado: De 87 estaciones de gasolina, 13 tenían al menos un tanque subterráneo con fuga.
Fórmula (recurso42 — caso 4): \(IC_p : \hat{p} \pm z_{\alpha/2}\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}}\)
## Proporción muestral (p_hat) = 0.1494
## n * p_hat = 13 (> 5: OK)
## n * (1-p_hat) = 74 (> 5: OK)
ic_p9 <- prop.test(x, n, conf.level = 0.95)$conf.int
cat("IC 95% para la proporción de estaciones con fugas:\n")## IC 95% para la proporción de estaciones con fugas:
## [ 0.0851 ; 0.2456 ]
Interpretación: Con una confianza del 95 %, la proporción de estaciones de gasolina con al menos un tanque subterráneo con fuga se encuentra entre 8.51% y 24.56%.
Fórmula (recurso42): \(n = \dfrac{z^2_{\alpha/2}\,p(1-p)}{e^2}\)
Si no se tiene información previa sobre \(p\), se usa la varianza máxima \(pq = 0.5 \times 0.5 = 0.25\).
e <- 0.03
alpha <- 0.05
z <- qnorm(1 - alpha/2)
# Caso 1: usando p_hat de la muestra disponible
n_previo <- (z^2 * phat * (1 - phat)) / e^2
# Caso 2: varianza máxima (sin información previa)
n_maxvar <- (z^2 * 0.5 * 0.5) / e^2
cat("=== Con p_hat =", round(phat,4), "(información previa) ===\n")## === Con p_hat = 0.1494 (información previa) ===
## n requerido = 543
## === Con varianza máxima p=0.5 (sin información previa) ===
## n requerido = 1068
Conclusión: Sin información previa sobre la proporción real, se debe usar la varianza máxima (\(p=0.5\)), lo que requiere 1068 estaciones. Si se usa la proporción observada (0.1494), bastan 543 estaciones. No se aplica ajuste por población finita ya que no se conoce el total de estaciones en la región.
Enunciado: Rendimiento mensual (%) de una muestra de 7 portafolios. Sin información sobre la distribución.
## Datos: 7.69 4.97 4.56 6.49 4.34 6.24 4.45
## Media muestral: 5.5343 %
k <- 1000 # número de muestras bootstrap
boot <- sample(x, k * length(x), replace = TRUE)
b <- matrix(boot, nrow = k, ncol = length(x))
mx <- apply(b, 1, mean)
ic1 <- quantile(mx, probs = c(0.025, 0.975))
ic1## 2.5% 97.5%
## 4.741214 6.495714
## IC Bootstrap — Método 1:
## [ 4.7412 ; 6.4957 ] %
hist(mx, las = 1, col = "pink", border = "white",
main = "Bootstrap — Método 1",
xlab = "Media bootstrap (%)", ylab = "Frecuencia",
xlim = c(4.0, 7.5))
abline(v = ic1, col = "red", lwd = 2, lty = 2)
abline(v = mean(x), col = "green", lwd = 2)
legend("topright", legend = c("IC 95%", "Media muestral"),
col = c("red","green"), lwd = 2, bty = "n")## IC Bootstrap — Método 2:
## [ 4.6269 ; 6.3814 ] %
hist(mx, las = 1, col = "pink", border = "white",
main = "Bootstrap — Método 2 (corregido)",
xlab = "Media bootstrap (%)", ylab = "Frecuencia",
xlim = c(4.0, 7.5))
abline(v = ic2, col = "blue", lwd = 2, lty = 2)
abline(v = mean(x), col = "darkgreen", lwd = 2)
legend("topright", legend = c("IC 95% corregido", "Media muestral"),
col = c("blue","darkgreen"), lwd = 2, bty = "n")## Método 1 | 4.7412 | 6.4957
## Método 2 | 4.6269 | 6.3814
##
## Ancho Método 1: 1.7545
## Ancho Método 2: 1.7545
Interpretación: Ambos métodos producen intervalos similares para el rendimiento mensual promedio de los portafolios. El Método 2 aplica una corrección al sesgo de la distribución bootstrap. Con una confianza del 95 %, el rendimiento mensual promedio de los portafolios se estima entre aproximadamente 4.74% y 6.5% (Método 1), sin necesidad de asumir ninguna distribución poblacional.