La gerencia comercial analiza el precio de venta final por unidad de un producto. El precio se distribuye normalmente con \(\sigma^2 = 1000\) (pesos)². Muestra de \(n = 12\) ventas con \(\bar{x} = 3250\) pesos.
## a. IC 95%: [ 3232.108 , 3267.892 ]
## Ancho: 35.7839
## b. IC 90%: [ 3234.985 , 3265.015 ] - Ancho: 30.0308
## IC 95%: [ 3232.108 , 3267.892 ] - Ancho: 35.7839
## IC 99%: [ 3226.486 , 3273.514 ] - Ancho: 47.028
## => A mayor nivel de confianza, mayor ancho del intervalo.
## c. Tamaño de muestra requerido (error < 15, confianza 99%): 30
Interpretación: - a. Con el 95% de confianza, el precio promedio de venta se ubica entre 3232.11 y 3267.89 pesos. - b. Al aumentar el nivel de confianza el intervalo se amplía: para estar más seguros, sacrificamos precisión. - c. Se necesitan al menos 30 ventas en la muestra para estimar el precio con un error menor a 15 pesos al 99% de confianza.
Muestra de 6 paquetes de margarina dietética. Niveles de ácido graso poliinsaturado (%): 16.8, 17.2, 17.4, 16.9, 16.5, 17.1.
## a. Prueba Shapiro-Wilk:
## W = 0.9878 | p-value = 0.9831
## => No se rechaza H0: los datos provienen de una distribucion normal (p > 0.05)
## b. IC 99% para la media:
## Media muestral: 16.9833
## IC 99%: [ 16.4585 , 17.5082 ]
Interpretación: - a. El p-value de Shapiro-Wilk es 0.9831 > 0.05, por lo que hay evidencia de que el nivel de ácido graso se distribuye normalmente. - b. Con el 99% de confianza, el nivel promedio de ácido graso poliinsaturado está entre 16.4585% y 17.5082%. Como \(\sigma\) es desconocida, se utiliza la distribución \(t\) con \(n-1 = 5\) grados de libertad.
Red de 51 puntos comerciales. Desviación estándar muestral del porcentaje de conversión de leads: \(s = 0.37\).
## a. IC 95% para sigma:
## Chi2 inferior (2.5%): 32.3574
## Chi2 superior (97.5%): 71.4202
## IC 95% para sigma^2: [ 0.0958 , 0.2115 ]
## IC 95% para sigma: [ 0.3096 , 0.4599 ]
## b. Efecto de aumentar n (s = 0.37 fija):
## n = 51 => IC: [ 0.3096 , 0.4599 ] | Ancho: 0.1504
## n = 100 => IC: [ 0.3249 , 0.4298 ] | Ancho: 0.105
## n = 200 => IC: [ 0.3369 , 0.4103 ] | Ancho: 0.0734
## n = 500 => IC: [ 0.3484 , 0.3945 ] | Ancho: 0.0461
## => Al aumentar n el intervalo se estrecha (mayor precision).
Interpretación: - a. Con el 95% de confianza, la desviación estándar real del porcentaje de conversión se ubica entre 0.3096 y 0.4599. - b. Al aumentar el tamaño muestral manteniendo \(s\) constante, el intervalo se vuelve más angosto porque los cuantiles chi-cuadrado se acercan entre sí en términos relativos.
De 1000 casos de cáncer de pulmón, 823 resultaron en muerte dentro de los 10 años posteriores a su detección.
## a. IC 95% para la tasa de mortalidad:
## Proporcion muestral p̂ = 0.823
## IC 95%: [ 0.7981 , 0.8454 ]
## b. Interpretacion:
## Con el 95% de confianza, la verdadera tasa de mortalidad
## por cancer de pulmon (a 10 anios) se ubica entre 79.81 % y 84.54 %
Interpretación: - a. La proporción muestral es \(\hat{p} = 0.823\). - b. Con el 95% de confianza, la verdadera tasa de mortalidad por cáncer de pulmón en los 10 años siguientes al diagnóstico se encuentra entre 79.81% y 84.54%. Dada la magnitud del intervalo, se evidencia que este tipo de cáncer tiene una tasa de mortalidad muy alta.
30 unidades de tabaco habano para medir contenido de alquitrán.
## Resumen de los datos:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.397 1.498 1.532 4.080 1.578 78.000
##
## a. Prueba Shapiro-Wilk (con outlier):
## W = 0.1827 | p-value = 8.1888e-12
## => Se rechaza normalidad (p << 0.05). El valor 78.000 es un OUTLIER.
## Prueba Shapiro-Wilk (sin outlier 78.000):
## W = 0.9729 | p-value = 0.6417
## => Sin el outlier, los datos siguen distribucion normal.
## b. IC 99% para la media del contenido de alquitran (datos limpios):
## n valido: 29
## Media: 1.5308
## IC 99%: [ 1.5017 , 1.5599 ]
Interpretación: - a. Con el outlier
78.000 presente, la prueba Shapiro-Wilk rechaza la
normalidad contundentemente. Este valor es claramente un error de
medición o de registro. Eliminándolo, los datos sí son compatibles con
una distribución normal. - b. Trabajando con los 29
datos válidos, el contenido promedio de alquitrán se estima con el 99%
de confianza entre 1.5017 y 1.5599.
Tiempo de secado (horas) de una nueva pintura.
## n = 30 | Media = 4.2333 | S = 2.3879
## a. IC 95% para la media del tiempo de secado:
## IC 95%: [ 3.3417 , 5.125 ]
## b. IC 98% para la varianza del tiempo de secado:
## S^2 = 5.7023
## IC 98%: [ 3.3348 , 11.5994 ]
Interpretación: - a. Con el 95% de confianza, el tiempo promedio de secado de la pintura está entre 3.3417 y 5.125 horas. - b. Con el 98% de confianza, la varianza real del tiempo de secado se ubica entre 3.3348 y 11.5994 horas². La amplitud del intervalo refleja la alta dispersión observada en los datos.
Servicio al cliente quiere estimar el tiempo promedio de resolución. \(\sigma = 40\) segundos. IC 95% dentro de 15 segundos de la media real.
## z_{0.025} = 1.96
## n requerido = ceiling(( 1.96 * 40 / 15 )^2)
## n requerido = 28
Interpretación: Se necesita una muestra de al menos 28 solicitudes para que el intervalo de confianza del 95% esté dentro de 15 segundos de la media real del tiempo de resolución.
Comparación del puntaje de respuesta comercial entre campaña estándar y campaña digital.
## Campaña estándar - Media: 443.3333 | SD: 14.2786
## Campaña digital - Media: 451.4167 | SD: 14.939
## Prueba F para igualdad de varianzas:
## p-value = 0.8835
## Conclusion: varianzas iguales
## a. IC 95% para la diferencia de medias (estandar - digital):
## Diferencia de medias: -8.0833
## IC 95%: [ -20.4551 , 4.2885 ]
## b. Conclusion:
## El IC incluye el 0 -> NO hay diferencia estadisticamente significativa entre campanas.
Interpretación: - a. El IC del 95% para \(\mu_{estándar} - \mu_{digital}\) es [-20.4551, 4.2885]. - b. Como el intervalo incluye el 0, no hay evidencia de diferencia real entre las campañas. La campaña digital presenta mayor puntaje promedio.
De 87 estaciones de gasolina, 13 tenían al menos un tanque subterráneo con fuga.
## a. IC 95% para la proporcion de estaciones con fugas:
## p̂ = 0.1494
## IC 95%: [ 0.0895 , 0.239 ]
## b. Tamaño de muestra requerido:
## Con informacion previa (p̂ = 0.1494 ): n = 543
## Sin informacion previa (p = 0.5): n = 1068
## Nota sobre poblacion finita:
## Si la poblacion total N es conocida, se aplica factor de correccion:
## n_ajustado = n / (1 + (n-1)/N)
## Solo aplica si n/N > 0.05 (fraccion de muestreo > 5%)
Interpretación: - a. Con el 95% de confianza, la verdadera proporción de estaciones con fugas está entre 8.95% y 23.9%. - b. Usando la información previa (\(\hat{p}\) conocido), se requieren 543 estaciones. Sin información previa, el caso más conservador requiere 1068. El ajuste por población finita aplica solo si el total de estaciones en el país es conocido y \(n/N > 5\%\).
Rendimiento mensual (%) de 7 portafolios. IC 95% por el método Bootstrap (k = 1000 muestras).
## Media muestral original: 5.5343
## Numero de muestras bootstrap: k = 1000
## Metodo 1 - Percentiles directos:
## P_2.5 = 4.7484
## P_97.5 = 6.5086
## IC 95%: [ 4.7484 , 6.5086 ]
## Metodo 2 - Bootstrap basico (reflexion):
## 2*x̄ - P_97.5 = 4.5599
## 2*x̄ - P_2.5 = 6.3202
## IC 95%: [ 4.5599 , 6.3202 ]
## Comparacion:
## Metodo 1 - Ancho: 1.7603
## Metodo 2 - Ancho: 1.7603
Interpretación: - Método 1 (percentiles directos): El IC del 95% para el rendimiento mensual promedio es [4.7484%, 6.5086%]. - Método 2 (bootstrap básico): El IC del 95% es [4.5599%, 6.3202%]. - Ambos métodos producen intervalos similares. El Método 2 es ligeramente más robusto porque corrige el posible sesgo de la distribución bootstrap respecto a la media original.