Se importa la base de datos DIRECTORIO_PIE_WEB_2022
desde un archivo Excel data.xlsx
data <- read_excel("data.xlsx")
Considerando la base de datos “DIRECTORIO_PIE_WEB_2022”: Si seleccionamos 1500 establecimientos, y definimos la variable aleatoria “Cantidad de establecimientos de dependencia Particular Subvencionado de 1500 establecimientos elegidos al azar”. Considere éxito como establecimiento de dependencia particular Subvencionado
p <- mean(data$DEPENDENCIA == "PARTICULAR SUBVENCIONADO", na.rm = TRUE)
p
## [1] 0.3400033
n <- 1500
n_p <- n * p
n_p
## [1] 510.005
q <- 1 - p
n_q <- n * q
n_q
## [1] 989.995
Condición: \(n p > 5\) y \(n q > 5\).
if (n_p > 5 & n_q > 5) {
cat("Sí, se puede utilizar la aproximación normal. Tanto n*p como n*q son mayores que 5.
")
} else {
cat("No se recomienda la aproximación normal porque n*p o n*q no son suficientemente grandes.
")
}
## Sí, se puede utilizar la aproximación normal. Tanto n*p como n*q son mayores que 5.
Si se sabe que se eligieron 1500 establecimientos educacionales de la base “DIRECTORIO_PIE_WEB_2022”, y usando los parámetros media y desviación estándar, responda las siguientes preguntas:
Usamos la aproximación: \[ X pprox N(\mu = n p, \sigma = \sqrt{n p (1-p)}) \]
mu <- n * p
sigma <- sqrt(n * p * (1 - p))
mu; sigma
## [1] 510.005
## [1] 18.34671
Usamos corrección de continuidad: \(P(X \ge 450) \approx 1 - \Phi\left( \frac{449.5 - \mu}{\sigma} \right)\).
z1 <- (449.5 - mu) / sigma
prob_b <- 1 - pnorm(z1)
prob_b
## [1] 0.9995129
Usamos corrección de continuidad: \(P(X < 530) \approx \Phi\left( \frac{529.5 - \mu}{\sigma} \right)\).
z2 <- (529.5 - mu) / sigma
prob_c <- pnorm(z2)
prob_c
## [1] 0.8560162
z_l <- (499.5 - mu) / sigma
z_u <- (540.5 - mu) / sigma
prob_d <- pnorm(z_u) - pnorm(z_l)
prob_d
## [1] 0.6682945
Considera 600 establecimientos educacionales, y definimos la variable aleatoria “Cantidad de establecimientos de área rural de 600 establecimientos elegidos al azar”
p_rural <- mean(data$AREA == "RURAL", na.rm = TRUE)
p_rural
## [1] 0.3533984
n_rural <- 600
n_p_rural <- n_rural * p_rural
n_p_rural
## [1] 212.039
q_rural <- 1 - p_rural
n_q_rural <- n_rural * q_rural
n_q_rural
## [1] 387.961
if (n_p_rural > 5 & n_q_rural > 5) {
cat("Sí, se puede utilizar la aproximación normal. Tanto n*p como n*q son mayores que 5.
")
} else {
cat("No se recomienda la aproximación normal porque n*p o n*q no son suficientemente grandes.
")
}
## Sí, se puede utilizar la aproximación normal. Tanto n*p como n*q son mayores que 5.
mu_rural <- n_p_rural
sigma_rural <- sqrt(n_rural * p_rural * q_rural)
mu_rural; sigma_rural
## [1] 212.039
## [1] 11.70917
z_rural_1 <- (195.5 - mu_rural) / sigma_rural
prob_rural_mas_195 <- 1 - pnorm(z_rural_1)
prob_rural_mas_195
## [1] 0.9210963
z_rural_2 <- (210.5 - mu_rural) / sigma_rural
prob_rural_max_210 <- pnorm(z_rural_2)
prob_rural_max_210
## [1] 0.4477145
z_rural_low <- (179.5 - mu_rural) / sigma_rural
z_rural_high <- (250.5 - mu_rural) / sigma_rural
prob_rural_entre <- pnorm(z_rural_high) - pnorm(z_rural_low)
prob_rural_entre
## [1] 0.9967626
Crea una variable aleatoria con la variable “Comuna” que se distribuya a través de una aproximación de una binomial a normal y comprueba a través de los parámetros 𝑛 ∙ 𝑝 > 5 y 𝑛 ∙ 𝑞 > 5 .
Definimos la comuna objetivo IQUIQUE y verificamos la condición para aproximación binomial–normal.
comuna_objetivo <- "IQUIQUE"
p_comuna <- mean(data$COMUNA == comuna_objetivo, na.rm = TRUE)
p_comuna
## [1] 0.006449479
n_comuna <- nrow(data)
n_comuna
## [1] 6047
n_p_comuna <- n_comuna * p_comuna
n_q_comuna <- n_comuna * (1 - p_comuna)
n_p_comuna; n_q_comuna
## [1] 39
## [1] 6008
if (n_p_comuna > 5 & n_q_comuna > 5) {
cat("Se puede aproximar la binomial a la normal para esta variable aleatoria.
")
} else {
cat("No se recomienda la aproximación a la normal con esta variable aleatoria.
")
}
## Se puede aproximar la binomial a la normal para esta variable aleatoria.