1 Carga de datos

Se importa la base de datos DIRECTORIO_PIE_WEB_2022 desde un archivo Excel data.xlsx

data <- read_excel("data.xlsx")

2 Actividad 2

Considerando la base de datos “DIRECTORIO_PIE_WEB_2022”: Si seleccionamos 1500 establecimientos, y definimos la variable aleatoria “Cantidad de establecimientos de dependencia Particular Subvencionado de 1500 establecimientos elegidos al azar”. Considere éxito como establecimiento de dependencia particular Subvencionado

2.1 Calcula la probabilidad de éxito (p)

p <- mean(data$DEPENDENCIA == "PARTICULAR SUBVENCIONADO", na.rm = TRUE)
p
## [1] 0.3400033

2.2 Calcula el valor de \(n \cdot p\)

n <- 1500
n_p <- n * p
n_p
## [1] 510.005

2.3 Calcula el valor de \(n \cdot q\)

q <- 1 - p
n_q <- n * q
n_q
## [1] 989.995

2.4 Decide si la variable puede distribuirse mediante una aproximación de distribución binomial a la distribución normal. Justifica

Condición: \(n p > 5\) y \(n q > 5\).

if (n_p > 5 & n_q > 5) {
  cat("Sí, se puede utilizar la aproximación normal. Tanto n*p como n*q son mayores que 5.
")
} else {
  cat("No se recomienda la aproximación normal porque n*p o n*q no son suficientemente grandes.
")
}
## Sí, se puede utilizar la aproximación normal. Tanto n*p como n*q son mayores que 5.

3 Actividad 3

Si se sabe que se eligieron 1500 establecimientos educacionales de la base “DIRECTORIO_PIE_WEB_2022”, y usando los parámetros media y desviación estándar, responda las siguientes preguntas:

Usamos la aproximación: \[ X pprox N(\mu = n p, \sigma = \sqrt{n p (1-p)}) \]

3.1 Determina la media y desviación estándar, para efectuar una aproximación de distribución binomial a la distribución normal.

mu <- n * p
sigma <- sqrt(n * p * (1 - p))
mu; sigma
## [1] 510.005
## [1] 18.34671

3.2 ¿Cuál es la probabilidad aproximada de que al menos 450 de ellos sean de dependencia Particular Subvencionado?

Usamos corrección de continuidad: \(P(X \ge 450) \approx 1 - \Phi\left( \frac{449.5 - \mu}{\sigma} \right)\).

z1 <- (449.5 - mu) / sigma
prob_b <- 1 - pnorm(z1)
prob_b
## [1] 0.9995129

3.3 ¿Cuál es la probabilidad aproximada de que menos de 530 sean de dependencia Particular Subvencionado?

Usamos corrección de continuidad: \(P(X < 530) \approx \Phi\left( \frac{529.5 - \mu}{\sigma} \right)\).

z2 <- (529.5 - mu) / sigma
prob_c <- pnorm(z2)
prob_c
## [1] 0.8560162

3.4 ¿Cuál es la probabilidad aproximada de que haya entre 500 y 540 de dependencia Particular Subvencionado?

z_l <- (499.5 - mu) / sigma
z_u <- (540.5 - mu) / sigma
prob_d <- pnorm(z_u) - pnorm(z_l)
prob_d
## [1] 0.6682945

4 Actividad 4

Considera 600 establecimientos educacionales, y definimos la variable aleatoria “Cantidad de establecimientos de área rural de 600 establecimientos elegidos al azar”

4.1 Calcula la probabilidad de éxito (p)

p_rural <- mean(data$AREA == "RURAL", na.rm = TRUE)
p_rural
## [1] 0.3533984

4.2 Calcula el valor de \(n \cdot p\)

n_rural <- 600
n_p_rural <- n_rural * p_rural
n_p_rural
## [1] 212.039

4.3 Calcula el valor de \(n \cdot q\)

q_rural <- 1 - p_rural
n_q_rural <- n_rural * q_rural
n_q_rural
## [1] 387.961

4.4 Decide si la variable puede distribuirse mediante una aproximación de distribución binomial a la distribución normal. Justifica

if (n_p_rural > 5 & n_q_rural > 5) {
  cat("Sí, se puede utilizar la aproximación normal. Tanto n*p como n*q son mayores que 5.
")
} else {
  cat("No se recomienda la aproximación normal porque n*p o n*q no son suficientemente grandes.
")
}
## Sí, se puede utilizar la aproximación normal. Tanto n*p como n*q son mayores que 5.

4.5 Probabilidades con aproximación normal

mu_rural <- n_p_rural
sigma_rural <- sqrt(n_rural * p_rural * q_rural)
mu_rural; sigma_rural
## [1] 212.039
## [1] 11.70917

4.5.1 ¿Cuál es la probabilidad aproximada de que más de 195 de ellos sean de área rural?

z_rural_1 <- (195.5 - mu_rural) / sigma_rural
prob_rural_mas_195 <- 1 - pnorm(z_rural_1)
prob_rural_mas_195
## [1] 0.9210963

4.5.2 ¿Cuál es la probabilidad aproximada de que máximo 210 sean de área rural?

z_rural_2 <- (210.5 - mu_rural) / sigma_rural
prob_rural_max_210 <- pnorm(z_rural_2)
prob_rural_max_210
## [1] 0.4477145

4.5.3 ¿Cuál es la probabilidad aproximada de que haya entre 180 y 250 de área rural?

z_rural_low <- (179.5 - mu_rural) / sigma_rural
z_rural_high <- (250.5 - mu_rural) / sigma_rural
prob_rural_entre <- pnorm(z_rural_high) - pnorm(z_rural_low)
prob_rural_entre
## [1] 0.9967626

5 5. Actividad 5

Crea una variable aleatoria con la variable “Comuna” que se distribuya a través de una aproximación de una binomial a normal y comprueba a través de los parámetros 𝑛 ∙ 𝑝 > 5 y 𝑛 ∙ 𝑞 > 5 .

Definimos la comuna objetivo IQUIQUE y verificamos la condición para aproximación binomial–normal.

5.1 Calcular la probabilidad de éxito (p)

comuna_objetivo <- "IQUIQUE"
p_comuna <- mean(data$COMUNA == comuna_objetivo, na.rm = TRUE)
p_comuna
## [1] 0.006449479

5.2 Tamaño de la muestra (n)

n_comuna <- nrow(data)
n_comuna
## [1] 6047

5.3 Cálculo de \(n \cdot p\) y \(n \cdot q\)

n_p_comuna <- n_comuna * p_comuna
n_q_comuna <- n_comuna * (1 - p_comuna)
n_p_comuna; n_q_comuna
## [1] 39
## [1] 6008

5.4 Verificación de aproximación binomial-normal

if (n_p_comuna > 5 & n_q_comuna > 5) {
  cat("Se puede aproximar la binomial a la normal para esta variable aleatoria.
")
} else {
  cat("No se recomienda la aproximación a la normal con esta variable aleatoria.
")
}
## Se puede aproximar la binomial a la normal para esta variable aleatoria.