Solución del ejemplo 4.4 de Silva, Bianchini & Dias (2020)
Author
Rafael Borges, Escuela de Estadística, ULA, Mérida, Venezuela, borgesr@gmail.com
Se presenta la solución del ejemplo 4.4 de Silva, Bianchini & Dias (2020).
Ejemplo 4.4. Considere la población formada por municipios brasileños, como se muestra en el archivo ‘MunicBR_dat.rds’. Con esta población en mente, imagine que se usaría para seleccionar una muestra de un MAS de n=200 municipios. Imaginemos que dicha muestra se utilizara para estimar el promedio poblacional de la variable del área municipal.
Con esta perspectiva, utilice datos de población para:
Calcule la media poblacional.
Calcule la varianza, la desviación estándar y el coeficiente de variación del estimador habitual.
Evalúe el margen de error relativo que tendría la estimación con un nivel de confianza del 95%.
Determine el tamaño de muestra que se necesitaría para estimar la media del área con un error máximo de 150 km2 con un nivel de confianza del 95%.
Seleccione una muestra del MAS de tamaño n=200 y utilice los datos de muestra para calcular:
Una estimación de la media poblacional.
Estimaciones de varianza, desviación estándar y coeficiente de variación de la media estimada.
Estime el margen de error relativo que tendría la estimación obtenida en el ítem al nivel de confianza del 95%.
El tamaño de muestra que se requeriría para estimar la media del área con un error máximo de 150 km2 con un nivel de confianza del 95%.
Comparar las estimaciones obtenidas en el ítem 2 con los valores obtenidos en el ítem 1 y analizar/comentar.
Solución en R:
# Limpieza del área de trabajorm(list =ls())#Carga de los paquetes requeridoslibrary(sampling)
Warning: package 'sampling' was built under R version 4.4.3
# Lectura de losa datosMunicBR_dat <-readRDS(file="MunicBR_dat.rds")# Exploración de la estructura de los datosstr(MunicBR_dat)
Classes 'tbl_df', 'tbl' and 'data.frame': 5570 obs. of 6 variables:
$ CodMunic : chr "1100015" "1100023" "1100031" "1100049" ...
$ SiglaUF : chr "RO" "RO" "RO" "RO" ...
$ CodUF : chr "11" "11" "11" "11" ...
$ Pop : num 25728 101269 6495 85863 18041 ...
$ Area : num 7067 4427 1314 3793 2783 ...
$ Densidade: num 3.64 22.88 4.94 22.64 6.48 ...
# Punto 1# Tamaño de la población(N =nrow(MunicBR_dat))
[1] 5570
# Tamaño inicial de la muestra(n <-200)
[1] 200
# Soluçiones del punto 1# a. Média poplacional(med_pop <-mean(MunicBR_dat$Area))
[1] 1526.536
# b. Dispersión del estimador de la media en el MAS(VAR_med_amo <- ((1/n) - (1/N)) *var(MunicBR_dat$Area))
[1] 151683.3
(DP_med_amo <-sqrt(VAR_med_amo))
[1] 389.4654
(CV_med_amo <-100* DP_med_amo / med_pop)
[1] 25.51302
# c. Margen de error relativo del estimador de la média en el MAS(ME_med_amo <-qnorm(0.975)*CV_med_amo)
[1] 50.00461
# d. Tamaño de muestra para obtener unmargen de error de de 150 de nível 95%(D <-150)