Consigna
Conglomerado en 2 etapas:
Esta evaluación consiste en extraer una muestra por conglomerados a dos etapas, donde los conglomerados de primera etapa son los partidos y se seleccionan en la segunda etapa los efectores.
La cantidad de efectores esperada que se seleccionen es de 250.
Esperamos que estimen el promedio de prestaciones por efector y el total de prestaciones con un error de muestreo del 10% y construyan los IC del 95% .
Cargamos las librerias
library(tidyverse)
library(sampling)
library(samplingbook)
library(rstatix)
library(readxl)
library(openxlsx)
library(stratification)
library(VIM)
library(dplyr)
library(BAMMtools)
library(kableExtra)
library(knitr)
library(plyr)
Importamos la base de efectores de la provincia de Buenos Aires,
bdefector <- read_xlsx('CAPS_Provincia_de_Buenos_Aires.xlsx')
str(bdefector)
## tibble [1,112 x 7] (S3: tbl_df/tbl/data.frame)
## $ CUIE : chr [1:1112] "B00007" "B00008" "B00010" "B00011" ...
## $ CENTRO : chr [1:1112] "CENTRO DE SALUD RICARDO ROJAS" "CENTRO DE SALUD SAN FRANCISCO" "UNIDAD SANITARIA SAN RUDECINDO" "HOSPITAL OFTALMOLOGICO SAN FERNANDO DE LA BUENA VISTA COMPLEJO JOSE LUIS PERICOLI" ...
## $ LOCALIDAD : chr [1:1112] "FLORENCIO VARELA" "FLORENCIO VARELA" "FLORENCIO VARELA" "SAN FERNANDO" ...
## $ DEPARTAMENTO : chr [1:1112] "FLORENCIO VARELA" "FLORENCIO VARELA" "FLORENCIO VARELA" "SAN FERNANDO" ...
## $ PROVINCIA : chr [1:1112] "BA" "BA" "BA" "BA" ...
## $ Historias clinicas: num [1:1112] 156 120 30 6 180 48 12 90 6 36 ...
## $ Prestaciones : num [1:1112] 824 101 438 115 98 256 115 61 54 628 ...
Ordenamos la base de efectores en orden ascendente de prestaciones por efector. Generamos un obtjeto tabla de departamentos con la cantidad de efectores ordenada en ascendente.
bdefector <- bdefector[order(bdefector$Prestaciones),]
str(bdefector)
## tibble [1,112 x 7] (S3: tbl_df/tbl/data.frame)
## $ CUIE : chr [1:1112] "B12133" "B02371" "B90791" "B12085" ...
## $ CENTRO : chr [1:1112] "CIC JOSE LUIS MASSA" "UNIDAD SANITARIA BO INDEPENDENCIA" "CENTRO DE SALUD INTEGRAL SANDRA CABRERA" "CENTRO COMUNITARIO EVA PERON _ MAR DE AJO" ...
## $ LOCALIDAD : chr [1:1112] "RAUCH" "LOBERIA" "COUNTRY CLUB EL RODEO" "MAR DE AJO - SAN BERNARDO" ...
## $ DEPARTAMENTO : chr [1:1112] "RAUCH" "LOBERIA" "LA PLATA" "LA COSTA" ...
## $ PROVINCIA : chr [1:1112] "BA" "BA" "BA" "BA" ...
## $ Historias clinicas: num [1:1112] 6 12 54 6 12 6 6 30 114 12 ...
## $ Prestaciones : num [1:1112] 2 3 3 5 6 9 9 11 11 15 ...
tabla1 <- bdefector %>%
group_by(DEPARTAMENTO) %>%
dplyr::summarise( efectores = n()) %>%
arrange(desc(efectores))
head (tabla1)
## # A tibble: 6 x 2
## DEPARTAMENTO efectores
## <chr> <int>
## 1 LA MATANZA 46
## 2 LA PLATA 46
## 3 MORENO 38
## 4 MERLO 36
## 5 LOMAS DE ZAMORA 35
## 6 BERAZATEGUI 34
En el provincia de Buenos Aires existen según nuestra base de datos 123 municipios con 1112 efectores de salud.
tabla1%>%
dplyr::summarise(minimo=min(efectores),media=mean(efectores), mediana=median(efectores),maximo=max(efectores),)
## # A tibble: 1 x 4
## minimo media mediana maximo
## <int> <dbl> <int> <int>
## 1 1 9.04 4 46
Como podemos observar tenemos una rango importante en la cantidad de efectores por municipios.Tenemos una media de 9 efectores por municipio. Si la condición es obtener una muestra bietapica de 250 efectores, podemos pensar que 250/9=28 municipios. Este número sería la cantidad de unidades en la primera selección y 250 unidades en la segunda selección.
Entonces para nuestro diseño:
Unidad de muestreo de primer etapa: 123 Departamentos
Método de selección de primer etapa: Muestreo Sistemático (MS) = 28 Departamentos
Unidad de muestreo de segunda etapa: 112 Efectores de salud (M)
Método de selección de segunda etapa: Muestreo Aleatorio Simple (MAS) =250 efectores
En una primera etapa se seleccionará de a través del método de selección aleatorio sistemático los municipios que integrarán la muestra.Para ello vamos a unir la tabla 1 con la base de efectores.
bdefector <- left_join(bdefector, tabla1,
by = "DEPARTAMENTO") %>%
arrange(efectores)
head(bdefector)
## # A tibble: 6 x 8
## CUIE CENTRO LOCALIDAD DEPARTAMENTO PROVINCIA `Historias clin~ Prestaciones
## <chr> <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 B07964 HOSPITA~ FORTIN O~ RIVADAVIA BA 36 69
## 2 B02103 UNIDAD ~ MAXIMO P~ CANUELAS BA 18 73
## 3 B07841 HOSPITA~ PUAN PUAN BA 36 90
## 4 B08537 HOSPITA~ GENERAL ~ GENERAL LAV~ BA 48 101
## 5 B08693 HOSPITA~ TAPALQUE TAPALQUE BA 30 106
## 6 B08613 HOSPITA~ SAN CAYE~ SAN CAYETANO BA 36 113
## # ... with 1 more variable: efectores <int>
Por esa razón y para evitar que queden seleccionados los de menor o mayor número de efectores y que la muestra sea lo más precisa posible, es que ordenamos la variable efectores de forma descendente.