Consigna

Conglomerado en 2 etapas:

Esta evaluación consiste en extraer una muestra por conglomerados a dos etapas, donde los conglomerados de primera etapa son los partidos y se seleccionan en la segunda etapa los efectores.

La cantidad de efectores esperada que se seleccionen es de 250.

Esperamos que estimen el promedio de prestaciones por efector y el total de prestaciones con un error de muestreo del 10% y construyan los IC del 95% .

Cargamos las librerias

library(tidyverse)
library(sampling)
library(samplingbook)
library(rstatix)
library(readxl)
library(openxlsx)
library(stratification)
library(VIM)
library(dplyr)
library(BAMMtools)
library(kableExtra)
library(knitr)
library(plyr)

Importamos la base de efectores de la provincia de Buenos Aires,

bdefector <- read_xlsx('CAPS_Provincia_de_Buenos_Aires.xlsx')

str(bdefector)
## tibble [1,112 x 7] (S3: tbl_df/tbl/data.frame)
##  $ CUIE              : chr [1:1112] "B00007" "B00008" "B00010" "B00011" ...
##  $ CENTRO            : chr [1:1112] "CENTRO DE SALUD RICARDO ROJAS" "CENTRO DE SALUD SAN FRANCISCO" "UNIDAD SANITARIA SAN RUDECINDO" "HOSPITAL OFTALMOLOGICO SAN FERNANDO DE LA BUENA VISTA COMPLEJO JOSE LUIS PERICOLI" ...
##  $ LOCALIDAD         : chr [1:1112] "FLORENCIO VARELA" "FLORENCIO VARELA" "FLORENCIO VARELA" "SAN FERNANDO" ...
##  $ DEPARTAMENTO      : chr [1:1112] "FLORENCIO VARELA" "FLORENCIO VARELA" "FLORENCIO VARELA" "SAN FERNANDO" ...
##  $ PROVINCIA         : chr [1:1112] "BA" "BA" "BA" "BA" ...
##  $ Historias clinicas: num [1:1112] 156 120 30 6 180 48 12 90 6 36 ...
##  $ Prestaciones      : num [1:1112] 824 101 438 115 98 256 115 61 54 628 ...

Ordenamos la base de efectores en orden ascendente de prestaciones por efector. Generamos un obtjeto tabla de departamentos con la cantidad de efectores ordenada en ascendente.

bdefector <- bdefector[order(bdefector$Prestaciones),]
str(bdefector)
## tibble [1,112 x 7] (S3: tbl_df/tbl/data.frame)
##  $ CUIE              : chr [1:1112] "B12133" "B02371" "B90791" "B12085" ...
##  $ CENTRO            : chr [1:1112] "CIC JOSE LUIS MASSA" "UNIDAD SANITARIA BO INDEPENDENCIA" "CENTRO DE SALUD INTEGRAL SANDRA CABRERA" "CENTRO COMUNITARIO EVA PERON _ MAR DE AJO" ...
##  $ LOCALIDAD         : chr [1:1112] "RAUCH" "LOBERIA" "COUNTRY CLUB EL RODEO" "MAR DE AJO - SAN BERNARDO" ...
##  $ DEPARTAMENTO      : chr [1:1112] "RAUCH" "LOBERIA" "LA PLATA" "LA COSTA" ...
##  $ PROVINCIA         : chr [1:1112] "BA" "BA" "BA" "BA" ...
##  $ Historias clinicas: num [1:1112] 6 12 54 6 12 6 6 30 114 12 ...
##  $ Prestaciones      : num [1:1112] 2 3 3 5 6 9 9 11 11 15 ...
tabla1 <- bdefector %>%  
  group_by(DEPARTAMENTO) %>%  
  dplyr::summarise( efectores = n()) %>%  
  arrange(desc(efectores))

head (tabla1)
## # A tibble: 6 x 2
##   DEPARTAMENTO    efectores
##   <chr>               <int>
## 1 LA MATANZA             46
## 2 LA PLATA               46
## 3 MORENO                 38
## 4 MERLO                  36
## 5 LOMAS DE ZAMORA        35
## 6 BERAZATEGUI            34

En el provincia de Buenos Aires existen según nuestra base de datos 123 municipios con 1112 efectores de salud.

tabla1%>%
dplyr::summarise(minimo=min(efectores),media=mean(efectores), mediana=median(efectores),maximo=max(efectores),)
## # A tibble: 1 x 4
##   minimo media mediana maximo
##    <int> <dbl>   <int>  <int>
## 1      1  9.04       4     46

Como podemos observar tenemos una rango importante en la cantidad de efectores por municipios.Tenemos una media de 9 efectores por municipio. Si la condición es obtener una muestra bietapica de 250 efectores, podemos pensar que 250/9=28 municipios. Este número sería la cantidad de unidades en la primera selección y 250 unidades en la segunda selección.

Entonces para nuestro diseño:

Unidad de muestreo de primer etapa: 123 Departamentos

Método de selección de primer etapa: Muestreo Sistemático (MS) = 28 Departamentos

Unidad de muestreo de segunda etapa: 112 Efectores de salud (M)

Método de selección de segunda etapa: Muestreo Aleatorio Simple (MAS) =250 efectores

En una primera etapa se seleccionará de a través del método de selección aleatorio sistemático los municipios que integrarán la muestra.Para ello vamos a unir la tabla 1 con la base de efectores.

bdefector <- left_join(bdefector, tabla1,
                           by = "DEPARTAMENTO") %>% 
                             arrange(efectores)
  head(bdefector)
## # A tibble: 6 x 8
##   CUIE   CENTRO   LOCALIDAD DEPARTAMENTO PROVINCIA `Historias clin~ Prestaciones
##   <chr>  <chr>    <chr>     <chr>        <chr>                <dbl>        <dbl>
## 1 B07964 HOSPITA~ FORTIN O~ RIVADAVIA    BA                      36           69
## 2 B02103 UNIDAD ~ MAXIMO P~ CANUELAS     BA                      18           73
## 3 B07841 HOSPITA~ PUAN      PUAN         BA                      36           90
## 4 B08537 HOSPITA~ GENERAL ~ GENERAL LAV~ BA                      48          101
## 5 B08693 HOSPITA~ TAPALQUE  TAPALQUE     BA                      30          106
## 6 B08613 HOSPITA~ SAN CAYE~ SAN CAYETANO BA                      36          113
## # ... with 1 more variable: efectores <int>

Por esa razón y para evitar que queden seleccionados los de menor o mayor número de efectores y que la muestra sea lo más precisa posible, es que ordenamos la variable efectores de forma descendente.