# install.packages("samplingbook") #Instalar la primera vez (remover el primer #)
library(samplingbook)
## Loading required package: pps
## Loading required package: sampling
## Loading required package: survey
## Loading required package: grid
## Loading required package: Matrix
## Loading required package: survival
## 
## Attaching package: 'survival'
## The following objects are masked from 'package:sampling':
## 
##     cluster, strata
## 
## Attaching package: 'survey'
## The following object is masked from 'package:graphics':
## 
##     dotchart
#install.packages("readxl") #Instalar la primera vez (remover el primer #)
library(readxl)
#install.packages("dplyr") #Instalar la primera vez (remover el primer #)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Imagine que usted es un observador de derechos humanos y necesita investigar el nivel de cumplimiento de los estándares de derechos humanos al interior de los recintos de detención existentes en las comisarías de Carabineros de Chile. Sin embargo, no hay recursos ni tiempo disponibles para visitar todas y cada una de las instalaciones, por lo que se le pide diseñar una muestra estadísticamente representativa.

Paso 1: identificar fórmula

Se calculará una muestra para estimar proporciones.

\(n = \frac{\frac{N}{N-1}\cdot pq}{\frac{e^2}{Z^{2}_{\alpha/2}}+\frac{pq}{N-1}}\)

Paso 2: identificar información necesaria para calcular \(n\)

El marco muestral corresponde a un listado de comisarías de Carabineros de Chile.

marco.muestral <- read_xls("/home/daniel/Dropbox/U CENTRAL/02 2020/01 Primer semestre 2020/Analisis de datos cuantitativos I/Clases/03/comisarias.xls")
N <- nrow(marco.muestral) #Contar cantidad de filas (casos en el marco muestral)
N #207 comisarías
## [1] 207
pq <- 0.25 #varianza máxima pq =0.25
e1 <- 0.01 #error máximo admisible de 1%
e3 <- 0.03 #error máximo admisible de 3%
e5 <- 0.05 #error máximo admisible de 5%
alpha95 <- 1.96 #coeficiente de confianza asociado al un nivel de confianza del 95%
alpha99 <- 2.58 #coeficiente de confianza asociado al un nivel de confianza del 99%

Paso 3: reemplazar valores en la fórmula

Primero, se calcula la muestra con un error máximo admisible de 0.01 y nivel de confianza del 95%:

\(n = \frac{\frac{207}{207-1}\cdot 0.25}{\frac{0.01^2}{1.96^2}+\frac{0.25}{207-1}}\)

#Aplicación directa de la fórmula, paso por paso.
numerador <- (N/(N-1))*pq
denominador <- ((e1^2)/(alpha95^2))+(pq/(N-1))
tamaño1 <- numerador/denominador
tamaño1 <- round(tamaño1,0) #redondear sin decimales
tamaño1
## [1] 203
#Método alternativo, usando paquete samplingbook.
sample.size.prop(e= 0.01, P= 0.5,N= 207, level= 0.95) # error máximo admisible, proporción de p (asumiendo varianza máxima es 0.5), tamaño de la población y nivel de confianza
## 
## sample.size.prop object: Sample size for proportion estimate
## With finite population correction: N=207, precision e=0.01 and expected proportion P=0.5
## 
## Sample size needed: 203

Se calcula la muestra con un error máximo admisible de 0.03 y nivel de confianza del 95%.

\(n = \frac{\frac{207}{207-1}\cdot 0.25}{\frac{0.03^2}{1.96²}+\frac{0.25}{207-1}}\)

#Aplicación directa de la fórmula, paso por paso.
numerador <- (N/(N-1))*pq
denominador <- ((e3^2)/(alpha95^2))+(pq/(N-1))
tamaño2 <- numerador/denominador
tamaño2 <- round(tamaño2,0) #redondear sin decimales
tamaño2
## [1] 174
sample.size.prop(e= 0.03, P= 0.5,N= 207, level= 0.95) # error máximo admisible, proporción de p (asumiendo varianza máxima es 0.5), tamaño de la población y nivel de confianza
## 
## sample.size.prop object: Sample size for proportion estimate
## With finite population correction: N=207, precision e=0.03 and expected proportion P=0.5
## 
## Sample size needed: 174

Se calcula la muestra con un error máximo admisible de 0.05 y un nivel de confianza del 95%.

\(n = \frac{\frac{207}{207-1}\cdot 0.25}{\frac{0.05^2}{1.96^2}+\frac{0.25}{207-1}}\)

#Aplicación directa de la fórmula, paso por paso.
numerador <- (N/(N-1))*pq
denominador <- ((e5^2)/(alpha95^2))+(pq/(N-1))
tamaño3 <- numerador/denominador
tamaño3 <- round(tamaño3,0) #redondear sin decimales
tamaño3
## [1] 135
sample.size.prop(e= 0.05, P= 0.5,N= 207, level= 0.95) # error máximo admisible, proporción de p (asumiendo varianza máxima es 0.5), tamaño de la población y nivel de confianza
## 
## sample.size.prop object: Sample size for proportion estimate
## With finite population correction: N=207, precision e=0.05 and expected proportion P=0.5
## 
## Sample size needed: 135

Luego, se calcula la muestra con un error máximo admisible de 0.01 y nivel de confianza del 99%:

\(n = \frac{\frac{207}{207-1}\cdot 0.25}{\frac{0.01^2}{2.58^2}+\frac{0.25}{207-1}}\)

#Aplicación directa de la fórmula, paso por paso.
numerador <- (N/(N-1))*pq
denominador <- ((e1^2)/(alpha99^2))+(pq/(N-1))
tamaño4 <- numerador/denominador
tamaño4 <- round(tamaño4,0) #redondear sin decimales
tamaño4
## [1] 204
#Método alternativo, usando paquete samplingbook.
sample.size.prop(e= 0.01, P= 0.5,N= 207, level= 0.99) # error máximo admisible, proporción de p (asumiendo varianza máxima es 0.5), tamaño de la población y nivel de confianza
## 
## sample.size.prop object: Sample size for proportion estimate
## With finite population correction: N=207, precision e=0.01 and expected proportion P=0.5
## 
## Sample size needed: 205

Se calcula la muestra con un error máximo admisible de 0.03 y nivel de confianza del 99%.

\(n = \frac{\frac{207}{207-1}\cdot 0.25}{\frac{0.03^2}{2.58^2}+\frac{0.25}{207-1}}\)

#Aplicación directa de la fórmula, paso por paso.
numerador <- (N/(N-1))*pq
denominador <- ((e3^2)/(alpha99^2))+(pq/(N-1))
tamaño5 <- numerador/denominador
tamaño5 <- round(tamaño5,0) #redondear sin decimales
tamaño5
## [1] 186
sample.size.prop(e= 0.03, P= 0.5,N= 207, level= 0.99) # error máximo admisible, proporción de p (asumiendo varianza máxima es 0.5), tamaño de la población y nivel de confianza
## 
## sample.size.prop object: Sample size for proportion estimate
## With finite population correction: N=207, precision e=0.03 and expected proportion P=0.5
## 
## Sample size needed: 187

Se calcula la muestra con un error máximo admisible de 0.05 y un nivel de confianza del 99%.

\(n = \frac{\frac{207}{207-1}\cdot 0.25}{\frac{0.05^2}{2.58^2}+\frac{0.25}{207-1}}\)

#Aplicación directa de la fórmula, paso por paso.
numerador <- (N/(N-1))*pq
denominador <- ((e5^2)/(alpha99^2))+(pq/(N-1))
tamaño6 <- numerador/denominador
tamaño6 <- round(tamaño6,0) #redondear sin decimales
tamaño6
## [1] 158
sample.size.prop(e= 0.05, P= 0.5,N= 207, level= 0.99) # error máximo admisible, proporción de p (asumiendo varianza máxima es 0.5), tamaño de la población y nivel de confianza
## 
## sample.size.prop object: Sample size for proportion estimate
## With finite population correction: N=207, precision e=0.05 and expected proportion P=0.5
## 
## Sample size needed: 158

Paso 4: decidir con qué n trabajar

Un factor que normalmente debemos considerar para decidir el tamaño de muestra a realizar es el presupuesto.Supongamos que en este caso tenemos la posibilidad de gastar como máximo $20,000,000 en el levantamiento de los datos.

Sabemos que una observación en terreno requiere pagar un honorario de $75,000 por visita realizada y destinar otros $50,000 por concepto de viáticos (traslado, alimentación y/o alojamiento). Entonces, cada visita tiene un costo total de $125,000.

costo1 <- tamaño1*125000
costo1
## [1] 25375000
costo2 <- tamaño2*125000
costo2
## [1] 21750000
costo3 <- tamaño3*125000
costo3
## [1] 16875000
costo4 <- tamaño4*125000
costo4
## [1] 25500000
costo5 <- tamaño5*125000
costo5
## [1] 23250000
costo6 <- tamaño6*125000
costo6
## [1] 19750000

Así, dado el presupuesto disponible se debe decidir entre trabajar con la muestra de \(n = 135\) o \(n = 158\). Considerando que es una buena práctica destinar parte del presupuesto destinado al levantamiento de datos o trabajo de campo para posibles imprevistos, se decide trabajar con una muestra calculada con un 95% de confianza y un 5% de error máximo admisible (\(n = 135\)).

Paso 5: selección aleatoria

Se seleccionan aleatoriamente 135 de los 207 casos que conforman el marco muestral.

set.seed(12345) #semilla aleatoria para que el siguiente paso sea reproducible
muestra <- sample_n(marco.muestral,135) #selección aleatoria
muestra$Comisarías #Para ver el listado de comisarías seleccionadas
##   [1] "2° Comisaría Concepción"              
##   [2] "20° Comisaría Puente Alto"            
##   [3] "1° Comisaría Los Ángeles"             
##   [4] "29° Comisaría de Fuerzas Especiales"  
##   [5] "3° Comisaría Los Andes"               
##   [6] "2° Comisaría Antofagasta"             
##   [7] "5° Comisaría Viña del Mar"            
##   [8] "2° Comisaría Santiago"                
##   [9] "2° Comisaría Coquimbo"                
##  [10] "3° Comisaría Chile Chico"             
##  [11] "47° Comisaría Los Domínicos"          
##  [12] "2° Comisaría Quilpué"                 
##  [13] "1° Comisaría Viña del Mar"            
##  [14] "9° Comisaría Independencia"           
##  [15] "4° Comisaría Hualpén"                 
##  [16] "10° Comisaría La Cisterna"            
##  [17] "2° Comisaría Temuco"                  
##  [18] "4° Comisaría Chaitén"                 
##  [19] "18° Comisaría Ñuñoa"                  
##  [20] "1° Comisaría Santiago"                
##  [21] "2° Comisaría Pozo Almonte"            
##  [22] "54° Comisaría Huechuraba"             
##  [23] "3° Comisaría Santiago"                
##  [24] "3° Comisaría Bulnes"                  
##  [25] "11° Comisaría Lo Espejo"              
##  [26] "1° Comisaría Concepción"              
##  [27] "1° Comisaría Arauco"                  
##  [28] "6° Comisaría Villa Alemana"           
##  [29] "1° Comisaría San Fernando"            
##  [30] "34° Comisaría Vista Alegre"           
##  [31] "2° Comisaría San Pedro de Atacama"    
##  [32] "32° Comisaría Tránsito"               
##  [33] "2° Comisaría Valparaíso Central"      
##  [34] "2° Comisaría Licantén"                
##  [35] "30° Comisaría R.P. e Interv. Policial"
##  [36] "4° Comisaría Quillota"                
##  [37] "33° Comisaría Ñuñoa"                  
##  [38] "26° Comisaría Pudahuel"               
##  [39] "17° Comisaría Las Condes"             
##  [40] "1° Comisaría Lautaro"                 
##  [41] "1° Comisaría Osorno"                  
##  [42] "4° Comisaría Cauquenes"               
##  [43] "5° Comisaría de FF EE Concepción"     
##  [44] "2° Comisaría Constitución"            
##  [45] "5° Comisaría Curacautín"              
##  [46] "1° Comisaría Punta Arenas (U)"        
##  [47] "2° Comisaría Los Lagos"               
##  [48] "59° Comisaría Lampa"                  
##  [49] "1° Comisaría Arica"                   
##  [50] "1° Comisaría Taltal"                  
##  [51] "66° Comisaría Bajos de Mena"          
##  [52] "7° Comisaría La Calera"               
##  [53] "3° Comisaría Pichilemu"               
##  [54] "1° Comisaría La Ligua"                
##  [55] "4° Comisaría Rengo"                   
##  [56] "46° Comisaría Macul"                  
##  [57] "2° Comisaría Cartagena"               
##  [58] "65° Comisaría Pirque"                 
##  [59] "7° Comisaría Renca"                   
##  [60] "4° Comisaría Concón"                  
##  [61] "1° Comisaría San Carlos"              
##  [62] "3° Comisaría Lota"                    
##  [63] "50° Comisaría San Joaquín"            
##  [64] "6° Comisaría Chillán Viejo S.U."      
##  [65] "4° Comisaría Illapel"                 
##  [66] "3° Comisaría Teno"                    
##  [67] "3° Comisaría Valparaíso Norte"        
##  [68] "21° Comisaría Estación Central"       
##  [69] "5° Comisaría Yumbel"                  
##  [70] "2° Comisaría Putre"                   
##  [71] "4° Comisaría Santa Bárbara"           
##  [72] "49° Comisaría Quilicura"              
##  [73] "64° Comisaría Paine"                  
##  [74] "3° Comisaría Penco"                   
##  [75] "2° Comisaría Talcahuano"              
##  [76] "25° Comisaría Maipú"                  
##  [77] "5° Comisaría Conchalí"                
##  [78] "13° Comisaría La Granja"              
##  [79] "6° Comisaría San Pedro de la Paz"     
##  [80] "3° Comisaría Cañete"                  
##  [81] "4° Comisaría Santiago"                
##  [82] "2° Comisaría San Felipe"              
##  [83] "1° Comisaría Angol"                   
##  [84] "4° Comisaría Victoria"                
##  [85] "4° Comisaría Curanilahue"             
##  [86] "5° Comisaría Pitrufquén"              
##  [87] "28° Comisaría de Fuerzas Especiales"  
##  [88] "2° Comisaría Copiapó"                 
##  [89] "4° Comisaría Molina"                  
##  [90] "48° Comisaría Familia e Infancia"     
##  [91] "1° Comisaría San Clemente"            
##  [92] "15° Comisaría Buin"                   
##  [93] "3° Comisaría Alto Hospicio"           
##  [94] "6° Comisaría Quellón"                 
##  [95] "3° Comisaría Talca"                   
##  [96] "51° Comisaría Pedro Aguirre Cerda"    
##  [97] "2° Comisaría Río Negro"               
##  [98] "52° Comisaría Rinconada de Maipú"     
##  [99] "3° Comisaría Arica"                   
## [100] "3° Comisaría Padre Las Casas"         
## [101] "2° Comisaría Chanco"                  
## [102] "3° Comisaría La Unión"                
## [103] "1° Comisaría San Antonio"             
## [104] "24° Comisaría Melipilla"              
## [105] "3° Comisaría Osorno"                  
## [106] "1° Comisaría FFEE Temuco"             
## [107] "4° Comisaría Yungay"                  
## [108] "16° Comisaría La Reina"               
## [109] "58° Comisaría Población Alessandri"   
## [110] "2° Comisaría Lebu"                    
## [111] "6° Comisaría Isla de Pascua (F)"      
## [112] "40° Comisaría de Fuerzas Especiales"  
## [113] "3° Comisaría Maullín"                 
## [114] "62° Comisaría San Bernardo"           
## [115] "19° Comisaría Providencia"            
## [116] "8° Comisaría Temuco"                  
## [117] "2° Comisaría Mulchén"                 
## [118] "5° Comisaría Peumo"                   
## [119] "45° Comisaría Cerro Navia"            
## [120] "3° Comisaría Antofagasta"             
## [121] "6° Comisaría Recoleta"                
## [122] "5° Comisaría La Portada Antofagasta"  
## [123] "3° Comisaría Algarrobo"               
## [124] "3° Comisaría Limache"                 
## [125] "56° Comisaría Peñaflor"               
## [126] "14° Comisaría San Bernardo"           
## [127] "4° Comisaría Tocopilla"               
## [128] "2° Comisaría Chillán"                 
## [129] "3° Comisaría Porvenir"                
## [130] "1° Comisaría Iquique"                 
## [131] "39° Comisaría El Bosque"              
## [132] "22° Comisaría Quinta Normal"          
## [133] "57° Comisaría Motorizada"             
## [134] "2° Comisaría FFEE Pailahueque"        
## [135] "1° Comisaría Puerto Varas"