Fecha generado: septiembre 23, 2014.

Cálculos del Marco Muestral

Para realizar la Encuesta Nacional de Cultura se utilizará el archivo Tarea Marco Muestral Viviendas.sav. Se requiere una muestra con cobertura nacional de 1.200 hogares , asignados proporcionalmente a la zona del país (urbano y rural). Para seleccionarla, en cada estrato se usará PPT (en proporción al número de viviendas). La selección de segmentos o distritos dentro de los estratos debe hacerse con selección sistemática y también la de viviendas dentro de los segmentos. Se solicita lo siguiente:

Costa Rica:indicadores de hogares,según zona del país
Indicador Urbano Rural Total
Porcentaje de Carros 31.98 19.26 26.91
Porcentaje de Computadoras 19.38 5.94 14.03
Razón Hombres/Mujeres 0.95 1.05 0.99
Razón Personas/Dormitorio 1.50 1.69 1.57
Fuente:archivo Tarea Marco Muestral Viviendas,Curso Tópicos de Muestreo

Diseños muestrales

Diseño 1

  • Seleccione la muestra en dos etapas usando los segmentos censales como UPM y haciendo un sub-muestreo de 5 viviendas (b=5) en cada segmento censal seleccionado. Para ello, especifique el número de UPMs a seleccionar, el tamaño del conglomerado, obtenga la fórmula de selección del diseño y la fracción de muestreo (o probabilidad de selección). Con base en la muestra seleccionada estime, para todo el país y para cada zona, lo solicitado en el punto 1, agregando los errores estándar de las estimaciones, los intervalos de confianza, los coeficientes de variación y los efectos del diseño. Incluya la muestra seleccionada en el anexo del informe y confeccione un cuadro o gráfico en el que se compare la información obtenida en 1 con los resultados de esta muestra.
## Urbano  Rural 
##    145     95
## Urbano  Rural 
##    725    475
## Stratified 2 - level Cluster Sampling design
## With (240, 1200) clusters.
## svydesign(id = ~pcds + pcdsviv, data = sample, fpc = ~fpca + 
##     fpcb, strata = ~zona2, pps = "brewer")
## Probabilities:
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## 0.006489 0.006489 0.006553 0.006528 0.006553 0.006553 
## First-level Stratum Sizes: 
##            Urbano Rural
## obs           725   475
## design.PSU    145    95
## actual.PSU    145    95
## Population stratum sizes (PSUs): 
##   Rural  Urbano 
##  4880.0 11063.2 
## Data variables:
##  [1] "D_R"      "pcds"     "pcdsviv"  "pcdsvivh" "provinci" "canton"  
##  [7] "distrito" "segmento" "vivienda" "hogar"    "region"   "zona"    
## [13] "terr_ind" "tipo_hog" "blanco"   "v01"      "v02"      "v02_mens"
## [19] "v03"      "v04"      "v05"      "v06"      "v07a"     "v07b"    
## [25] "v07c"     "v08"      "v09"      "v10"      "v11"      "v12"     
## [31] "v13"      "v14"      "v15"      "v16a"     "v16b"     "v16c"    
## [37] "v16d"     "v16e"     "v16f"     "v16g"     "v16h"     "v16i"    
## [43] "hombres"  "mujeres"  "total"    "v23"      "v24"      "v25"     
## [49] "v26"      "v27"      "p00"      "zona2"    "pc"       "carro"   
## [55] "Mta"      "fpca"     "fpcb"     "fpc"
  • Fracción de muestreo:

\[ f= \frac{Mt_ \alpha}{\frac{\Sigma Mt_ \alpha}{a}}*\frac{b}{Mt_ \alpha}=\]

\[ f= \frac{Mt_ \alpha}{766}*\frac{5}{Mt_ \alpha}=\]

\[ f= \frac{5}{766}\]

Costa Rica:indicadores de hogares(Intervalo de confianza del 95%)
Indicador Estimación Límite Inferior Límite Superior Error estándar Efecto del Diseño Coeficiente de Variación
Porcentaje de Carros 26.29 23.01 29.58 1.67 1.75 0.06
Porcentaje de Computadoras 14.71 12.00 17.42 1.38 1.84 0.09
Razón Hombres/Mujeres 0.97 0.92 1.01 0.02 0.99 0.02
Razón Personas/Dormitorio 1.53 1.47 1.58 0.03 1.40 0.02
Fuente:archivo Tarea Marco Muestral Viviendas,Curso Tópicos de Muestreo
Costa Rica Zona Urbana:indicadores de hogares(Intervalo de confianza del 95%)
Indicador Estimación Límite Inferior Límite Superior Coeficiente de Variación
Porcentaje de Carros 32.97 28.11 37.82 0.08
Porcentaje de Computadoras 21.52 17.22 25.81 0.10
Razón Hombres/Mujeres 0.94 0.88 0.99 0.03
Razón Personas/Dormitorio 1.45 1.38 1.52 0.02
Fuente:archivo Tarea Marco Muestral Viviendas,Curso Tópicos de Muestreo
Costa Rica Zona Rural:indicadores de hogares(Intervalo de confianza del 95%)
Indicador Estimación Límite Inferior Límite Superior Coeficiente de Variación
Porcentaje de Carros 16.21 12.47 19.96 0.12
Porcentaje de Computadoras 4.42 2.38 6.46 0.24
Razón Hombres/Mujeres 1.01 0.93 1.09 0.04
Razón Personas/Dormitorio 1.66 1.57 1.75 0.03
Fuente:archivo Tarea Marco Muestral Viviendas,Curso Tópicos de Muestreo

plot of chunk Grafico resumen d1 Fuente:Información de la tarea 4, Tópicos de Muestreo.

Diseño 2

  • Seleccione la muestra de la siguiente manera. En la parte urbana del país utilice los segmentos censales como UPM y de cada uno de ellos haga un sub-muestreo de 5 viviendas. En la parte rural del país, para disminuir los costos, utilice los distritos como UPM y de cada distrito seleccionado (primera etapa) seleccione dos segmentos censales (segunda etapa), luego haga un sub-muestreo de 5 viviendas en cada uno de ellos (tercera etapa). Especifique para cada zona el número de UPMs a seleccionar, el número de segmentos en cada UPM y el tamaño del conglomerado final. Para cada zona obtenga la fórmula de selección y la fracción de muestreo (o probabilidad de selección). Con base en la muestra seleccionada estime, para todo el país y para cada zona, lo solicitado en el punto 1, agregando los errores estándar de las estimaciones, los intervalos de confianza, los coeficientes de variación y los efectos del diseño. Incluya la muestra seleccionada en el anexo del informe y confeccione un cuadro o gráfico en el que se compare la información obtenida en 1 con los resultados de esta muestra.
## Urbano  Rural 
##    725    480
## Stratified 3 - level Cluster Sampling design
## With (49, 241, 1205) clusters.
## svydesign(id = ~UPM + pcds + pcdsviv, data = muestraf, fpc = ~fpca + 
##     fpcb + fpcc, strata = ~zona2, pps = "brewer")
## Probabilities:
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## 0.006011 0.006553 0.006553 0.006553 0.006557 0.006557 
## First-level Stratum Sizes: 
##            Urbano Rural
## obs           725   480
## design.PSU      1    48
## actual.PSU      1    48
## Population stratum sizes (PSUs): 
##    Rural   Urbano 
## 180.7407   1.0000 
## Data variables:
##  [1] "D_R"      "pcds"     "pcdsviv"  "pcdsvivh" "provinci" "canton"  
##  [7] "distrito" "segmento" "vivienda" "hogar"    "region"   "zona"    
## [13] "terr_ind" "tipo_hog" "blanco"   "v01"      "v02"      "v02_mens"
## [19] "v03"      "v04"      "v05"      "v06"      "v07a"     "v07b"    
## [25] "v07c"     "v08"      "v09"      "v10"      "v11"      "v12"     
## [31] "v13"      "v14"      "v15"      "v16a"     "v16b"     "v16c"    
## [37] "v16d"     "v16e"     "v16f"     "v16g"     "v16h"     "v16i"    
## [43] "hombres"  "mujeres"  "total"    "v23"      "v24"      "v25"     
## [49] "v26"      "v27"      "p00"      "zona2"    "pc"       "carro"   
## [55] "UPM"      "Dta.x"    "Dta.y"    "fpca"     "Mta"      "fpcb"    
## [61] "fpcc"     "fpc"
  • Fracción de muestreo:

  • Zona urbana:

\[ f_u= \frac{Mt_ \alpha}{\frac{\Sigma Mt_ \alpha}{a}}*\frac{b}{Mt_ \alpha}=\]

\[ f_u= \frac{Mt_ \alpha}{766}*\frac{2}{Mt_ \alpha}=\]

\[ f_u= \frac{2}{766}\]

  • Zona Rural:

\[ f_r= \frac{Dt_ \alpha}{\frac{\Sigma Dt_ \alpha}{a}}*\frac{b*Mt_ \alpha}{Dt_ \alpha}*\frac{c}{Mt_ \alpha}=\]

\[ f_r= \frac{Dt_ \alpha}{1525}*\frac{b*Mt_ \alpha}{Dt_ \alpha}*\frac{5}{Mt_ \alpha}=\]

\[ f_r= \frac{10}{1525}\]

Costa Rica:indicadores de hogares(Intervalo de confianza del 95%)
Indicador Estimación Límite Inferior Límite Superior Error estándar Efecto del Diseño Coeficiente de Variación
Porcentaje de Carros 27.88 24.49 31.26 1.72 1.79 0.06
Porcentaje de Computadoras 15.60 12.82 18.38 1.42 1.85 0.09
Razón Hombres/Mujeres 0.97 0.93 1.02 0.02 1.05 0.02
Razón Personas/Dormitorio 1.56 1.50 1.62 0.03 1.49 0.02
Fuente:archivo Tarea Marco Muestral Viviendas,Curso Tópicos de Muestreo
Costa Rica Zona Urbana:indicadores de hogares(Intervalo de confianza del 95%)
Indicador Estimación Límite Inferior Límite Superior Coeficiente de Variación
Porcentaje de Carros 32.83 27.97 37.69 0.08
Porcentaje de Computadoras 21.52 17.19 25.85 0.10
Razón Hombres/Mujeres 0.95 0.89 1.01 0.03
Razón Personas/Dormitorio 1.45 1.39 1.52 0.02
Fuente:archivo Tarea Marco Muestral Viviendas,Curso Tópicos de Muestreo
Costa Rica Zona Rural:indicadores de hogares(Intervalo de confianza del 95%)
Indicador Estimación Límite Inferior Límite Superior Coeficiente de Variación
Porcentaje de Carros 20.40 16.14 24.66 0.11
Porcentaje de Computadoras 6.66 4.23 9.10 0.19
Razón Hombres/Mujeres 1.01 0.94 1.09 0.04
Razón Personas/Dormitorio 1.73 1.63 1.82 0.03
Fuente:archivo Tarea Marco Muestral Viviendas,Curso Tópicos de Muestreo

plot of chunk Grafico resumen d2 Fuente:Información de la tarea 4, Tópicos de Muestreo.

  • Cuál diseño es mejor?
    plot of chunk Grafico Compara Fuente:Información de la tarea 4, Tópicos de Muestreo.

  • El diseño 1 posee efectos del diseño más pequeños en todas las variables.De esta manera, estadísticamente el diseño 1 es mejor, no obstante en terminos prácticos el diseño 2 es más convenientes porque podría ahorrar costos.

Anexos

Acá se encuentra el archivo fuente para reproducir este documento

Muestra Diseño 1

Muestra Diseño 2