Las librerias

library(readr) # Leer datos
library(knitr) # Tablas amigables
library(fdth) # Crear tablas de distribucion
library(dplyr) # Select, filter, mutate, group

Cargar datos

La variable datos es una población Se requiere una muestra que es una parte proporcional y que representa a la población

datos <- read.csv("../Datos/personas.csv")
kable(head(datos))
X nombre paterno materno genero edad entidad
1 ALFONSO ALBERTO Y ALONZO TEXON M 48 Puebla
2 ANGEL ARMANDO TEPATO VEYNA M 49 Chihuahua
3 J. MATILDE ZAMORANO MADUEÑO M 28 Aguascalientes
4 OSCAR GABRIEL MACEGOZA GERMES M 40 Zacatecas
5 PEDRO ROBERTO ARELLANES GURRION M 31 Colima
6 ISRAEL ANTONIO BUENAVENTURA PALOMO M 42 Colima
kable(tail(datos))
X nombre paterno materno genero edad entidad
9995 9995 GLORIA DE LOS ANGELES TORREJON FERRARA F 52 Chiapas
9996 9996 MARIA CONCEPCIO PEÐALOZA CORIA F 56 Quintana Roo
9997 9997 EUDELIA SANDRA ALTUZAR F 43 Chiapas
9998 9998 LETICIA MAGDALENA TAGLE RIESTRA F 58 México
9999 9999 MARTHA SOCORRO LULE RODRÍGUEZ F 55 Quintana Roo
10000 10000 FRANCISCA GUADALUPE DE LA PARRA SANMARTIN F 57 Querétaro

Estadisticos descriptivos

summary(datos)
##        X            nombre            paterno            materno         
##  Min.   :    1   Length:10000       Length:10000       Length:10000      
##  1st Qu.: 2501   Class :character   Class :character   Class :character  
##  Median : 5000   Mode  :character   Mode  :character   Mode  :character  
##  Mean   : 5000                                                           
##  3rd Qu.: 7500                                                           
##  Max.   :10000                                                           
##     genero               edad         entidad         
##  Length:10000       Min.   :18.00   Length:10000      
##  Class :character   1st Qu.:28.00   Class :character  
##  Mode  :character   Median :39.00   Mode  :character  
##                     Mean   :38.99                     
##                     3rd Qu.:50.00                     
##                     Max.   :60.00

Valor N cantidad de registros de la pobación

N <- nrow(datos) # Cantidad de datos

Muestreo aleatorio simple

set.seed(2020)

# Primero
N <- nrow(datos) # La población
n <- 15          # La muestra


muestra <- sample(1:N, n, replace = FALSE)
muestra
##  [1] 9628 9452 7767 8920 4417 8465 9380  170 7878  945 4992 2602 3062 1053 5104
muestra.Simple <- datos[muestra, ]
muestra.Simple
##         X           nombre   paterno    materno genero edad             entidad
## 9628 9628  HAYDE GUADALUPE  MOGOLLAN     FAVILA      F   45            Guerrero
## 9452 9452    ISABEL CRISTI     LINAS    ESTEVES      F   35    Ciudad de México
## 7767 7767        MARIA SOC       XIU    ROBLERO      F   55              Sonora
## 8920 8920   CYNTHIA JUDITH   COLESIO    ARTIGAS      F   33            Guerrero
## 4417 4417        ALEXANDRO   MELCHOR  FELIPILLO      M   41              Oaxaca
## 8465 8465       ALMA JANET EUSTAQUIO    AGUILUZ      F   48             Tabasco
## 9380 9380      DIANA ROCIO       QUI    ZERMENO      F   37           Chihuahua
## 170   170           HERBEY   ESCUTIA REMENTERIA      M   60             Jalisco
## 7878 7878     MARIA AGUEDA  TEPANCAL    TOSTADO      F   57           Zacatecas
## 945   945    ALBERTO JESUS   FLOREAN    CAZARIN      M   22             Durango
## 4992 4992            NEYVI    MARURE   PORTILLO      F   31             Hidalgo
## 2602 2602 FRANCISCO JULIAN  OLIVARES    PLOMOSO      M   50 Michoacán de Ocampo
## 3062 3062          JOSE DE     LUJAN   MANRIQUE      M   52 Baja California Sur
## 1053 1053           FERNEL   Y CANUL      CANAS      M   27             Yucatán
## 5104 5104          YESENIA   AZCORRA    BERMEJO      F   44      Aguascalientes
# Segundo
n <- 625
muestra <- sample(N, n, replace = FALSE)
# Ya no visualizamos muestra, ... son muchos ...
muestra.Simple <- datos[muestra, ]

# Mostramos los primeros y los últimos registros
kable(head(muestra.Simple,10))
X nombre paterno materno genero edad entidad
4483 4483 BULFRANO CHARCO EPITACIO M 21 Baja California
8797 8797 ROCIO BEATRIZ CANSECO ARANZA F 21 Sonora
6888 6888 LOIDA VANEGAS ISORDIA F 20 Sonora
3662 3662 JESUS HERIBERTO ARCURI OLIDEN M 23 San Luis Potosí
4684 4684 EDGAR AUGUSTO CHINCHILLAS CLARO M 44 Campeche
78 78 JOSE GONZALO RICARDO MAGDALENO M 19 México
7687 7687 MINERVA EDITH ZEFERINO VITAL F 47 Colima
724 724 JESUS ORLANDO PATINO ORDU!A M 45 Guanajuato
1524 1524 LUCIO ARTURO GURRUSQUIETA CARPINTEYRO M 42 Nuevo León
7468 7468 MAYRA CAROLINA NADAL SANCEN F 53 Baja California
kable(tail(muestra.Simple,10))
X nombre paterno materno genero edad entidad
797 797 FRANCISCO MANUEL BEAR VALLESTEROS M 35 Veracruz de Ignacio de la Llave
5609 5609 ESTANISLADA BADAL CHAPULA F 49 Sinaloa
8295 8295 LOURDES NOEMI CANCELA ASTELLO F 59 Jalisco
2911 2911 ERIK DE JESUS LIVAS GANZO M 26 Nuevo León
5517 5517 ROCIO BALMACEDA BUENAVENTURA F 52 Hidalgo
4600 4600 GUSTAVO ENRIQUE HUITZIL COCOLETZI M 54 Durango
2085 2085 PEDRO PASCUAL TOVIAS PERALTA M 47 Nuevo León
4365 4365 GERARDO ANTONIO DIONICIO MIRANDA M 57 Querétaro
1228 1228 JORGE ERIK GOCHEZ URIEGAS M 36 Guerrero
8302 8302 GINA LEA%OS CANIZAL F 38 Veracruz de Ignacio de la Llave

Muestreo aleatorio sistematizado

set.seed(2020)

# Primero
muestra <- seq(from = 5, to = 100, by = 7)
muestra
##  [1]  5 12 19 26 33 40 47 54 61 68 75 82 89 96
muestra.Simple <- datos[muestra, ]
muestra.Simple
##     X         nombre   paterno    materno genero edad
## 5   5  PEDRO ROBERTO ARELLANES    GURRION      M   31
## 12 12        QUINTIN   VICARIO    CANSECO      M   58
## 19 19        RUBICEL     CALAM  GOYCOCHEA      M   43
## 26 26  JESUS ARNULFO   ELGUERA VILLADOBLE      M   46
## 33 33     JESUS MANU   DE ANDA      TAMAY      M   46
## 40 40 SERGIO EDUARDO    CATANO     LLANOS      M   57
## 47 47   JOSE BARTOLO   PENILLA        COY      M   18
## 54 54   LUIS ENRIQUE FLORENCIA   PERFECTO      M   54
## 61 61 ANTONIO CARLOS   CEBRIAN DEL CARMEN      M   47
## 68 68        ISIDORO  QUIRARTE     ARRUEL      M   49
## 75 75 DAVID SALVADOR  HELGUERA    ATRISCO      M   48
## 82 82     EDGAR JOEL    DE PAZ  FRANYUTTI      M   37
## 89 89      DESIDERIO BARTOLOME AZPILCUETA      M   41
## 96 96         J. LUZ     BERRA    CERECER      M   50
##                            entidad
## 5                           Colima
## 12                 San Luis Potosí
## 19 Veracruz de Ignacio de la Llave
## 26                       Querétaro
## 33             Baja California Sur
## 40             Michoacán de Ocampo
## 47                 Baja California
## 54                       Zacatecas
## 61                       Chihuahua
## 68            Coahuila de Zaragoza
## 75                         Nayarit
## 82                         Chiapas
## 89                        Campeche
## 96                         Yucatán
# Segundo
muestra <- seq(from = 37, to = N, by = 60)
# Ya no visualizamos muestra, son muchos ... ...


poblacion <- datos # Sinónimo

muestra.Sistematizada <- datos[muestra, ] # [Filas, Columas]

# Mostramos los primeros y los últimos registros
kable(head(muestra.Sistematizada,10))
X nombre paterno materno genero edad entidad
37 37 RAUL ROBERTO TIERRA RAMÍREZ M 51 Colima
97 97 ANICETO AZNAR GERONIMO M 29 Sonora
157 157 MARIO GILBERTO MONTES DE OCA SOUZA M 45 Nuevo León
217 217 CARLOS MIGUEL NOVELO AVENDAÏ¿½O M 38 Tlaxcala
277 277 MARCOS JOSE CITAL LLERENA M 33 Chiapas
337 337 ISRAEL PASILLAS PE!ALOZA M 49 Puebla
397 397 FRANCISCO AARON TEXIS LAZALDE M 41 Chihuahua
457 457 GUSTAVO DE JESUS PAREDEZ MIGUELES M 31 Baja California Sur
517 517 HAMLET TEXIS DE ELIGIO M 52 Aguascalientes
577 577 JOSE FRANCISCO ZI LESCIEUR M 32 Oaxaca
kable(tail(muestra.Sistematizada,10))
X nombre paterno materno genero edad entidad
9457 9457 MARTA OLIVIA GERVASIO CAYETANO F 25 Guanajuato
9517 9517 IRASEMA AGAPITO RONDERO F 18 Aguascalientes
9577 9577 BENIGNA VITALES BON F 38 Tlaxcala
9637 9637 ROSA LILA HUIPE SUSUNAGA F 39 Yucatán
9697 9697 LUCIA MARIBEL TUZ GUITRON F 50 Chihuahua
9757 9757 REYNA DEL CARMEN VALENCIANA ALCAUTER F 25 Quintana Roo
9817 9817 PALOMA SANZON PALEMONTE F 32 Veracruz de Ignacio de la Llave
9877 9877 LAURA DANIELA BALMES BREÑA F 54 Baja California
9937 9937 CLAUDIA IBET MUÐOZ ARAGONEZ F 29 Veracruz de Ignacio de la Llave
9997 9997 EUDELIA SANDRA ALTUZAR F 43 Chiapas

Muestreo Aleatorio Estratificado

tabla.frecuencias <- data.frame(fdt_cat(x = datos$entidad))
tabla.frecuencias  # Sin ordenar por entidad, pero están ordendas por frecuencia f
##                           Category   f     rf rf...    cf  cf...
## 1                           Sonora 342 0.0342  3.42   342   3.42
## 2                           México 333 0.0333  3.33   675   6.75
## 3                     Quintana Roo 333 0.0333  3.33  1008  10.08
## 4                          Chiapas 332 0.0332  3.32  1340  13.40
## 5                  Baja California 331 0.0331  3.31  1671  16.71
## 6                          Jalisco 330 0.0330  3.30  2001  20.01
## 7                 Ciudad de México 328 0.0328  3.28  2329  23.29
## 8              Baja California Sur 327 0.0327  3.27  2656  26.56
## 9                        Zacatecas 326 0.0326  3.26  2982  29.82
## 10                      Nuevo León 325 0.0325  3.25  3307  33.07
## 11                         Sinaloa 325 0.0325  3.25  3632  36.32
## 12                          Oaxaca 323 0.0323  3.23  3955  39.55
## 13                      Guanajuato 319 0.0319  3.19  4274  42.74
## 14                       Querétaro 319 0.0319  3.19  4593  45.93
## 15                         Durango 318 0.0318  3.18  4911  49.11
## 16                        Campeche 317 0.0317  3.17  5228  52.28
## 17                       Chihuahua 314 0.0314  3.14  5542  55.42
## 18                      Tamaulipas 312 0.0312  3.12  5854  58.54
## 19                  Aguascalientes 311 0.0311  3.11  6165  61.65
## 20                         Morelos 311 0.0311  3.11  6476  64.76
## 21                        Tlaxcala 307 0.0307  3.07  6783  67.83
## 22                         Hidalgo 306 0.0306  3.06  7089  70.89
## 23            Coahuila de Zaragoza 303 0.0303  3.03  7392  73.92
## 24                        Guerrero 303 0.0303  3.03  7695  76.95
## 25             Michoacán de Ocampo 300 0.0300  3.00  7995  79.95
## 26                         Nayarit 299 0.0299  2.99  8294  82.94
## 27                         Yucatán 295 0.0295  2.95  8589  85.89
## 28                          Puebla 292 0.0292  2.92  8881  88.81
## 29                          Colima 290 0.0290  2.90  9171  91.71
## 30                 San Luis Potosí 282 0.0282  2.82  9453  94.53
## 31 Veracruz de Ignacio de la Llave 281 0.0281  2.81  9734  97.34
## 32                         Tabasco 266 0.0266  2.66 10000 100.00
colnames(tabla.frecuencias)  <- c("categoria", "frec", "frec.rel", "frec.porc", "frec.acum", "frec.rel.acum") # Los nombres de las columnas

tabla.frecuencias # Ya están ordenadas por categoria, es decir por entidad
##                          categoria frec frec.rel frec.porc frec.acum
## 1                           Sonora  342   0.0342      3.42       342
## 2                           México  333   0.0333      3.33       675
## 3                     Quintana Roo  333   0.0333      3.33      1008
## 4                          Chiapas  332   0.0332      3.32      1340
## 5                  Baja California  331   0.0331      3.31      1671
## 6                          Jalisco  330   0.0330      3.30      2001
## 7                 Ciudad de México  328   0.0328      3.28      2329
## 8              Baja California Sur  327   0.0327      3.27      2656
## 9                        Zacatecas  326   0.0326      3.26      2982
## 10                      Nuevo León  325   0.0325      3.25      3307
## 11                         Sinaloa  325   0.0325      3.25      3632
## 12                          Oaxaca  323   0.0323      3.23      3955
## 13                      Guanajuato  319   0.0319      3.19      4274
## 14                       Querétaro  319   0.0319      3.19      4593
## 15                         Durango  318   0.0318      3.18      4911
## 16                        Campeche  317   0.0317      3.17      5228
## 17                       Chihuahua  314   0.0314      3.14      5542
## 18                      Tamaulipas  312   0.0312      3.12      5854
## 19                  Aguascalientes  311   0.0311      3.11      6165
## 20                         Morelos  311   0.0311      3.11      6476
## 21                        Tlaxcala  307   0.0307      3.07      6783
## 22                         Hidalgo  306   0.0306      3.06      7089
## 23            Coahuila de Zaragoza  303   0.0303      3.03      7392
## 24                        Guerrero  303   0.0303      3.03      7695
## 25             Michoacán de Ocampo  300   0.0300      3.00      7995
## 26                         Nayarit  299   0.0299      2.99      8294
## 27                         Yucatán  295   0.0295      2.95      8589
## 28                          Puebla  292   0.0292      2.92      8881
## 29                          Colima  290   0.0290      2.90      9171
## 30                 San Luis Potosí  282   0.0282      2.82      9453
## 31 Veracruz de Ignacio de la Llave  281   0.0281      2.81      9734
## 32                         Tabasco  266   0.0266      2.66     10000
##    frec.rel.acum
## 1           3.42
## 2           6.75
## 3          10.08
## 4          13.40
## 5          16.71
## 6          20.01
## 7          23.29
## 8          26.56
## 9          29.82
## 10         33.07
## 11         36.32
## 12         39.55
## 13         42.74
## 14         45.93
## 15         49.11
## 16         52.28
## 17         55.42
## 18         58.54
## 19         61.65
## 20         64.76
## 21         67.83
## 22         70.89
## 23         73.92
## 24         76.95
## 25         79.95
## 26         82.94
## 27         85.89
## 28         88.81
## 29         91.71
## 30         94.53
## 31         97.34
## 32        100.00

Ordenar los datos

Ordenar los datos por estrato, es decir por entidades

datosOrdenados <- datos %>%
    arrange(entidad)

kable(head(datosOrdenados))
X nombre paterno materno genero edad entidad
3 J. MATILDE ZAMORANO MADUEÑO M 28 Aguascalientes
91 JOEL ARTURO CHIRINOS BILBAO M 30 Aguascalientes
109 GERARDO ALEJANDRO COPALCUA SEYNOS M 54 Aguascalientes
127 JOSE ALFRED ARROCENA CAO M 28 Aguascalientes
169 ERWIN BAZALDUA VALLADOLID M 47 Aguascalientes
197 GUZMAN FUERTE BA!UELOS M 28 Aguascalientes
kable(tail(datosOrdenados))
X nombre paterno materno genero edad entidad
9995 9855 FLORA MARIA MINO CORCHADO F 49 Zacatecas
9996 9863 DIANA VIANEY DURANTE ONOFRE F 58 Zacatecas
9997 9898 BRENDA LIZZETH PALAFOX DEHARA F 41 Zacatecas
9998 9930 ANA BERTHA HOYOS RUBALCABA F 60 Zacatecas
9999 9938 EVA LILIANA RODRIGO FERTO F 60 Zacatecas
10000 9993 LISSETT AYIL IBAÑEZ F 29 Zacatecas

Determinar una muestra de 10 para tres estratos

# Aguascalientes
Pob.Aguascalientes <- filter(datos, entidad == "Aguascalientes")

N <- nrow(Pob.Aguascalientes)
N
## [1] 311
n <- 10

muestraAguas <- sample(1:N, n, replace = FALSE)
muestraAguas
##  [1] 236  87  22 216 273 164 170 198 109  56
muestreo.Estrati.Agu <- Pob.Aguascalientes[muestraAguas, ]  # solo son de Agauscalientes
muestreo.Estrati.Agu
##        X              nombre  paterno    materno genero edad        entidad
## 236 7322 VERONICA DEL CARMEN   MUGICA    VALSECA      F   55 Aguascalientes
## 87  3107     FRANCISCO JAIME    RGUEZ NAHUATLATO      M   40 Aguascalientes
## 22   671      DAVID SALVADOR RONDEROS    DESALES      M   43 Aguascalientes
## 216 6856        ALMA SOCORRO     MINA   ROMUALDO      F   40 Aguascalientes
## 273 8474      DULCE PATRICIA  SALASAR    LLOVERA      F   32 Aguascalientes
## 164 5379        GLORIA EDITH     PUON    COLUNGA      F   44 Aguascalientes
## 170 5478       BLANCA KARINA SALMERON   DESIRENA      F   52 Aguascalientes
## 198 6481       JUANA IGNACIA  PIÑEIRO       UITZ      F   29 Aguascalientes
## 109 3844      ANTONIO JAVIER      BOA      GUDIN      M   46 Aguascalientes
## 56  2129         JOSE FRANCI   CANTUA MELQUIADES      M   45 Aguascalientes
# Baja California
Pob.BajaCalifornia <-  filter(datos, entidad == "Baja California")

N <- nrow(Pob.BajaCalifornia)
N
## [1] 331
muestraBC <- sample(1:N, 10, replace = FALSE)
muestraBC
##  [1] 200  42  29  98 322  93 120 232  78 206
muestreo.Estrati.BC <- Pob.BajaCalifornia[muestraBC, ]  # solo son de BC
muestreo.Estrati.BC
##        X            nombre      paterno   materno genero edad         entidad
## 200 6218    MINERVA ALICIA        TEXIS TOSCUENTO      F   55 Baja California
## 42  1202   JESUS FRANCISCO      PRIMERO   ALCIVAR      M   28 Baja California
## 29   859     RAUL SANTIAGO     GORGONIO         H      M   25 Baja California
## 98  2830    MARTIN ALFREDO DEL CASTILLO    CARMEN      M   26 Baja California
## 322 9669 BLANCA DEL CARMEN MARINELARENA  INTERIAN      F   27 Baja California
## 93  2588             PABLO      ZENTENO  CALTENCO      M   51 Baja California
## 120 3299     ANDRES MARTIN      SALDA#A  DEL OLMO      M   51 Baja California
## 232 7015        ROSA DALIA        LACES  ELIZALDE      F   41 Baja California
## 78  2082   JOSUE FRANCISCO       PALAPA SARRACINO      M   44 Baja California
## 206 6343     VICTOR MANUEL       CASTOR    NEBUAY      F   43 Baja California
# Durango
Pob.Durango <-  filter(datos, entidad == "Durango")

N <- nrow(Pob.Durango)
N
## [1] 318
muestraDgo <- sample(1:N, 10, replace = FALSE)
muestraDgo
##  [1]  76 176 175  78   7 212 274 213  52 300
muestreo.Estrati.Dgo <- Pob.Durango[muestraDgo, ]  # solo son de Dgo
muestreo.Estrati.Dgo
##        X              nombre  paterno  materno genero edad entidad
## 76  2417        JUAN GUSTAVO   DIRCIO  MODESTO      M   60 Durango
## 176 5615 MARTINA DEL SOCORRO    MINOR     YERA      F   18 Durango
## 175 5602      CARMEN CECILIA  IRABIEN VICTORIA      F   24 Durango
## 78  2507        OSCAR VICTOR  VELUETA VIGUERIA      M   25 Durango
## 7    188             ANCELMO MAYCOTTE   AGUEDA      M   20 Durango
## 212 6887        MARIA OTILIA     MADA  BRETADO      F   31 Durango
## 274 8494         JULIA ELENA  TAFOLLA   TEJERO      F   45 Durango
## 213 6926           CLEMENCIA  CINTORA VICENCIO      F   42 Durango
## 52  1480      VICTOR AURELIO  VIZUETH  AQUILES      M   55 Durango
## 300 9505     LAURA ALEJANDRA        A TLATILPA      F   42 Durango
# Unir las tres muestras en una sola con rbind()

muestraEstratificada <- rbind(muestreo.Estrati.Agu, muestreo.Estrati.BC, muestreo.Estrati.Dgo)

muestraEstratificada # Son 10 + 10 + 10 = 30 registros;10 de cada estrato
##        X              nombre      paterno    materno genero edad
## 236 7322 VERONICA DEL CARMEN       MUGICA    VALSECA      F   55
## 87  3107     FRANCISCO JAIME        RGUEZ NAHUATLATO      M   40
## 22   671      DAVID SALVADOR     RONDEROS    DESALES      M   43
## 216 6856        ALMA SOCORRO         MINA   ROMUALDO      F   40
## 273 8474      DULCE PATRICIA      SALASAR    LLOVERA      F   32
## 164 5379        GLORIA EDITH         PUON    COLUNGA      F   44
## 170 5478       BLANCA KARINA     SALMERON   DESIRENA      F   52
## 198 6481       JUANA IGNACIA      PIÑEIRO       UITZ      F   29
## 109 3844      ANTONIO JAVIER          BOA      GUDIN      M   46
## 56  2129         JOSE FRANCI       CANTUA MELQUIADES      M   45
## 200 6218      MINERVA ALICIA        TEXIS  TOSCUENTO      F   55
## 42  1202     JESUS FRANCISCO      PRIMERO    ALCIVAR      M   28
## 29   859       RAUL SANTIAGO     GORGONIO          H      M   25
## 98  2830      MARTIN ALFREDO DEL CASTILLO     CARMEN      M   26
## 322 9669   BLANCA DEL CARMEN MARINELARENA   INTERIAN      F   27
## 93  2588               PABLO      ZENTENO   CALTENCO      M   51
## 120 3299       ANDRES MARTIN      SALDA#A   DEL OLMO      M   51
## 232 7015          ROSA DALIA        LACES   ELIZALDE      F   41
## 78  2082     JOSUE FRANCISCO       PALAPA  SARRACINO      M   44
## 206 6343       VICTOR MANUEL       CASTOR     NEBUAY      F   43
## 76  2417        JUAN GUSTAVO       DIRCIO    MODESTO      M   60
## 176 5615 MARTINA DEL SOCORRO        MINOR       YERA      F   18
## 175 5602      CARMEN CECILIA      IRABIEN   VICTORIA      F   24
## 781 2507        OSCAR VICTOR      VELUETA   VIGUERIA      M   25
## 7    188             ANCELMO     MAYCOTTE     AGUEDA      M   20
## 212 6887        MARIA OTILIA         MADA    BRETADO      F   31
## 274 8494         JULIA ELENA      TAFOLLA     TEJERO      F   45
## 213 6926           CLEMENCIA      CINTORA   VICENCIO      F   42
## 52  1480      VICTOR AURELIO      VIZUETH    AQUILES      M   55
## 300 9505     LAURA ALEJANDRA            A   TLATILPA      F   42
##             entidad
## 236  Aguascalientes
## 87   Aguascalientes
## 22   Aguascalientes
## 216  Aguascalientes
## 273  Aguascalientes
## 164  Aguascalientes
## 170  Aguascalientes
## 198  Aguascalientes
## 109  Aguascalientes
## 56   Aguascalientes
## 200 Baja California
## 42  Baja California
## 29  Baja California
## 98  Baja California
## 322 Baja California
## 93  Baja California
## 120 Baja California
## 232 Baja California
## 78  Baja California
## 206 Baja California
## 76          Durango
## 176         Durango
## 175         Durango
## 781         Durango
## 7           Durango
## 212         Durango
## 274         Durango
## 213         Durango
## 52          Durango
## 300         Durango

Determinar una muestra de 625 para tres estratos DE ACUERDO A SU REPRESENTATIVIDAD en los datos de toda la Población

# Aguascalientes
Pob.Aguascalientes <- filter(datos, entidad == "Aguascalientes")

N <- nrow(Pob.Aguascalientes)
N     # Tamaño de cada subploblación
## [1] 311
n <- 625 # Tamaño de la muestra

muestraAguas <- sample(1:N, ceiling(625 * 0.0323), replace = FALSE)
muestraAguas
##  [1] 123  82 138  70 111  43 288 141 256  95  77 129 166 259 285  25 171 217 107
## [20] 102 152
# Baja California
Pob.BajaCalifornia <-  filter(datos, entidad == "Baja California")

N <- nrow(Pob.BajaCalifornia)
N
## [1] 331
muestraBC <- sample(1:N, ceiling(n * 0.0295), replace = FALSE)
muestraBC
##  [1]  50 263 136 213  13 197 118 324 254  23  68 244 210  42   1 214  31  60  16
muestreo.Estrati.BC <- Pob.BajaCalifornia[muestraBC, ]  # solo son de BC
muestreo.Estrati.BC
##        X          nombre    paterno     materno genero edad         entidad
## 50  1341   JUAN HUMBERTO ESCARPULLI     ABUNDEZ      M   18 Baja California
## 263 8104    MARIA DEL RO      BAXIN      URESTI      F   47 Baja California
## 136 3814     LUIS ANTONI       ALTO XOCHITIOTZI      M   26 Baja California
## 213 6574       HORTENSIA    ZENTENO     CHOLULA      F   49 Baja California
## 13   401    MARTIN OSCAR CALTZONTZI   ANCHEVIDA      M   57 Baja California
## 197 6033   LUZ GUADALUPE  TISCAREÑO     CAUDANA      F   54 Baja California
## 118 3247      JOSE HIRAM VILLALOBOS   MANDUJANO      M   56 Baja California
## 324 9819  MIRIAM FABIOLA       HOIL     YAÏ¿½EZ      F   56 Baja California
## 254 7806         MARIA S      PINON   SOBERANIS      F   38 Baja California
## 23   770   JUAN VALENTIN       ROEL   BOLAÏ¿½OS      M   43 Baja California
## 68  1781    MANUEL DE JE       SEIS      CECEÑA      M   47 Baja California
## 244 7531         TEODORA    DAVALOS      DEANDA      F   35 Baja California
## 210 6464   DULCE SOLEDAD      IROLA        ITZA      F   37 Baja California
## 42  1202 JESUS FRANCISCO    PRIMERO     ALCIVAR      M   28 Baja California
## 1      9    CRUZ ARMANDO     TIZATL     AHUMADA      M   52 Baja California
## 214 6575  MARIA ALMENDRA     DIRCIO   XOCHICALE      F   45 Baja California
## 31   936   JULIO ENRIQUE      PANDO    ESCAREÑO      M   47 Baja California
## 60  1591        BLADIMIR      BAXIN         MEX      M   28 Baja California
## 16   533             EDU      OLIVE  SANTARROSA      M   26 Baja California
# Durango
Pob.Durango <-  filter(datos, entidad == "Durango")

N <- nrow(Pob.Durango)
N
## [1] 318
muestraDgo <- sample(1:N, ceiling(n * 0.0332), replace = FALSE)
muestraDgo
##  [1] 216 311  26  90 284 296 271 300 178 205  48  20 270 141 209  94 109 103 297
## [20]  40 283
muestreo.Estrati.Dgo <- Pob.Durango[muestraDgo, ]  # solo son de Dgo
muestreo.Estrati.Dgo
##        X            nombre    paterno     materno genero edad entidad
## 216 7145       ANA BEATRIZ      REYEZ ESCOPINICHI      F   20 Durango
## 311 9801       ELBA ESTHER      RETES    CHAGOLLA      F   32 Durango
## 26   586              SEIN         IX      CARLIN      M   20 Durango
## 90  2927 ALEJANDRO ENRIQUE TECOCOATZI    CISNEROS      M   43 Durango
## 284 9014             MAVEL  GERTRUDES     NICANOR      F   36 Durango
## 296 9366           LEONILA    ARZALUZ     ZOLOETA      F   33 Durango
## 271 8429           GRETHEL    CALLEJO      FORNES      F   18 Durango
## 300 9505   LAURA ALEJANDRA          A    TLATILPA      F   42 Durango
## 178 5655        OLGA LIVIA      RILEY     QUIJANO      F   52 Durango
## 205 6503           LIZZETE  MONCIVAIS  CHIRIVISTA      F   19 Durango
## 48  1352           MARCELO      EVANS      RETANO      M   44 Durango
## 20   466            HERVEY     CATAÑO       REGIN      M   48 Durango
## 270 8426            JEMIMA    BETANZO      ALMADA      F   45 Durango
## 141 4615             CELIN   REYNALDO     MONARCA      M   38 Durango
## 209 6634      BRENDA SUJEY      CELIZ  ESCARRAMAN      F   55 Durango
## 94  3010     JESUS HORACIO     ELGUEA   NANGULARI      M   58 Durango
## 109 3333      IVAN ANTONIO     MANILA       KUMAN      M   60 Durango
## 103 3227   ANTONIO ERNESTO     CERDAN    JARALEÑO      M   47 Durango
## 297 9404      BLANCA SONIA    MACUITL   FLORENCIA      F   21 Durango
## 40  1153      SERGIO JESUS     NUNCIO    ESTOPIER      M   44 Durango
## 283 9011            YADIRA   CONSUELO     BRICEÑO      F   41 Durango
# Unir las tres muestras en una sola con rbind()

muestraEstratificada <- rbind(muestreo.Estrati.Agu, muestreo.Estrati.BC, muestreo.Estrati.Dgo)

muestraEstratificada # Son ¿ cuántos registros? .
##         X              nombre    paterno     materno genero edad
## 236  7322 VERONICA DEL CARMEN     MUGICA     VALSECA      F   55
## 87   3107     FRANCISCO JAIME      RGUEZ  NAHUATLATO      M   40
## 22    671      DAVID SALVADOR   RONDEROS     DESALES      M   43
## 216  6856        ALMA SOCORRO       MINA    ROMUALDO      F   40
## 273  8474      DULCE PATRICIA    SALASAR     LLOVERA      F   32
## 164  5379        GLORIA EDITH       PUON     COLUNGA      F   44
## 170  5478       BLANCA KARINA   SALMERON    DESIRENA      F   52
## 198  6481       JUANA IGNACIA    PIÑEIRO        UITZ      F   29
## 109  3844      ANTONIO JAVIER        BOA       GUDIN      M   46
## 56   2129         JOSE FRANCI     CANTUA  MELQUIADES      M   45
## 50   1341       JUAN HUMBERTO ESCARPULLI     ABUNDEZ      M   18
## 263  8104        MARIA DEL RO      BAXIN      URESTI      F   47
## 136  3814         LUIS ANTONI       ALTO XOCHITIOTZI      M   26
## 213  6574           HORTENSIA    ZENTENO     CHOLULA      F   49
## 13    401        MARTIN OSCAR CALTZONTZI   ANCHEVIDA      M   57
## 197  6033       LUZ GUADALUPE  TISCAREÑO     CAUDANA      F   54
## 118  3247          JOSE HIRAM VILLALOBOS   MANDUJANO      M   56
## 324  9819      MIRIAM FABIOLA       HOIL     YAÏ¿½EZ      F   56
## 254  7806             MARIA S      PINON   SOBERANIS      F   38
## 23    770       JUAN VALENTIN       ROEL   BOLAÏ¿½OS      M   43
## 68   1781        MANUEL DE JE       SEIS      CECEÑA      M   47
## 244  7531             TEODORA    DAVALOS      DEANDA      F   35
## 210  6464       DULCE SOLEDAD      IROLA        ITZA      F   37
## 42   1202     JESUS FRANCISCO    PRIMERO     ALCIVAR      M   28
## 1       9        CRUZ ARMANDO     TIZATL     AHUMADA      M   52
## 214  6575      MARIA ALMENDRA     DIRCIO   XOCHICALE      F   45
## 31    936       JULIO ENRIQUE      PANDO    ESCAREÑO      M   47
## 60   1591            BLADIMIR      BAXIN         MEX      M   28
## 16    533                 EDU      OLIVE  SANTARROSA      M   26
## 2161 7145         ANA BEATRIZ      REYEZ ESCOPINICHI      F   20
## 311  9801         ELBA ESTHER      RETES    CHAGOLLA      F   32
## 26    586                SEIN         IX      CARLIN      M   20
## 90   2927   ALEJANDRO ENRIQUE TECOCOATZI    CISNEROS      M   43
## 284  9014               MAVEL  GERTRUDES     NICANOR      F   36
## 296  9366             LEONILA    ARZALUZ     ZOLOETA      F   33
## 271  8429             GRETHEL    CALLEJO      FORNES      F   18
## 300  9505     LAURA ALEJANDRA          A    TLATILPA      F   42
## 178  5655          OLGA LIVIA      RILEY     QUIJANO      F   52
## 205  6503             LIZZETE  MONCIVAIS  CHIRIVISTA      F   19
## 48   1352             MARCELO      EVANS      RETANO      M   44
## 20    466              HERVEY     CATAÑO       REGIN      M   48
## 270  8426              JEMIMA    BETANZO      ALMADA      F   45
## 141  4615               CELIN   REYNALDO     MONARCA      M   38
## 209  6634        BRENDA SUJEY      CELIZ  ESCARRAMAN      F   55
## 94   3010       JESUS HORACIO     ELGUEA   NANGULARI      M   58
## 1091 3333        IVAN ANTONIO     MANILA       KUMAN      M   60
## 103  3227     ANTONIO ERNESTO     CERDAN    JARALEÑO      M   47
## 297  9404        BLANCA SONIA    MACUITL   FLORENCIA      F   21
## 40   1153        SERGIO JESUS     NUNCIO    ESTOPIER      M   44
## 283  9011              YADIRA   CONSUELO     BRICEÑO      F   41
##              entidad
## 236   Aguascalientes
## 87    Aguascalientes
## 22    Aguascalientes
## 216   Aguascalientes
## 273   Aguascalientes
## 164   Aguascalientes
## 170   Aguascalientes
## 198   Aguascalientes
## 109   Aguascalientes
## 56    Aguascalientes
## 50   Baja California
## 263  Baja California
## 136  Baja California
## 213  Baja California
## 13   Baja California
## 197  Baja California
## 118  Baja California
## 324  Baja California
## 254  Baja California
## 23   Baja California
## 68   Baja California
## 244  Baja California
## 210  Baja California
## 42   Baja California
## 1    Baja California
## 214  Baja California
## 31   Baja California
## 60   Baja California
## 16   Baja California
## 2161         Durango
## 311          Durango
## 26           Durango
## 90           Durango
## 284          Durango
## 296          Durango
## 271          Durango
## 300          Durango
## 178          Durango
## 205          Durango
## 48           Durango
## 20           Durango
## 270          Durango
## 141          Durango
## 209          Durango
## 94           Durango
## 1091         Durango
## 103          Durango
## 297          Durango
## 40           Durango
## 283          Durango
summary(muestraEstratificada)
##        X           nombre            paterno            materno         
##  Min.   :   9   Length:50          Length:50          Length:50         
##  1st Qu.:1638   Class :character   Class :character   Class :character  
##  Median :5428   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :4877                                                           
##  3rd Qu.:7479                                                           
##  Max.   :9819                                                           
##     genero               edad         entidad         
##  Length:50          Min.   :18.00   Length:50         
##  Class :character   1st Qu.:32.25   Class :character  
##  Mode  :character   Median :43.00   Mode  :character  
##                     Mean   :40.62                     
##                     3rd Qu.:47.75                     
##                     Max.   :60.00