Las librerías

library(readr) # leer datos
library(knitr) # Tablas amigables
library(fdth)  # Crear tablas de distribución
library(dplyr) # select, filter, mutate, group...

Cargar datos

datos <- read.csv("../Datos/personas.csv")

kable(head(datos))
X nombre paterno materno genero edad entidad
1 GALILEO CARCAÑO SAMUDIO M 41 Baja California
2 EDUARDO JAVIER BELMONT ZEMPOALTECATL M 19 Chihuahua
3 GASTON CERROS ABNAL M 39 Sinaloa
4 ROBERTO OMAR ROGEL BALLEZA M 26 Guanajuato
5 LUIS ARMANDO FRAIJO CONCHAS M 33 Baja California Sur
6 JOSE DE LA CRUZ CECILIO ALAYOLA M 37 Tamaulipas
kable(head(datos))
X nombre paterno materno genero edad entidad
1 GALILEO CARCAÑO SAMUDIO M 41 Baja California
2 EDUARDO JAVIER BELMONT ZEMPOALTECATL M 19 Chihuahua
3 GASTON CERROS ABNAL M 39 Sinaloa
4 ROBERTO OMAR ROGEL BALLEZA M 26 Guanajuato
5 LUIS ARMANDO FRAIJO CONCHAS M 33 Baja California Sur
6 JOSE DE LA CRUZ CECILIO ALAYOLA M 37 Tamaulipas

Estadísticos descriptivos

summary(datos)
##        X                       nombre         paterno           materno    
##  Min.   :    1   IVANHOE          :   6   FITTA   :   7   CORDERO   :   8  
##  1st Qu.: 2501   JOSE ABEL        :   6   QUEMADA :   7   MONTEAGUDO:   7  
##  Median : 5000   CECILIA MAGDALENA:   5   TECO    :   7   ROJERO    :   7  
##  Mean   : 5000   FIDEL JESUS      :   5   VARGAZ  :   7   ANDON     :   6  
##  3rd Qu.: 7500   HUMBERTO RENE    :   5   AGIS    :   6   BARQUERA  :   6  
##  Max.   :10000   JESUS A          :   5   BALCAZAR:   6   CHONGO    :   6  
##                  (Other)          :9968   (Other) :9960   (Other)   :9960  
##  genero        edad                       entidad    
##  F:5200   Min.   :18.00   Guanajuato          : 351  
##  M:4800   1st Qu.:28.00   Durango             : 332  
##           Median :39.00   Coahuila de Zaragoza: 330  
##           Mean   :38.93   Oaxaca              : 329  
##           3rd Qu.:50.00   Baja California Sur : 327  
##           Max.   :60.00   Querétaro           : 326  
##                           (Other)             :8005

Valor N cantidad de registros de la pobación

N = nrow(datos) # Cantidad datos

Muestreo Aleatorio Simple

set.seed(2020)

# Primero
N <- nrow(datos) # La población
n <- 15          # La muestra


muestra <- sample(1:N, n, replace = FALSE)
muestra
##  [1] 9628 9452 7767 8920 4417 8465 9380  170 7878  945 4992 2602 3062 1053 5104
muestra.Simple <- datos[muestra, ]
muestra.Simple
##         X           nombre   paterno   materno genero edad
## 9628 9628     GLORIA NELLY    BERMAN  QUIÑONEZ      F   29
## 9452 9452             IBET     RETIZ   ASTORGA      F   24
## 7767 7767         JERONIMA CASTELAZO      CHIM      F   41
## 8920 8920  REBECA PATRICIA     IPIÑA      RAZO      F   24
## 4417 4417            JORGE  EGUIARTE     PINTO      M   42
## 8465 8465     DIANA REBECA       TUK    TERREZ      F   46
## 9380 9380 ISABEL ALEJANDRA    ASBELL    CAMIRO      F   56
## 170   170      OSCAR DAVID    AYERDE   MERODIO      M   34
## 7878 7878  MARIA GAUDENCIA   FRANCIA      CURA      F   59
## 945   945      JOSE JULIAN   LLERENA     FIGON      M   42
## 4992 4992    MARTHA CELINA    BALBAS CASTRILLO      F   25
## 2602 2602  ARTURO DE JESUS  LARRIETA   LORANCA      M   59
## 3062 3062    RAMON ARMANDO    INTZIN    SEEFOO      M   37
## 1053 1053      LUIS FELIPE  PARRILLA     CINCO      M   54
## 5104 5104     SANDRA PAOLA  ANTILLON ARISMENDI      F   29
##                              entidad
## 9628                         Hidalgo
## 9452                        Tlaxcala
## 7767                       Querétaro
## 8920                 Baja California
## 4417                         Jalisco
## 8465                 San Luis Potosí
## 9380 Veracruz de Ignacio de la Llave
## 170                          Tabasco
## 7878 Veracruz de Ignacio de la Llave
## 945                          Chiapas
## 4992                         Hidalgo
## 2602                          Sonora
## 3062             Baja California Sur
## 1053                         Jalisco
## 5104            Coahuila de Zaragoza
# Segundo
n <- 625
muestra <- sample(N, n, replace = FALSE)
# Ya no visualizamos muestra, ... son muchos ...
muestra.Simple <- datos[muestra, ]

# Mostramos los primeros y los últimos registros
kable(head(muestra.Simple,10))
X nombre paterno materno genero edad entidad
4483 4483 FRANCISCO FABIAN ROSAL QUIAHUA M 56 Oaxaca
8797 8797 KIKEY RICARDEZ SIMON F 53 Yucatán
6888 6888 BERTA RIEKE COAHUILA F 24 México
3662 3662 GUILLERMO ALFONSO NORIA ANCHEITA M 29 Guanajuato
4684 4684 LUIS MARTIN TILAN SANCHEZ DE LA VEGA M 56 Jalisco
78 78 LORENZO JAVIER CHAMPO BORDA M 54 Tamaulipas
7687 7687 ELENA VIRGINIA ZATARAIN LAURIANO F 51 Veracruz de Ignacio de la Llave
724 724 RAUL ENRIQUE PATIÿO CHICON M 32 Nayarit
1524 1524 YURI DE OLMOS Y LAGUNES M 19 Chihuahua
7468 7468 IRMA PATRICIA GINES AGUERO F 42 Veracruz de Ignacio de la Llave
kable(tail(muestra.Simple,10))
X nombre paterno materno genero edad entidad
797 797 CRISPIN LASTIRI PIZANA M 25 Sonora
5609 5609 IVONNE EDITH GRACIDAS SANTILLANO F 55 Querétaro
8295 8295 ELSA VERONICA TURRIZA SABORI F 21 San Luis Potosí
2911 2911 VULFRANO CHOLICO CAMPORREDONDO M 59 Oaxaca
5517 5517 ELIZABETH GUADALUPE PAPAQUI RIOJAS F 32 Coahuila de Zaragoza
4600 4600 MARTIN OSCAR RUELAS VALDOVINOS M 58 México
2085 2085 RAMON MIGUEL ELISEA GONZALEZ M 32 Quintana Roo
4365 4365 JESUS OSWALDO SAYAS SIDA M 40 Yucatán
1228 1228 RAYMUNDO JESUS FARARONI FLOREZ M 45 Tlaxcala
8302 8302 FANY ALMONTES PIEDRA F 54 San Luis Potosí

Muestreo Aleatorio Sistematizado

set.seed(2020)

# Primero
muestra <- seq(from = 5, to = 100, by = 7)
muestra
##  [1]  5 12 19 26 33 40 47 54 61 68 75 82 89 96
muestra.Simple <- datos[muestra, ]


# Segundo
muestra <- seq(from = 37, to = N, by = 60)
# Ya no visualizamos muestra, son muchos ... ...


poblacion <- datos # Sinónimo

muestra.Sistematizada <- datos[muestra, ] # [Filas, Columas]

# Mostramos los primeros y los últimos registros
kable(head(muestra.Sistematizada,10))
X nombre paterno materno genero edad entidad
37 37 HECTOR SAMUEL MACARENA SINGH M 50 Durango
97 97 DANIEL ANDRES LANDIN COCIO M 55 Tlaxcala
157 157 CHRISTIAN ANTONIO COMPAÑ HUANTE M 30 Tamaulipas
217 217 CESAR MARTIN RUBIN LINARES M 39 Guanajuato
277 277 CUITLAHUAC PROSPERO NANDI M 35 Nayarit
337 337 JOSE RUFINO VALLEJON MAYORQUIN M 40 Campeche
397 397 CLAUDIA TELESFORO AGUILETA M 55 Aguascalientes
457 457 SALVADOR ALBERTO DRAGUSTINOVIS TEXIS M 55 Tamaulipas
517 517 DIEGO ARMANDO CUADRADO ABSALON M 30 Yucatán
577 577 ZACARIAS BELMARES TUXPAN M 44 San Luis Potosí
kable(tail(muestra.Sistematizada,10))
X nombre paterno materno genero edad entidad
9457 9457 DAMARIZ SALMON ARPAIZ F 55 Nuevo León
9517 9517 MARTHA ITZEL IÑIGUEZ LAFARGA F 58 Tamaulipas
9577 9577 MARIA GRACIELA MIRABAL LEIJA F 22 Puebla
9637 9637 AURELIA GUADALUPE REYES GUIZAR F 55 Yucatán
9697 9697 MARGARITA ARACELI ALGREDO GURRIA F 52 Morelos
9757 9757 KATIA CARBENTE SAMARIO F 34 Sinaloa
9817 9817 MONICA OLIVIA MILPA MIGONI F 23 Sonora
9877 9877 MA GUADALUP ORPINEL JAMAICA F 37 Coahuila de Zaragoza
9937 9937 FATIMA GABRIELA PANTI CAMERA F 18 Aguascalientes
9997 9997 MARIA ELVIA OLIVEROS MADRAZO F 51 Puebla

Muestreo Aleatorio Estratificado

tabla.frecuencias <- data.frame(fdt_cat(x = datos$entidad))
tabla.frecuencias  # Sin ordenar por entidad, pero están ordendas por frecuecia f
##                           Category   f     rf rf...    cf  cf...
## 1                       Guanajuato 351 0.0351  3.51   351   3.51
## 2                          Durango 332 0.0332  3.32   683   6.83
## 3             Coahuila de Zaragoza 330 0.0330  3.30  1013  10.13
## 4                           Oaxaca 329 0.0329  3.29  1342  13.42
## 5              Baja California Sur 327 0.0327  3.27  1669  16.69
## 6                        Querétaro 326 0.0326  3.26  1995  19.95
## 7                           Colima 324 0.0324  3.24  2319  23.19
## 8                   Aguascalientes 323 0.0323  3.23  2642  26.42
## 9                           Sonora 323 0.0323  3.23  2965  29.65
## 10                       Zacatecas 323 0.0323  3.23  3288  32.88
## 11                Ciudad de México 321 0.0321  3.21  3609  36.09
## 12                         Hidalgo 321 0.0321  3.21  3930  39.30
## 13                          México 321 0.0321  3.21  4251  42.51
## 14                        Guerrero 317 0.0317  3.17  4568  45.68
## 15                      Nuevo León 317 0.0317  3.17  4885  48.85
## 16                         Nayarit 316 0.0316  3.16  5201  52.01
## 17                         Tabasco 315 0.0315  3.15  5516  55.16
## 18                      Tamaulipas 315 0.0315  3.15  5831  58.31
## 19                        Tlaxcala 315 0.0315  3.15  6146  61.46
## 20 Veracruz de Ignacio de la Llave 311 0.0311  3.11  6457  64.57
## 21                          Puebla 308 0.0308  3.08  6765  67.65
## 22                 San Luis Potosí 306 0.0306  3.06  7071  70.71
## 23                         Yucatán 306 0.0306  3.06  7377  73.77
## 24                       Chihuahua 298 0.0298  2.98  7675  76.75
## 25             Michoacán de Ocampo 296 0.0296  2.96  7971  79.71
## 26                 Baja California 295 0.0295  2.95  8266  82.66
## 27                         Morelos 294 0.0294  2.94  8560  85.60
## 28                        Campeche 293 0.0293  2.93  8853  88.53
## 29                         Jalisco 291 0.0291  2.91  9144  91.44
## 30                         Sinaloa 291 0.0291  2.91  9435  94.35
## 31                    Quintana Roo 290 0.0290  2.90  9725  97.25
## 32                         Chiapas 275 0.0275  2.75 10000 100.00
#tabla.frecuencias <- arrange(tabla.frecuencias, Category)
#tabla.frecuencias  # Ordenadas

colnames(tabla.frecuencias)  <- c("categoria", "frec", "frec.rel", "frec.porc", "frec.acum", "frec.rel.acum") # Los nombres de las columnas

tabla.frecuencias # Ya están ordenadas por categoria, es decir por entidad
##                          categoria frec frec.rel frec.porc frec.acum
## 1                       Guanajuato  351   0.0351      3.51       351
## 2                          Durango  332   0.0332      3.32       683
## 3             Coahuila de Zaragoza  330   0.0330      3.30      1013
## 4                           Oaxaca  329   0.0329      3.29      1342
## 5              Baja California Sur  327   0.0327      3.27      1669
## 6                        Querétaro  326   0.0326      3.26      1995
## 7                           Colima  324   0.0324      3.24      2319
## 8                   Aguascalientes  323   0.0323      3.23      2642
## 9                           Sonora  323   0.0323      3.23      2965
## 10                       Zacatecas  323   0.0323      3.23      3288
## 11                Ciudad de México  321   0.0321      3.21      3609
## 12                         Hidalgo  321   0.0321      3.21      3930
## 13                          México  321   0.0321      3.21      4251
## 14                        Guerrero  317   0.0317      3.17      4568
## 15                      Nuevo León  317   0.0317      3.17      4885
## 16                         Nayarit  316   0.0316      3.16      5201
## 17                         Tabasco  315   0.0315      3.15      5516
## 18                      Tamaulipas  315   0.0315      3.15      5831
## 19                        Tlaxcala  315   0.0315      3.15      6146
## 20 Veracruz de Ignacio de la Llave  311   0.0311      3.11      6457
## 21                          Puebla  308   0.0308      3.08      6765
## 22                 San Luis Potosí  306   0.0306      3.06      7071
## 23                         Yucatán  306   0.0306      3.06      7377
## 24                       Chihuahua  298   0.0298      2.98      7675
## 25             Michoacán de Ocampo  296   0.0296      2.96      7971
## 26                 Baja California  295   0.0295      2.95      8266
## 27                         Morelos  294   0.0294      2.94      8560
## 28                        Campeche  293   0.0293      2.93      8853
## 29                         Jalisco  291   0.0291      2.91      9144
## 30                         Sinaloa  291   0.0291      2.91      9435
## 31                    Quintana Roo  290   0.0290      2.90      9725
## 32                         Chiapas  275   0.0275      2.75     10000
##    frec.rel.acum
## 1           3.51
## 2           6.83
## 3          10.13
## 4          13.42
## 5          16.69
## 6          19.95
## 7          23.19
## 8          26.42
## 9          29.65
## 10         32.88
## 11         36.09
## 12         39.30
## 13         42.51
## 14         45.68
## 15         48.85
## 16         52.01
## 17         55.16
## 18         58.31
## 19         61.46
## 20         64.57
## 21         67.65
## 22         70.71
## 23         73.77
## 24         76.75
## 25         79.71
## 26         82.66
## 27         85.60
## 28         88.53
## 29         91.44
## 30         94.35
## 31         97.25
## 32        100.00

Ordenar los datos

Ordenar los datos por estrato, es decir por entidades * Se utiliza la función arrange() de la librería dplyr previamente cargada.

#datosOrdenados <- datos %>%
#    arrange(entidad)

#kable(head(datosOrdenados))
#kable(tail(datosOrdenados))

Determinar una muestra de 10 para tres estratos

# Aguascalientes
Pob.Aguascalientes <- filter(datos, entidad == "Aguascalientes")

N <- nrow(Pob.Aguascalientes)
N
## [1] 323
n <- 10

muestraAguas <- sample(1:N, n, replace = FALSE)
muestraAguas
##  [1] 236  87  22 216 273 164 170 198 109  56
muestreo.Estrati.Agu <- Pob.Aguascalientes[muestraAguas, ]  # solo son de Agauscalientes
muestreo.Estrati.Agu
##        X          nombre         paterno    materno genero edad        entidad
## 236 7398        JOSABETH         VAQUIER     MERIDA      F   36 Aguascalientes
## 87  2632          HELDER          VERDIN VILLASE!OR      M   24 Aguascalientes
## 22   519      LUIS RAMON           ABNAL      LINCE      M   47 Aguascalientes
## 216 6851   BLANCA BERTHA        ARGUELLO      LARIZ      F   57 Aguascalientes
## 273 8501   MARIA OBDULIA DE LOS MONTEROS     MARAVE      F   28 Aguascalientes
## 164 4823  SARA GUADALUPE          CHAIRA     PRISCO      F   37 Aguascalientes
## 170 5113  AIDA ELIZABETH          ORUETA    GALDINO      F   19 Aguascalientes
## 198 6223 DIANA GUADALUPE        VILLALBA    RICHART      F   24 Aguascalientes
## 109 3282           JUANA           FITTA   FLATCHER      M   26 Aguascalientes
## 56  1414    JOSE GUSTAVO           URSUA     LAUREL      M   45 Aguascalientes
# Baja California
Pob.BajaCalifornia <-  filter(datos, entidad == "Baja California")

N <- nrow(Pob.BajaCalifornia)
N
## [1] 295
muestraBC <- sample(1:N, 10, replace = FALSE)
muestraBC
##  [1] 200  42  29  98  93 120 232  78 206  76
muestreo.Estrati.BC <- Pob.BajaCalifornia[muestraBC, ]  # solo son de BC
muestreo.Estrati.BC
##        X             nombre    paterno  materno genero edad         entidad
## 200 6985 DOLORES DEL CARMEN   VERDUZCO  TEMORES      F   46 Baja California
## 42  1277              RANDY     TETUAN TLAPANCO      M   48 Baja California
## 29   852        LUIS HERNAN   ALMONACI     GUAL      M   32 Baja California
## 98  3395      FELIX ANTONIO    LIZCANO MONSREAL      M   53 Baja California
## 93  3278      JORGE ORLANDO     MILLER   JALOMO      M   44 Baja California
## 120 3900         SACRAMENTO     DUENAS LESCIEUR      M   38 Baja California
## 232 7872      ALMA ERENDIRA HENESTROZA SARIÑANA      F   53 Baja California
## 78  2729    EDUARDO ERNESTO     BUTRON    DUANA      M   37 Baja California
## 206 7166        MA. YESENIA DESAMPEDRO   VIEDMA      F   29 Baja California
## 76  2648       RAUL ROBERTO   COTARELO   MONZON      M   30 Baja California
# Durango
Pob.Durango <-  filter(datos, entidad == "Durango")

N <- nrow(Pob.Durango)
N
## [1] 332
muestraDgo <- sample(1:N, 10, replace = FALSE)
muestraDgo
##  [1] 176 175  78   7 212 274 213  52 300 123
muestreo.Estrati.Dgo <- Pob.Durango[muestraDgo, ]  # solo son de Dgo
muestreo.Estrati.Dgo
##        X              nombre   paterno  materno genero edad entidad
## 176 5636   JUANA DEL ROSARIO VILLAFA%A  CARAVEO      F   58 Durango
## 175 5635        ALMA XOCHITL     AMAYO  BASAÑEZ      F   37 Durango
## 78  2787          JOSE EFREN     PRADO     DIAZ      M   19 Durango
## 7    146   GUILLERMO EDUARDO     XALPA ALMENDRA      M   30 Durango
## 212 6631          ALMA KAREN  URDIALES  BARRITA      F   56 Durango
## 274 8122         NORMA LYDIA     MASSE AURIOLES      F   40 Durango
## 213 6673 ADRIANA DEL ROSARIO ECHEVESTE    XULUC      F   40 Durango
## 52  1920        HUGO ARMANDO IZAGUIRRE     CEME      M   25 Durango
## 300 8785          RUTH ELENA NAHUACATL ARICEAGA      F   56 Durango
## 123 4163          JOSE LAURO  CRAVIOTO    NACAR      M   35 Durango
# Unir las tres muestras en una sola con rbind()

muestraEstratificada <- rbind(muestreo.Estrati.Agu, muestreo.Estrati.BC, muestreo.Estrati.Dgo)

muestraEstratificada # Son 10 + 10 + 10 = 30 registros;10 de cada estrato
##        X              nombre         paterno    materno genero edad
## 236 7398            JOSABETH         VAQUIER     MERIDA      F   36
## 87  2632              HELDER          VERDIN VILLASE!OR      M   24
## 22   519          LUIS RAMON           ABNAL      LINCE      M   47
## 216 6851       BLANCA BERTHA        ARGUELLO      LARIZ      F   57
## 273 8501       MARIA OBDULIA DE LOS MONTEROS     MARAVE      F   28
## 164 4823      SARA GUADALUPE          CHAIRA     PRISCO      F   37
## 170 5113      AIDA ELIZABETH          ORUETA    GALDINO      F   19
## 198 6223     DIANA GUADALUPE        VILLALBA    RICHART      F   24
## 109 3282               JUANA           FITTA   FLATCHER      M   26
## 56  1414        JOSE GUSTAVO           URSUA     LAUREL      M   45
## 200 6985  DOLORES DEL CARMEN        VERDUZCO    TEMORES      F   46
## 42  1277               RANDY          TETUAN   TLAPANCO      M   48
## 29   852         LUIS HERNAN        ALMONACI       GUAL      M   32
## 98  3395       FELIX ANTONIO         LIZCANO   MONSREAL      M   53
## 93  3278       JORGE ORLANDO          MILLER     JALOMO      M   44
## 120 3900          SACRAMENTO          DUENAS   LESCIEUR      M   38
## 232 7872       ALMA ERENDIRA      HENESTROZA   SARIÑANA      F   53
## 78  2729     EDUARDO ERNESTO          BUTRON      DUANA      M   37
## 206 7166         MA. YESENIA      DESAMPEDRO     VIEDMA      F   29
## 76  2648        RAUL ROBERTO        COTARELO     MONZON      M   30
## 176 5636   JUANA DEL ROSARIO       VILLAFA%A    CARAVEO      F   58
## 175 5635        ALMA XOCHITL           AMAYO    BASAÑEZ      F   37
## 781 2787          JOSE EFREN           PRADO       DIAZ      M   19
## 7    146   GUILLERMO EDUARDO           XALPA   ALMENDRA      M   30
## 212 6631          ALMA KAREN        URDIALES    BARRITA      F   56
## 274 8122         NORMA LYDIA           MASSE   AURIOLES      F   40
## 213 6673 ADRIANA DEL ROSARIO       ECHEVESTE      XULUC      F   40
## 52  1920        HUGO ARMANDO       IZAGUIRRE       CEME      M   25
## 300 8785          RUTH ELENA       NAHUACATL   ARICEAGA      F   56
## 123 4163          JOSE LAURO        CRAVIOTO      NACAR      M   35
##             entidad
## 236  Aguascalientes
## 87   Aguascalientes
## 22   Aguascalientes
## 216  Aguascalientes
## 273  Aguascalientes
## 164  Aguascalientes
## 170  Aguascalientes
## 198  Aguascalientes
## 109  Aguascalientes
## 56   Aguascalientes
## 200 Baja California
## 42  Baja California
## 29  Baja California
## 98  Baja California
## 93  Baja California
## 120 Baja California
## 232 Baja California
## 78  Baja California
## 206 Baja California
## 76  Baja California
## 176         Durango
## 175         Durango
## 781         Durango
## 7           Durango
## 212         Durango
## 274         Durango
## 213         Durango
## 52          Durango
## 300         Durango
## 123         Durango

Determinar una muestra de 625 para tres estratos DE ACUERDO A SU REPRESENTATIVIDAD en los datos de toda la Población

# Aguascalientes
Pob.Aguascalientes <- filter(datos, entidad == "Aguascalientes")

N <- nrow(Pob.Aguascalientes)
N     # Tamaño de cadda subploblación
## [1] 323
n <- 625 # Tamaño de la muestra

muestraAguas <- sample(1:N, ceiling(625 * 0.0323), replace = FALSE)
muestraAguas
##  [1]  82 138  70 111  43 288 141 256  95  77 129 166 259 285  25 171 217 107 102
## [20] 152  50
muestreo.Estrati.Agu <- Pob.Aguascalientes[muestraAguas, ]  # solo son de Agauscalientes
muestreo.Estrati.Agu
##        X            nombre  paterno   materno genero edad        entidad
## 82  2565      ALVARO JESUS  VILLEDA    ROSETE      M   40 Aguascalientes
## 138 4006        HEDILBERTO  LAZGARE   GAMARRA      M   22 Aguascalientes
## 70  2156           ELIASIB      SIL     EDGAR      M   50 Aguascalientes
## 111 3302  LORENZO DE JESUS  GURROLA COMONFORT      M   41 Aguascalientes
## 43   969         ERMELANDO   SANTIZ      VALE      M   43 Aguascalientes
## 288 8874       ELVA ESTHER ARENIVAR      VACA      F   41 Aguascalientes
## 141 4115     JAIRO ANTONIO  CAZARES    CORTES      M   45 Aguascalientes
## 256 8000     YADIRA JUDITH     TODD      PITA      F   35 Aguascalientes
## 95  2803      EDGAR JAVIER        M ALQUICIRA      M   29 Aguascalientes
## 77  2394              LEVI   ROSADO   GONGORA      M   38 Aguascalientes
## 129 3788 CHRISTIAN EDUARDO     TORO    LEA%OS      M   20 Aguascalientes
## 166 4875           LUISANA ALCORCHA      JAIN      F   31 Aguascalientes
## 259 8069       MA. DOLORES  ZAMORES    ARPAIZ      F   31 Aguascalientes
## 285 8844     BRENDA JUDITH  ALGREDO AHUELICAN      F   59 Aguascalientes
## 25   585             OLIVO MARENTES   CUESTAS      M   28 Aguascalientes
## 171 5131         MA. NORMA  LICERIO    CORAZA      F   37 Aguascalientes
## 217 6855   DOLORES CECILIA TLATEMPA    PELAYO      F   33 Aguascalientes
## 107 3237         GUALBERTO   ESTALA  MENDIETA      M   45 Aguascalientes
## 102 3034      JULIO MARTIN  PALMERO      MASS      M   49 Aguascalientes
## 152 4347    MANUEL RODRIGO  BUENFIL  FLATCHER      M   29 Aguascalientes
## 50  1217       JUAN CARLOS  POMARES   PILIADO      M   18 Aguascalientes
# Baja California
Pob.BajaCalifornia <-  filter(datos, entidad == "Baja California")

N <- nrow(Pob.BajaCalifornia)
N
## [1] 295
muestraBC <- sample(1:N, ceiling(n * 0.0295), replace = FALSE)
muestraBC
##  [1] 263 136 213  13 197 118 254  23  68 244 210  42   1 214  31  60  16 216  26
muestreo.Estrati.BC <- Pob.BajaCalifornia[muestraBC, ]  # solo son de BC
muestreo.Estrati.BC
##        X           nombre     paterno     materno genero edad         entidad
## 263 9070        ROSA LILA       COHUO    QUEZADAS      F   49 Baja California
## 136 4493   ERIC ALEJANDRO       COSIO      DELVAL      M   55 Baja California
## 213 7344 YANETH ALEJANDRA      ARCILA      VIDRIO      F   18 Baja California
## 13   470      CARLOS PAUL CALZADILLAS     MENACHO      M   57 Baja California
## 197 6779       SARA ELISA      COLOTL        SOSA      F   33 Baja California
## 118 3857    OSCAR OSVALDO      MILPAS     SANDRIA      M   44 Baja California
## 254 8714    JESSICA PAOLA      FRANCO     COSTEÑO      F   37 Baja California
## 23   607    JESUS ALFREDO      ANTA!O     MAYORGA      M   59 Baja California
## 68  2388    JORGE HORACIO    ZARIÑANA    MEMBRILA      M   50 Baja California
## 244 8281     REYNA JUDITH     SALDA%A MATANCILLAS      F   53 Baja California
## 210 7311  SONIA ESMERALDA    MENDIOLA     CASARIN      F   19 Baja California
## 42  1277            RANDY      TETUAN    TLAPANCO      M   48 Baja California
## 1      1          GALILEO     CARCAÑO     SAMUDIO      M   41 Baja California
## 214 7362    EMMA GRACIELA      DECARO  AVELLANEDA      F   44 Baja California
## 31   891    MARTIN MIGUEL    ARTALEJO     URDIERA      M   38 Baja California
## 60  2151   ADRIAN EDUARDO     MIXTEGA     SUENAGA      M   59 Baja California
## 16   512           AMANDO VALLESTEROS XOCHITIOTZI      M   44 Baja California
## 216 7397           CAROLA    GALINDEZ   BOCARANDO      F   45 Baja California
## 26   712          CENOBIO    ASCENCIO       CAMAL      M   31 Baja California
# Durango
Pob.Durango <-  filter(datos, entidad == "Durango")

N <- nrow(Pob.Durango)
N
## [1] 332
muestraDgo <- sample(1:N, ceiling(n * 0.0332), replace = FALSE)
muestraDgo
##  [1]  90 284 321 296 271 300 178 205  48  20 270 141 209  94 109 103 297  40 283
## [20]  99 258
muestreo.Estrati.Dgo <- Pob.Durango[muestraDgo, ]  # solo son de Dgo
muestreo.Estrati.Dgo
##        X            nombre     paterno    materno genero edad entidad
## 90  3129          CAROLINO     DAGNINO      LAZOS      M   22 Durango
## 284 8362      MONICA EDITH      ARRONA       HAZA      F   18 Durango
## 321 9638     MIRIAM ALICIA    CARRIOLA  VIDERIQUE      F   60 Durango
## 296 8743       IRMA NOHEMI      ANLEHU    MURUATO      F   50 Durango
## 271 8084          SERAFINA  LANZAGORTA    RIOFRIO      F   29 Durango
## 300 8785        RUTH ELENA   NAHUACATL   ARICEAGA      F   56 Durango
## 178 5680    BRENDA MARCELA     CAHUARE       HAZA      F   53 Durango
## 205 6442 JESSICA ALEJANDRA       ULLOA   ZAMARRON      F   46 Durango
## 48  1785        MARCO IVAN    BROISSIN     BERAIN      M   20 Durango
## 20   908      LUIS HORACIO      DEMEZA      MATOS      M   27 Durango
## 270 8067  SELENE ESMERALDA    DE OLMOS DEL CARPIO      F   50 Durango
## 141 4693           IVANHOE     JUVENAL        SEL      M   25 Durango
## 209 6531  ELVIRA ELIZABETH    SUSUNAGA     NIÏ¿½O      F   36 Durango
## 94  3293              OFIR        AYUP      COCON      M   42 Durango
## 109 3807       MIGUEL LUIS       WALDO     OAXACA      M   49 Durango
## 103 3600             SAULO  VILLADOBLE     RONCES      M   19 Durango
## 297 8748           CITLALY MATLALCOATL    CORDERO      F   29 Durango
## 40  1562     MARTIN ADRIAN      BULNES    CORDOBA      M   54 Durango
## 283 8354        MA ROSALIA    VIURQUIZ    CHARLES      F   31 Durango
## 99  3463   ANDRES HUMBERTO      MERIDA     FERRER      M   43 Durango
## 258 7623      MARTHA DELIA     ARREGUI       OCON      F   55 Durango
# Unir las tres muestras en una sola con rbind()

muestraEstratificada <- rbind(muestreo.Estrati.Agu, muestreo.Estrati.BC, muestreo.Estrati.Dgo)

muestraEstratificada # Son ¿ cuántos registros? .
##         X            nombre     paterno     materno genero edad         entidad
## 82   2565      ALVARO JESUS     VILLEDA      ROSETE      M   40  Aguascalientes
## 138  4006        HEDILBERTO     LAZGARE     GAMARRA      M   22  Aguascalientes
## 70   2156           ELIASIB         SIL       EDGAR      M   50  Aguascalientes
## 111  3302  LORENZO DE JESUS     GURROLA   COMONFORT      M   41  Aguascalientes
## 43    969         ERMELANDO      SANTIZ        VALE      M   43  Aguascalientes
## 288  8874       ELVA ESTHER    ARENIVAR        VACA      F   41  Aguascalientes
## 141  4115     JAIRO ANTONIO     CAZARES      CORTES      M   45  Aguascalientes
## 256  8000     YADIRA JUDITH        TODD        PITA      F   35  Aguascalientes
## 95   2803      EDGAR JAVIER           M   ALQUICIRA      M   29  Aguascalientes
## 77   2394              LEVI      ROSADO     GONGORA      M   38  Aguascalientes
## 129  3788 CHRISTIAN EDUARDO        TORO      LEA%OS      M   20  Aguascalientes
## 166  4875           LUISANA    ALCORCHA        JAIN      F   31  Aguascalientes
## 259  8069       MA. DOLORES     ZAMORES      ARPAIZ      F   31  Aguascalientes
## 285  8844     BRENDA JUDITH     ALGREDO   AHUELICAN      F   59  Aguascalientes
## 25    585             OLIVO    MARENTES     CUESTAS      M   28  Aguascalientes
## 171  5131         MA. NORMA     LICERIO      CORAZA      F   37  Aguascalientes
## 217  6855   DOLORES CECILIA    TLATEMPA      PELAYO      F   33  Aguascalientes
## 107  3237         GUALBERTO      ESTALA    MENDIETA      M   45  Aguascalientes
## 102  3034      JULIO MARTIN     PALMERO        MASS      M   49  Aguascalientes
## 152  4347    MANUEL RODRIGO     BUENFIL    FLATCHER      M   29  Aguascalientes
## 50   1217       JUAN CARLOS     POMARES     PILIADO      M   18  Aguascalientes
## 263  9070         ROSA LILA       COHUO    QUEZADAS      F   49 Baja California
## 136  4493    ERIC ALEJANDRO       COSIO      DELVAL      M   55 Baja California
## 213  7344  YANETH ALEJANDRA      ARCILA      VIDRIO      F   18 Baja California
## 13    470       CARLOS PAUL CALZADILLAS     MENACHO      M   57 Baja California
## 197  6779        SARA ELISA      COLOTL        SOSA      F   33 Baja California
## 118  3857     OSCAR OSVALDO      MILPAS     SANDRIA      M   44 Baja California
## 254  8714     JESSICA PAOLA      FRANCO     COSTEÑO      F   37 Baja California
## 23    607     JESUS ALFREDO      ANTA!O     MAYORGA      M   59 Baja California
## 68   2388     JORGE HORACIO    ZARIÑANA    MEMBRILA      M   50 Baja California
## 244  8281      REYNA JUDITH     SALDA%A MATANCILLAS      F   53 Baja California
## 210  7311   SONIA ESMERALDA    MENDIOLA     CASARIN      F   19 Baja California
## 42   1277             RANDY      TETUAN    TLAPANCO      M   48 Baja California
## 1       1           GALILEO     CARCAÑO     SAMUDIO      M   41 Baja California
## 214  7362     EMMA GRACIELA      DECARO  AVELLANEDA      F   44 Baja California
## 31    891     MARTIN MIGUEL    ARTALEJO     URDIERA      M   38 Baja California
## 60   2151    ADRIAN EDUARDO     MIXTEGA     SUENAGA      M   59 Baja California
## 16    512            AMANDO VALLESTEROS XOCHITIOTZI      M   44 Baja California
## 216  7397            CAROLA    GALINDEZ   BOCARANDO      F   45 Baja California
## 26    712           CENOBIO    ASCENCIO       CAMAL      M   31 Baja California
## 90   3129          CAROLINO     DAGNINO       LAZOS      M   22         Durango
## 284  8362      MONICA EDITH      ARRONA        HAZA      F   18         Durango
## 321  9638     MIRIAM ALICIA    CARRIOLA   VIDERIQUE      F   60         Durango
## 296  8743       IRMA NOHEMI      ANLEHU     MURUATO      F   50         Durango
## 271  8084          SERAFINA  LANZAGORTA     RIOFRIO      F   29         Durango
## 300  8785        RUTH ELENA   NAHUACATL    ARICEAGA      F   56         Durango
## 178  5680    BRENDA MARCELA     CAHUARE        HAZA      F   53         Durango
## 205  6442 JESSICA ALEJANDRA       ULLOA    ZAMARRON      F   46         Durango
## 48   1785        MARCO IVAN    BROISSIN      BERAIN      M   20         Durango
## 20    908      LUIS HORACIO      DEMEZA       MATOS      M   27         Durango
## 270  8067  SELENE ESMERALDA    DE OLMOS  DEL CARPIO      F   50         Durango
## 1411 4693           IVANHOE     JUVENAL         SEL      M   25         Durango
## 209  6531  ELVIRA ELIZABETH    SUSUNAGA      NIÏ¿½O      F   36         Durango
## 94   3293              OFIR        AYUP       COCON      M   42         Durango
## 109  3807       MIGUEL LUIS       WALDO      OAXACA      M   49         Durango
## 103  3600             SAULO  VILLADOBLE      RONCES      M   19         Durango
## 297  8748           CITLALY MATLALCOATL     CORDERO      F   29         Durango
## 40   1562     MARTIN ADRIAN      BULNES     CORDOBA      M   54         Durango
## 283  8354        MA ROSALIA    VIURQUIZ     CHARLES      F   31         Durango
## 99   3463   ANDRES HUMBERTO      MERIDA      FERRER      M   43         Durango
## 258  7623      MARTHA DELIA     ARREGUI        OCON      F   55         Durango
summary(muestraEstratificada)
##        X                    nombre       paterno         materno   genero
##  Min.   :   1   ADRIAN EDUARDO : 1   ALCORCHA: 1   HAZA      : 2   F:27  
##  1st Qu.:2388   ALVARO JESUS   : 1   ALGREDO : 1   AHUELICAN : 1   M:34  
##  Median :4115   AMANDO         : 1   ANLEHU  : 1   ALQUICIRA : 1         
##  Mean   :4755   ANDRES HUMBERTO: 1   ANTA!O  : 1   ARICEAGA  : 1         
##  3rd Qu.:7623   BRENDA JUDITH  : 1   ARCILA  : 1   ARPAIZ    : 1         
##  Max.   :9638   BRENDA MARCELA : 1   ARENIVAR: 1   AVELLANEDA: 1         
##                 (Other)        :55   (Other) :55   (Other)   :54         
##       edad                      entidad  
##  Min.   :18.00   Aguascalientes     :21  
##  1st Qu.:29.00   Durango            :21  
##  Median :41.00   Baja California    :19  
##  Mean   :39.38   Baja California Sur: 0  
##  3rd Qu.:49.00   Campeche           : 0  
##  Max.   :60.00   Chiapas            : 0  
##                  (Other)            : 0
print ("El último")
## [1] "El último"
#Pob.BajaCalifornia <-  filter(datosOrdenados, entidad == "Baja California")
#Poblacion <- rbind(Pob.Aguascalientes, Pob.BajaCalifornia)

#kable(head(Poblacion))
#kable(tail(Poblacion))

#Poblacion
#N <- nrow(Poblacion) # La cantidad de datos de Aguscalientes y Baja California
#N

#n <- 100 # Tamaño de la muestra que se quiere tener ahorita es constante, no estadística




# Determinamos los % de cada estrato
#tabla.frecuencias <- data.frame(fdt_cat(x = Poblacion$entidad))
#tabla.frecuencias

#muestra1 <- sample(1:, 10, , replace = TRUE)
#muestra1