library(readr) # leer datos
library(knitr) # Tablas amigables
library(fdth) # Crear tablas de distribución
library(dplyr) # select, filter, mutate, group...
datos <- read.csv("../Datos/personas.csv")
kable(head(datos))
| X | nombre | paterno | materno | genero | edad | entidad |
|---|---|---|---|---|---|---|
| 1 | GALILEO | CARCAÑO | SAMUDIO | M | 41 | Baja California |
| 2 | EDUARDO JAVIER | BELMONT | ZEMPOALTECATL | M | 19 | Chihuahua |
| 3 | GASTON | CERROS | ABNAL | M | 39 | Sinaloa |
| 4 | ROBERTO OMAR | ROGEL | BALLEZA | M | 26 | Guanajuato |
| 5 | LUIS ARMANDO | FRAIJO | CONCHAS | M | 33 | Baja California Sur |
| 6 | JOSE DE LA CRUZ | CECILIO | ALAYOLA | M | 37 | Tamaulipas |
kable(head(datos))
| X | nombre | paterno | materno | genero | edad | entidad |
|---|---|---|---|---|---|---|
| 1 | GALILEO | CARCAÑO | SAMUDIO | M | 41 | Baja California |
| 2 | EDUARDO JAVIER | BELMONT | ZEMPOALTECATL | M | 19 | Chihuahua |
| 3 | GASTON | CERROS | ABNAL | M | 39 | Sinaloa |
| 4 | ROBERTO OMAR | ROGEL | BALLEZA | M | 26 | Guanajuato |
| 5 | LUIS ARMANDO | FRAIJO | CONCHAS | M | 33 | Baja California Sur |
| 6 | JOSE DE LA CRUZ | CECILIO | ALAYOLA | M | 37 | Tamaulipas |
summary(datos)
## X nombre paterno materno
## Min. : 1 IVANHOE : 6 FITTA : 7 CORDERO : 8
## 1st Qu.: 2501 JOSE ABEL : 6 QUEMADA : 7 MONTEAGUDO: 7
## Median : 5000 CECILIA MAGDALENA: 5 TECO : 7 ROJERO : 7
## Mean : 5000 FIDEL JESUS : 5 VARGAZ : 7 ANDON : 6
## 3rd Qu.: 7500 HUMBERTO RENE : 5 AGIS : 6 BARQUERA : 6
## Max. :10000 JESUS A : 5 BALCAZAR: 6 CHONGO : 6
## (Other) :9968 (Other) :9960 (Other) :9960
## genero edad entidad
## F:5200 Min. :18.00 Guanajuato : 351
## M:4800 1st Qu.:28.00 Durango : 332
## Median :39.00 Coahuila de Zaragoza: 330
## Mean :38.93 Oaxaca : 329
## 3rd Qu.:50.00 Baja California Sur : 327
## Max. :60.00 Querétaro : 326
## (Other) :8005
N = nrow(datos) # Cantidad datos
set.seed(2020)
# Primero
N <- nrow(datos) # La población
n <- 15 # La muestra
muestra <- sample(1:N, n, replace = FALSE)
muestra
## [1] 9628 9452 7767 8920 4417 8465 9380 170 7878 945 4992 2602 3062 1053 5104
muestra.Simple <- datos[muestra, ]
muestra.Simple
## X nombre paterno materno genero edad
## 9628 9628 GLORIA NELLY BERMAN QUIÑONEZ F 29
## 9452 9452 IBET RETIZ ASTORGA F 24
## 7767 7767 JERONIMA CASTELAZO CHIM F 41
## 8920 8920 REBECA PATRICIA IPIÑA RAZO F 24
## 4417 4417 JORGE EGUIARTE PINTO M 42
## 8465 8465 DIANA REBECA TUK TERREZ F 46
## 9380 9380 ISABEL ALEJANDRA ASBELL CAMIRO F 56
## 170 170 OSCAR DAVID AYERDE MERODIO M 34
## 7878 7878 MARIA GAUDENCIA FRANCIA CURA F 59
## 945 945 JOSE JULIAN LLERENA FIGON M 42
## 4992 4992 MARTHA CELINA BALBAS CASTRILLO F 25
## 2602 2602 ARTURO DE JESUS LARRIETA LORANCA M 59
## 3062 3062 RAMON ARMANDO INTZIN SEEFOO M 37
## 1053 1053 LUIS FELIPE PARRILLA CINCO M 54
## 5104 5104 SANDRA PAOLA ANTILLON ARISMENDI F 29
## entidad
## 9628 Hidalgo
## 9452 Tlaxcala
## 7767 Querétaro
## 8920 Baja California
## 4417 Jalisco
## 8465 San Luis Potosí
## 9380 Veracruz de Ignacio de la Llave
## 170 Tabasco
## 7878 Veracruz de Ignacio de la Llave
## 945 Chiapas
## 4992 Hidalgo
## 2602 Sonora
## 3062 Baja California Sur
## 1053 Jalisco
## 5104 Coahuila de Zaragoza
# Segundo
n <- 625
muestra <- sample(N, n, replace = FALSE)
# Ya no visualizamos muestra, ... son muchos ...
muestra.Simple <- datos[muestra, ]
# Mostramos los primeros y los últimos registros
kable(head(muestra.Simple,10))
| X | nombre | paterno | materno | genero | edad | entidad | |
|---|---|---|---|---|---|---|---|
| 4483 | 4483 | FRANCISCO FABIAN | ROSAL | QUIAHUA | M | 56 | Oaxaca |
| 8797 | 8797 | KIKEY | RICARDEZ | SIMON | F | 53 | Yucatán |
| 6888 | 6888 | BERTA | RIEKE | COAHUILA | F | 24 | México |
| 3662 | 3662 | GUILLERMO ALFONSO | NORIA | ANCHEITA | M | 29 | Guanajuato |
| 4684 | 4684 | LUIS MARTIN | TILAN | SANCHEZ DE LA VEGA | M | 56 | Jalisco |
| 78 | 78 | LORENZO JAVIER | CHAMPO | BORDA | M | 54 | Tamaulipas |
| 7687 | 7687 | ELENA VIRGINIA | ZATARAIN | LAURIANO | F | 51 | Veracruz de Ignacio de la Llave |
| 724 | 724 | RAUL ENRIQUE | PATIÿO | CHICON | M | 32 | Nayarit |
| 1524 | 1524 | YURI | DE OLMOS | Y LAGUNES | M | 19 | Chihuahua |
| 7468 | 7468 | IRMA PATRICIA | GINES | AGUERO | F | 42 | Veracruz de Ignacio de la Llave |
kable(tail(muestra.Simple,10))
| X | nombre | paterno | materno | genero | edad | entidad | |
|---|---|---|---|---|---|---|---|
| 797 | 797 | CRISPIN | LASTIRI | PIZANA | M | 25 | Sonora |
| 5609 | 5609 | IVONNE EDITH | GRACIDAS | SANTILLANO | F | 55 | Querétaro |
| 8295 | 8295 | ELSA VERONICA | TURRIZA | SABORI | F | 21 | San Luis Potosí |
| 2911 | 2911 | VULFRANO | CHOLICO | CAMPORREDONDO | M | 59 | Oaxaca |
| 5517 | 5517 | ELIZABETH GUADALUPE | PAPAQUI | RIOJAS | F | 32 | Coahuila de Zaragoza |
| 4600 | 4600 | MARTIN OSCAR | RUELAS | VALDOVINOS | M | 58 | México |
| 2085 | 2085 | RAMON MIGUEL | ELISEA | GONZALEZ | M | 32 | Quintana Roo |
| 4365 | 4365 | JESUS OSWALDO | SAYAS | SIDA | M | 40 | Yucatán |
| 1228 | 1228 | RAYMUNDO JESUS | FARARONI | FLOREZ | M | 45 | Tlaxcala |
| 8302 | 8302 | FANY | ALMONTES | PIEDRA | F | 54 | San Luis Potosí |
set.seed(2020)
# Primero
muestra <- seq(from = 5, to = 100, by = 7)
muestra
## [1] 5 12 19 26 33 40 47 54 61 68 75 82 89 96
muestra.Simple <- datos[muestra, ]
# Segundo
muestra <- seq(from = 37, to = N, by = 60)
# Ya no visualizamos muestra, son muchos ... ...
poblacion <- datos # Sinónimo
muestra.Sistematizada <- datos[muestra, ] # [Filas, Columas]
# Mostramos los primeros y los últimos registros
kable(head(muestra.Sistematizada,10))
| X | nombre | paterno | materno | genero | edad | entidad | |
|---|---|---|---|---|---|---|---|
| 37 | 37 | HECTOR SAMUEL | MACARENA | SINGH | M | 50 | Durango |
| 97 | 97 | DANIEL ANDRES | LANDIN | COCIO | M | 55 | Tlaxcala |
| 157 | 157 | CHRISTIAN ANTONIO | COMPAÑ | HUANTE | M | 30 | Tamaulipas |
| 217 | 217 | CESAR MARTIN | RUBIN | LINARES | M | 39 | Guanajuato |
| 277 | 277 | CUITLAHUAC | PROSPERO | NANDI | M | 35 | Nayarit |
| 337 | 337 | JOSE RUFINO | VALLEJON | MAYORQUIN | M | 40 | Campeche |
| 397 | 397 | CLAUDIA | TELESFORO | AGUILETA | M | 55 | Aguascalientes |
| 457 | 457 | SALVADOR ALBERTO | DRAGUSTINOVIS | TEXIS | M | 55 | Tamaulipas |
| 517 | 517 | DIEGO ARMANDO | CUADRADO | ABSALON | M | 30 | Yucatán |
| 577 | 577 | ZACARIAS | BELMARES | TUXPAN | M | 44 | San Luis Potosí |
kable(tail(muestra.Sistematizada,10))
| X | nombre | paterno | materno | genero | edad | entidad | |
|---|---|---|---|---|---|---|---|
| 9457 | 9457 | DAMARIZ | SALMON | ARPAIZ | F | 55 | Nuevo León |
| 9517 | 9517 | MARTHA ITZEL | IÑIGUEZ | LAFARGA | F | 58 | Tamaulipas |
| 9577 | 9577 | MARIA GRACIELA | MIRABAL | LEIJA | F | 22 | Puebla |
| 9637 | 9637 | AURELIA GUADALUPE | REYES | GUIZAR | F | 55 | Yucatán |
| 9697 | 9697 | MARGARITA ARACELI | ALGREDO | GURRIA | F | 52 | Morelos |
| 9757 | 9757 | KATIA | CARBENTE | SAMARIO | F | 34 | Sinaloa |
| 9817 | 9817 | MONICA OLIVIA | MILPA | MIGONI | F | 23 | Sonora |
| 9877 | 9877 | MA GUADALUP | ORPINEL | JAMAICA | F | 37 | Coahuila de Zaragoza |
| 9937 | 9937 | FATIMA GABRIELA | PANTI | CAMERA | F | 18 | Aguascalientes |
| 9997 | 9997 | MARIA ELVIA | OLIVEROS | MADRAZO | F | 51 | Puebla |
tabla.frecuencias <- data.frame(fdt_cat(x = datos$entidad))
tabla.frecuencias # Sin ordenar por entidad, pero están ordendas por frecuecia f
## Category f rf rf... cf cf...
## 1 Guanajuato 351 0.0351 3.51 351 3.51
## 2 Durango 332 0.0332 3.32 683 6.83
## 3 Coahuila de Zaragoza 330 0.0330 3.30 1013 10.13
## 4 Oaxaca 329 0.0329 3.29 1342 13.42
## 5 Baja California Sur 327 0.0327 3.27 1669 16.69
## 6 Querétaro 326 0.0326 3.26 1995 19.95
## 7 Colima 324 0.0324 3.24 2319 23.19
## 8 Aguascalientes 323 0.0323 3.23 2642 26.42
## 9 Sonora 323 0.0323 3.23 2965 29.65
## 10 Zacatecas 323 0.0323 3.23 3288 32.88
## 11 Ciudad de México 321 0.0321 3.21 3609 36.09
## 12 Hidalgo 321 0.0321 3.21 3930 39.30
## 13 México 321 0.0321 3.21 4251 42.51
## 14 Guerrero 317 0.0317 3.17 4568 45.68
## 15 Nuevo León 317 0.0317 3.17 4885 48.85
## 16 Nayarit 316 0.0316 3.16 5201 52.01
## 17 Tabasco 315 0.0315 3.15 5516 55.16
## 18 Tamaulipas 315 0.0315 3.15 5831 58.31
## 19 Tlaxcala 315 0.0315 3.15 6146 61.46
## 20 Veracruz de Ignacio de la Llave 311 0.0311 3.11 6457 64.57
## 21 Puebla 308 0.0308 3.08 6765 67.65
## 22 San Luis Potosí 306 0.0306 3.06 7071 70.71
## 23 Yucatán 306 0.0306 3.06 7377 73.77
## 24 Chihuahua 298 0.0298 2.98 7675 76.75
## 25 Michoacán de Ocampo 296 0.0296 2.96 7971 79.71
## 26 Baja California 295 0.0295 2.95 8266 82.66
## 27 Morelos 294 0.0294 2.94 8560 85.60
## 28 Campeche 293 0.0293 2.93 8853 88.53
## 29 Jalisco 291 0.0291 2.91 9144 91.44
## 30 Sinaloa 291 0.0291 2.91 9435 94.35
## 31 Quintana Roo 290 0.0290 2.90 9725 97.25
## 32 Chiapas 275 0.0275 2.75 10000 100.00
#tabla.frecuencias <- arrange(tabla.frecuencias, Category)
#tabla.frecuencias # Ordenadas
colnames(tabla.frecuencias) <- c("categoria", "frec", "frec.rel", "frec.porc", "frec.acum", "frec.rel.acum") # Los nombres de las columnas
tabla.frecuencias # Ya están ordenadas por categoria, es decir por entidad
## categoria frec frec.rel frec.porc frec.acum
## 1 Guanajuato 351 0.0351 3.51 351
## 2 Durango 332 0.0332 3.32 683
## 3 Coahuila de Zaragoza 330 0.0330 3.30 1013
## 4 Oaxaca 329 0.0329 3.29 1342
## 5 Baja California Sur 327 0.0327 3.27 1669
## 6 Querétaro 326 0.0326 3.26 1995
## 7 Colima 324 0.0324 3.24 2319
## 8 Aguascalientes 323 0.0323 3.23 2642
## 9 Sonora 323 0.0323 3.23 2965
## 10 Zacatecas 323 0.0323 3.23 3288
## 11 Ciudad de México 321 0.0321 3.21 3609
## 12 Hidalgo 321 0.0321 3.21 3930
## 13 México 321 0.0321 3.21 4251
## 14 Guerrero 317 0.0317 3.17 4568
## 15 Nuevo León 317 0.0317 3.17 4885
## 16 Nayarit 316 0.0316 3.16 5201
## 17 Tabasco 315 0.0315 3.15 5516
## 18 Tamaulipas 315 0.0315 3.15 5831
## 19 Tlaxcala 315 0.0315 3.15 6146
## 20 Veracruz de Ignacio de la Llave 311 0.0311 3.11 6457
## 21 Puebla 308 0.0308 3.08 6765
## 22 San Luis Potosí 306 0.0306 3.06 7071
## 23 Yucatán 306 0.0306 3.06 7377
## 24 Chihuahua 298 0.0298 2.98 7675
## 25 Michoacán de Ocampo 296 0.0296 2.96 7971
## 26 Baja California 295 0.0295 2.95 8266
## 27 Morelos 294 0.0294 2.94 8560
## 28 Campeche 293 0.0293 2.93 8853
## 29 Jalisco 291 0.0291 2.91 9144
## 30 Sinaloa 291 0.0291 2.91 9435
## 31 Quintana Roo 290 0.0290 2.90 9725
## 32 Chiapas 275 0.0275 2.75 10000
## frec.rel.acum
## 1 3.51
## 2 6.83
## 3 10.13
## 4 13.42
## 5 16.69
## 6 19.95
## 7 23.19
## 8 26.42
## 9 29.65
## 10 32.88
## 11 36.09
## 12 39.30
## 13 42.51
## 14 45.68
## 15 48.85
## 16 52.01
## 17 55.16
## 18 58.31
## 19 61.46
## 20 64.57
## 21 67.65
## 22 70.71
## 23 73.77
## 24 76.75
## 25 79.71
## 26 82.66
## 27 85.60
## 28 88.53
## 29 91.44
## 30 94.35
## 31 97.25
## 32 100.00
Ordenar los datos por estrato, es decir por entidades * Se utiliza la función arrange() de la librería dplyr previamente cargada.
#datosOrdenados <- datos %>%
# arrange(entidad)
#kable(head(datosOrdenados))
#kable(tail(datosOrdenados))
# Aguascalientes
Pob.Aguascalientes <- filter(datos, entidad == "Aguascalientes")
N <- nrow(Pob.Aguascalientes)
N
## [1] 323
n <- 10
muestraAguas <- sample(1:N, n, replace = FALSE)
muestraAguas
## [1] 236 87 22 216 273 164 170 198 109 56
muestreo.Estrati.Agu <- Pob.Aguascalientes[muestraAguas, ] # solo son de Agauscalientes
muestreo.Estrati.Agu
## X nombre paterno materno genero edad entidad
## 236 7398 JOSABETH VAQUIER MERIDA F 36 Aguascalientes
## 87 2632 HELDER VERDIN VILLASE!OR M 24 Aguascalientes
## 22 519 LUIS RAMON ABNAL LINCE M 47 Aguascalientes
## 216 6851 BLANCA BERTHA ARGUELLO LARIZ F 57 Aguascalientes
## 273 8501 MARIA OBDULIA DE LOS MONTEROS MARAVE F 28 Aguascalientes
## 164 4823 SARA GUADALUPE CHAIRA PRISCO F 37 Aguascalientes
## 170 5113 AIDA ELIZABETH ORUETA GALDINO F 19 Aguascalientes
## 198 6223 DIANA GUADALUPE VILLALBA RICHART F 24 Aguascalientes
## 109 3282 JUANA FITTA FLATCHER M 26 Aguascalientes
## 56 1414 JOSE GUSTAVO URSUA LAUREL M 45 Aguascalientes
# Baja California
Pob.BajaCalifornia <- filter(datos, entidad == "Baja California")
N <- nrow(Pob.BajaCalifornia)
N
## [1] 295
muestraBC <- sample(1:N, 10, replace = FALSE)
muestraBC
## [1] 200 42 29 98 93 120 232 78 206 76
muestreo.Estrati.BC <- Pob.BajaCalifornia[muestraBC, ] # solo son de BC
muestreo.Estrati.BC
## X nombre paterno materno genero edad entidad
## 200 6985 DOLORES DEL CARMEN VERDUZCO TEMORES F 46 Baja California
## 42 1277 RANDY TETUAN TLAPANCO M 48 Baja California
## 29 852 LUIS HERNAN ALMONACI GUAL M 32 Baja California
## 98 3395 FELIX ANTONIO LIZCANO MONSREAL M 53 Baja California
## 93 3278 JORGE ORLANDO MILLER JALOMO M 44 Baja California
## 120 3900 SACRAMENTO DUENAS LESCIEUR M 38 Baja California
## 232 7872 ALMA ERENDIRA HENESTROZA SARIÑANA F 53 Baja California
## 78 2729 EDUARDO ERNESTO BUTRON DUANA M 37 Baja California
## 206 7166 MA. YESENIA DESAMPEDRO VIEDMA F 29 Baja California
## 76 2648 RAUL ROBERTO COTARELO MONZON M 30 Baja California
# Durango
Pob.Durango <- filter(datos, entidad == "Durango")
N <- nrow(Pob.Durango)
N
## [1] 332
muestraDgo <- sample(1:N, 10, replace = FALSE)
muestraDgo
## [1] 176 175 78 7 212 274 213 52 300 123
muestreo.Estrati.Dgo <- Pob.Durango[muestraDgo, ] # solo son de Dgo
muestreo.Estrati.Dgo
## X nombre paterno materno genero edad entidad
## 176 5636 JUANA DEL ROSARIO VILLAFA%A CARAVEO F 58 Durango
## 175 5635 ALMA XOCHITL AMAYO BASAÑEZ F 37 Durango
## 78 2787 JOSE EFREN PRADO DIAZ M 19 Durango
## 7 146 GUILLERMO EDUARDO XALPA ALMENDRA M 30 Durango
## 212 6631 ALMA KAREN URDIALES BARRITA F 56 Durango
## 274 8122 NORMA LYDIA MASSE AURIOLES F 40 Durango
## 213 6673 ADRIANA DEL ROSARIO ECHEVESTE XULUC F 40 Durango
## 52 1920 HUGO ARMANDO IZAGUIRRE CEME M 25 Durango
## 300 8785 RUTH ELENA NAHUACATL ARICEAGA F 56 Durango
## 123 4163 JOSE LAURO CRAVIOTO NACAR M 35 Durango
# Unir las tres muestras en una sola con rbind()
muestraEstratificada <- rbind(muestreo.Estrati.Agu, muestreo.Estrati.BC, muestreo.Estrati.Dgo)
muestraEstratificada # Son 10 + 10 + 10 = 30 registros;10 de cada estrato
## X nombre paterno materno genero edad
## 236 7398 JOSABETH VAQUIER MERIDA F 36
## 87 2632 HELDER VERDIN VILLASE!OR M 24
## 22 519 LUIS RAMON ABNAL LINCE M 47
## 216 6851 BLANCA BERTHA ARGUELLO LARIZ F 57
## 273 8501 MARIA OBDULIA DE LOS MONTEROS MARAVE F 28
## 164 4823 SARA GUADALUPE CHAIRA PRISCO F 37
## 170 5113 AIDA ELIZABETH ORUETA GALDINO F 19
## 198 6223 DIANA GUADALUPE VILLALBA RICHART F 24
## 109 3282 JUANA FITTA FLATCHER M 26
## 56 1414 JOSE GUSTAVO URSUA LAUREL M 45
## 200 6985 DOLORES DEL CARMEN VERDUZCO TEMORES F 46
## 42 1277 RANDY TETUAN TLAPANCO M 48
## 29 852 LUIS HERNAN ALMONACI GUAL M 32
## 98 3395 FELIX ANTONIO LIZCANO MONSREAL M 53
## 93 3278 JORGE ORLANDO MILLER JALOMO M 44
## 120 3900 SACRAMENTO DUENAS LESCIEUR M 38
## 232 7872 ALMA ERENDIRA HENESTROZA SARIÑANA F 53
## 78 2729 EDUARDO ERNESTO BUTRON DUANA M 37
## 206 7166 MA. YESENIA DESAMPEDRO VIEDMA F 29
## 76 2648 RAUL ROBERTO COTARELO MONZON M 30
## 176 5636 JUANA DEL ROSARIO VILLAFA%A CARAVEO F 58
## 175 5635 ALMA XOCHITL AMAYO BASAÑEZ F 37
## 781 2787 JOSE EFREN PRADO DIAZ M 19
## 7 146 GUILLERMO EDUARDO XALPA ALMENDRA M 30
## 212 6631 ALMA KAREN URDIALES BARRITA F 56
## 274 8122 NORMA LYDIA MASSE AURIOLES F 40
## 213 6673 ADRIANA DEL ROSARIO ECHEVESTE XULUC F 40
## 52 1920 HUGO ARMANDO IZAGUIRRE CEME M 25
## 300 8785 RUTH ELENA NAHUACATL ARICEAGA F 56
## 123 4163 JOSE LAURO CRAVIOTO NACAR M 35
## entidad
## 236 Aguascalientes
## 87 Aguascalientes
## 22 Aguascalientes
## 216 Aguascalientes
## 273 Aguascalientes
## 164 Aguascalientes
## 170 Aguascalientes
## 198 Aguascalientes
## 109 Aguascalientes
## 56 Aguascalientes
## 200 Baja California
## 42 Baja California
## 29 Baja California
## 98 Baja California
## 93 Baja California
## 120 Baja California
## 232 Baja California
## 78 Baja California
## 206 Baja California
## 76 Baja California
## 176 Durango
## 175 Durango
## 781 Durango
## 7 Durango
## 212 Durango
## 274 Durango
## 213 Durango
## 52 Durango
## 300 Durango
## 123 Durango
Aguascalientes, Baja California y Durango
Se determina una población de cada Estrato: Aguascalientes, Baja California y Durango
Se sacan una muestra de 625 para cada estrato multiplicado por su REPRESENTATIVIDAD DEL TOTAL DE LA POBLACIÓN
categori frec frec.rel frec.porc
Aguascalientes 323 0.0323 3.23 …
Baja California 295 0.0295 2.95 …
Durango 332 0.0332 3.32
Se genera la muestra DE CADA ESTRATO
Se une con rbind() para conformar el muestreo estratificado
# Aguascalientes
Pob.Aguascalientes <- filter(datos, entidad == "Aguascalientes")
N <- nrow(Pob.Aguascalientes)
N # Tamaño de cadda subploblación
## [1] 323
n <- 625 # Tamaño de la muestra
muestraAguas <- sample(1:N, ceiling(625 * 0.0323), replace = FALSE)
muestraAguas
## [1] 82 138 70 111 43 288 141 256 95 77 129 166 259 285 25 171 217 107 102
## [20] 152 50
muestreo.Estrati.Agu <- Pob.Aguascalientes[muestraAguas, ] # solo son de Agauscalientes
muestreo.Estrati.Agu
## X nombre paterno materno genero edad entidad
## 82 2565 ALVARO JESUS VILLEDA ROSETE M 40 Aguascalientes
## 138 4006 HEDILBERTO LAZGARE GAMARRA M 22 Aguascalientes
## 70 2156 ELIASIB SIL EDGAR M 50 Aguascalientes
## 111 3302 LORENZO DE JESUS GURROLA COMONFORT M 41 Aguascalientes
## 43 969 ERMELANDO SANTIZ VALE M 43 Aguascalientes
## 288 8874 ELVA ESTHER ARENIVAR VACA F 41 Aguascalientes
## 141 4115 JAIRO ANTONIO CAZARES CORTES M 45 Aguascalientes
## 256 8000 YADIRA JUDITH TODD PITA F 35 Aguascalientes
## 95 2803 EDGAR JAVIER M ALQUICIRA M 29 Aguascalientes
## 77 2394 LEVI ROSADO GONGORA M 38 Aguascalientes
## 129 3788 CHRISTIAN EDUARDO TORO LEA%OS M 20 Aguascalientes
## 166 4875 LUISANA ALCORCHA JAIN F 31 Aguascalientes
## 259 8069 MA. DOLORES ZAMORES ARPAIZ F 31 Aguascalientes
## 285 8844 BRENDA JUDITH ALGREDO AHUELICAN F 59 Aguascalientes
## 25 585 OLIVO MARENTES CUESTAS M 28 Aguascalientes
## 171 5131 MA. NORMA LICERIO CORAZA F 37 Aguascalientes
## 217 6855 DOLORES CECILIA TLATEMPA PELAYO F 33 Aguascalientes
## 107 3237 GUALBERTO ESTALA MENDIETA M 45 Aguascalientes
## 102 3034 JULIO MARTIN PALMERO MASS M 49 Aguascalientes
## 152 4347 MANUEL RODRIGO BUENFIL FLATCHER M 29 Aguascalientes
## 50 1217 JUAN CARLOS POMARES PILIADO M 18 Aguascalientes
# Baja California
Pob.BajaCalifornia <- filter(datos, entidad == "Baja California")
N <- nrow(Pob.BajaCalifornia)
N
## [1] 295
muestraBC <- sample(1:N, ceiling(n * 0.0295), replace = FALSE)
muestraBC
## [1] 263 136 213 13 197 118 254 23 68 244 210 42 1 214 31 60 16 216 26
muestreo.Estrati.BC <- Pob.BajaCalifornia[muestraBC, ] # solo son de BC
muestreo.Estrati.BC
## X nombre paterno materno genero edad entidad
## 263 9070 ROSA LILA COHUO QUEZADAS F 49 Baja California
## 136 4493 ERIC ALEJANDRO COSIO DELVAL M 55 Baja California
## 213 7344 YANETH ALEJANDRA ARCILA VIDRIO F 18 Baja California
## 13 470 CARLOS PAUL CALZADILLAS MENACHO M 57 Baja California
## 197 6779 SARA ELISA COLOTL SOSA F 33 Baja California
## 118 3857 OSCAR OSVALDO MILPAS SANDRIA M 44 Baja California
## 254 8714 JESSICA PAOLA FRANCO COSTEÑO F 37 Baja California
## 23 607 JESUS ALFREDO ANTA!O MAYORGA M 59 Baja California
## 68 2388 JORGE HORACIO ZARIÑANA MEMBRILA M 50 Baja California
## 244 8281 REYNA JUDITH SALDA%A MATANCILLAS F 53 Baja California
## 210 7311 SONIA ESMERALDA MENDIOLA CASARIN F 19 Baja California
## 42 1277 RANDY TETUAN TLAPANCO M 48 Baja California
## 1 1 GALILEO CARCAÑO SAMUDIO M 41 Baja California
## 214 7362 EMMA GRACIELA DECARO AVELLANEDA F 44 Baja California
## 31 891 MARTIN MIGUEL ARTALEJO URDIERA M 38 Baja California
## 60 2151 ADRIAN EDUARDO MIXTEGA SUENAGA M 59 Baja California
## 16 512 AMANDO VALLESTEROS XOCHITIOTZI M 44 Baja California
## 216 7397 CAROLA GALINDEZ BOCARANDO F 45 Baja California
## 26 712 CENOBIO ASCENCIO CAMAL M 31 Baja California
# Durango
Pob.Durango <- filter(datos, entidad == "Durango")
N <- nrow(Pob.Durango)
N
## [1] 332
muestraDgo <- sample(1:N, ceiling(n * 0.0332), replace = FALSE)
muestraDgo
## [1] 90 284 321 296 271 300 178 205 48 20 270 141 209 94 109 103 297 40 283
## [20] 99 258
muestreo.Estrati.Dgo <- Pob.Durango[muestraDgo, ] # solo son de Dgo
muestreo.Estrati.Dgo
## X nombre paterno materno genero edad entidad
## 90 3129 CAROLINO DAGNINO LAZOS M 22 Durango
## 284 8362 MONICA EDITH ARRONA HAZA F 18 Durango
## 321 9638 MIRIAM ALICIA CARRIOLA VIDERIQUE F 60 Durango
## 296 8743 IRMA NOHEMI ANLEHU MURUATO F 50 Durango
## 271 8084 SERAFINA LANZAGORTA RIOFRIO F 29 Durango
## 300 8785 RUTH ELENA NAHUACATL ARICEAGA F 56 Durango
## 178 5680 BRENDA MARCELA CAHUARE HAZA F 53 Durango
## 205 6442 JESSICA ALEJANDRA ULLOA ZAMARRON F 46 Durango
## 48 1785 MARCO IVAN BROISSIN BERAIN M 20 Durango
## 20 908 LUIS HORACIO DEMEZA MATOS M 27 Durango
## 270 8067 SELENE ESMERALDA DE OLMOS DEL CARPIO F 50 Durango
## 141 4693 IVANHOE JUVENAL SEL M 25 Durango
## 209 6531 ELVIRA ELIZABETH SUSUNAGA NIÏ¿½O F 36 Durango
## 94 3293 OFIR AYUP COCON M 42 Durango
## 109 3807 MIGUEL LUIS WALDO OAXACA M 49 Durango
## 103 3600 SAULO VILLADOBLE RONCES M 19 Durango
## 297 8748 CITLALY MATLALCOATL CORDERO F 29 Durango
## 40 1562 MARTIN ADRIAN BULNES CORDOBA M 54 Durango
## 283 8354 MA ROSALIA VIURQUIZ CHARLES F 31 Durango
## 99 3463 ANDRES HUMBERTO MERIDA FERRER M 43 Durango
## 258 7623 MARTHA DELIA ARREGUI OCON F 55 Durango
# Unir las tres muestras en una sola con rbind()
muestraEstratificada <- rbind(muestreo.Estrati.Agu, muestreo.Estrati.BC, muestreo.Estrati.Dgo)
muestraEstratificada # Son ¿ cuántos registros? .
## X nombre paterno materno genero edad entidad
## 82 2565 ALVARO JESUS VILLEDA ROSETE M 40 Aguascalientes
## 138 4006 HEDILBERTO LAZGARE GAMARRA M 22 Aguascalientes
## 70 2156 ELIASIB SIL EDGAR M 50 Aguascalientes
## 111 3302 LORENZO DE JESUS GURROLA COMONFORT M 41 Aguascalientes
## 43 969 ERMELANDO SANTIZ VALE M 43 Aguascalientes
## 288 8874 ELVA ESTHER ARENIVAR VACA F 41 Aguascalientes
## 141 4115 JAIRO ANTONIO CAZARES CORTES M 45 Aguascalientes
## 256 8000 YADIRA JUDITH TODD PITA F 35 Aguascalientes
## 95 2803 EDGAR JAVIER M ALQUICIRA M 29 Aguascalientes
## 77 2394 LEVI ROSADO GONGORA M 38 Aguascalientes
## 129 3788 CHRISTIAN EDUARDO TORO LEA%OS M 20 Aguascalientes
## 166 4875 LUISANA ALCORCHA JAIN F 31 Aguascalientes
## 259 8069 MA. DOLORES ZAMORES ARPAIZ F 31 Aguascalientes
## 285 8844 BRENDA JUDITH ALGREDO AHUELICAN F 59 Aguascalientes
## 25 585 OLIVO MARENTES CUESTAS M 28 Aguascalientes
## 171 5131 MA. NORMA LICERIO CORAZA F 37 Aguascalientes
## 217 6855 DOLORES CECILIA TLATEMPA PELAYO F 33 Aguascalientes
## 107 3237 GUALBERTO ESTALA MENDIETA M 45 Aguascalientes
## 102 3034 JULIO MARTIN PALMERO MASS M 49 Aguascalientes
## 152 4347 MANUEL RODRIGO BUENFIL FLATCHER M 29 Aguascalientes
## 50 1217 JUAN CARLOS POMARES PILIADO M 18 Aguascalientes
## 263 9070 ROSA LILA COHUO QUEZADAS F 49 Baja California
## 136 4493 ERIC ALEJANDRO COSIO DELVAL M 55 Baja California
## 213 7344 YANETH ALEJANDRA ARCILA VIDRIO F 18 Baja California
## 13 470 CARLOS PAUL CALZADILLAS MENACHO M 57 Baja California
## 197 6779 SARA ELISA COLOTL SOSA F 33 Baja California
## 118 3857 OSCAR OSVALDO MILPAS SANDRIA M 44 Baja California
## 254 8714 JESSICA PAOLA FRANCO COSTEÑO F 37 Baja California
## 23 607 JESUS ALFREDO ANTA!O MAYORGA M 59 Baja California
## 68 2388 JORGE HORACIO ZARIÑANA MEMBRILA M 50 Baja California
## 244 8281 REYNA JUDITH SALDA%A MATANCILLAS F 53 Baja California
## 210 7311 SONIA ESMERALDA MENDIOLA CASARIN F 19 Baja California
## 42 1277 RANDY TETUAN TLAPANCO M 48 Baja California
## 1 1 GALILEO CARCAÑO SAMUDIO M 41 Baja California
## 214 7362 EMMA GRACIELA DECARO AVELLANEDA F 44 Baja California
## 31 891 MARTIN MIGUEL ARTALEJO URDIERA M 38 Baja California
## 60 2151 ADRIAN EDUARDO MIXTEGA SUENAGA M 59 Baja California
## 16 512 AMANDO VALLESTEROS XOCHITIOTZI M 44 Baja California
## 216 7397 CAROLA GALINDEZ BOCARANDO F 45 Baja California
## 26 712 CENOBIO ASCENCIO CAMAL M 31 Baja California
## 90 3129 CAROLINO DAGNINO LAZOS M 22 Durango
## 284 8362 MONICA EDITH ARRONA HAZA F 18 Durango
## 321 9638 MIRIAM ALICIA CARRIOLA VIDERIQUE F 60 Durango
## 296 8743 IRMA NOHEMI ANLEHU MURUATO F 50 Durango
## 271 8084 SERAFINA LANZAGORTA RIOFRIO F 29 Durango
## 300 8785 RUTH ELENA NAHUACATL ARICEAGA F 56 Durango
## 178 5680 BRENDA MARCELA CAHUARE HAZA F 53 Durango
## 205 6442 JESSICA ALEJANDRA ULLOA ZAMARRON F 46 Durango
## 48 1785 MARCO IVAN BROISSIN BERAIN M 20 Durango
## 20 908 LUIS HORACIO DEMEZA MATOS M 27 Durango
## 270 8067 SELENE ESMERALDA DE OLMOS DEL CARPIO F 50 Durango
## 1411 4693 IVANHOE JUVENAL SEL M 25 Durango
## 209 6531 ELVIRA ELIZABETH SUSUNAGA NIÏ¿½O F 36 Durango
## 94 3293 OFIR AYUP COCON M 42 Durango
## 109 3807 MIGUEL LUIS WALDO OAXACA M 49 Durango
## 103 3600 SAULO VILLADOBLE RONCES M 19 Durango
## 297 8748 CITLALY MATLALCOATL CORDERO F 29 Durango
## 40 1562 MARTIN ADRIAN BULNES CORDOBA M 54 Durango
## 283 8354 MA ROSALIA VIURQUIZ CHARLES F 31 Durango
## 99 3463 ANDRES HUMBERTO MERIDA FERRER M 43 Durango
## 258 7623 MARTHA DELIA ARREGUI OCON F 55 Durango
summary(muestraEstratificada)
## X nombre paterno materno genero
## Min. : 1 ADRIAN EDUARDO : 1 ALCORCHA: 1 HAZA : 2 F:27
## 1st Qu.:2388 ALVARO JESUS : 1 ALGREDO : 1 AHUELICAN : 1 M:34
## Median :4115 AMANDO : 1 ANLEHU : 1 ALQUICIRA : 1
## Mean :4755 ANDRES HUMBERTO: 1 ANTA!O : 1 ARICEAGA : 1
## 3rd Qu.:7623 BRENDA JUDITH : 1 ARCILA : 1 ARPAIZ : 1
## Max. :9638 BRENDA MARCELA : 1 ARENIVAR: 1 AVELLANEDA: 1
## (Other) :55 (Other) :55 (Other) :54
## edad entidad
## Min. :18.00 Aguascalientes :21
## 1st Qu.:29.00 Durango :21
## Median :41.00 Baja California :19
## Mean :39.38 Baja California Sur: 0
## 3rd Qu.:49.00 Campeche : 0
## Max. :60.00 Chiapas : 0
## (Other) : 0
print ("El último")
## [1] "El último"
#Pob.BajaCalifornia <- filter(datosOrdenados, entidad == "Baja California")
#Poblacion <- rbind(Pob.Aguascalientes, Pob.BajaCalifornia)
#kable(head(Poblacion))
#kable(tail(Poblacion))
#Poblacion
#N <- nrow(Poblacion) # La cantidad de datos de Aguscalientes y Baja California
#N
#n <- 100 # Tamaño de la muestra que se quiere tener ahorita es constante, no estadística
# Determinamos los % de cada estrato
#tabla.frecuencias <- data.frame(fdt_cat(x = Poblacion$entidad))
#tabla.frecuencias
#muestra1 <- sample(1:, 10, , replace = TRUE)
#muestra1