Las librerias
library(readr) # Leer datos
library(knitr) # Tablas amigables
library(fdth) # Crear tablas de distribucion
library(dplyr) # Select, filter, mutate, group
Cargar datos
La variable datos es una población Se requiere una muestra que es una parte proporcional y que representa a la población
datos <- read.csv("../Datos/personas.csv")
kable(head(datos))
| 1 |
ALFONSO ALBERTO |
Y ALONZO |
TEXON |
M |
48 |
Puebla |
| 2 |
ANGEL ARMANDO |
TEPATO |
VEYNA |
M |
49 |
Chihuahua |
| 3 |
J. MATILDE |
ZAMORANO |
MADUEÑO |
M |
28 |
Aguascalientes |
| 4 |
OSCAR GABRIEL |
MACEGOZA |
GERMES |
M |
40 |
Zacatecas |
| 5 |
PEDRO ROBERTO |
ARELLANES |
GURRION |
M |
31 |
Colima |
| 6 |
ISRAEL ANTONIO |
BUENAVENTURA |
PALOMO |
M |
42 |
Colima |
kable(tail(datos))
| 9995 |
9995 |
GLORIA DE LOS ANGELES |
TORREJON |
FERRARA |
F |
52 |
Chiapas |
| 9996 |
9996 |
MARIA CONCEPCIO |
PEÐALOZA |
CORIA |
F |
56 |
Quintana Roo |
| 9997 |
9997 |
EUDELIA |
SANDRA |
ALTUZAR |
F |
43 |
Chiapas |
| 9998 |
9998 |
LETICIA MAGDALENA |
TAGLE |
RIESTRA |
F |
58 |
México |
| 9999 |
9999 |
MARTHA SOCORRO |
LULE |
RODRÍGUEZ |
F |
55 |
Quintana Roo |
| 10000 |
10000 |
FRANCISCA GUADALUPE |
DE LA PARRA |
SANMARTIN |
F |
57 |
Querétaro |
Estadisticos descriptivos
summary(datos)
## X nombre paterno materno
## Min. : 1 Length:10000 Length:10000 Length:10000
## 1st Qu.: 2501 Class :character Class :character Class :character
## Median : 5000 Mode :character Mode :character Mode :character
## Mean : 5000
## 3rd Qu.: 7500
## Max. :10000
## genero edad entidad
## Length:10000 Min. :18.00 Length:10000
## Class :character 1st Qu.:28.00 Class :character
## Mode :character Median :39.00 Mode :character
## Mean :38.99
## 3rd Qu.:50.00
## Max. :60.00
Valor N cantidad de registros de la pobación
N <- nrow(datos) # Cantidad de datos
Muestreo aleatorio simple
- Primero una muestra simple a partir de una pobación de \(100\), generar una muestra de \(15\) registros a partir de datos
- Segundo una muestra de los \(N=10000\) registros de la población datos
- Se muestran los primeros 10 y últimos 10
set.seed(2020)
# Primero
N <- nrow(datos) # La población
n <- 15 # La muestra
muestra <- sample(1:N, n, replace = FALSE)
muestra
## [1] 9628 9452 7767 8920 4417 8465 9380 170 7878 945 4992 2602 3062 1053 5104
muestra.Simple <- datos[muestra, ]
muestra.Simple
## X nombre paterno materno genero edad entidad
## 9628 9628 HAYDE GUADALUPE MOGOLLAN FAVILA F 45 Guerrero
## 9452 9452 ISABEL CRISTI LINAS ESTEVES F 35 Ciudad de México
## 7767 7767 MARIA SOC XIU ROBLERO F 55 Sonora
## 8920 8920 CYNTHIA JUDITH COLESIO ARTIGAS F 33 Guerrero
## 4417 4417 ALEXANDRO MELCHOR FELIPILLO M 41 Oaxaca
## 8465 8465 ALMA JANET EUSTAQUIO AGUILUZ F 48 Tabasco
## 9380 9380 DIANA ROCIO QUI ZERMENO F 37 Chihuahua
## 170 170 HERBEY ESCUTIA REMENTERIA M 60 Jalisco
## 7878 7878 MARIA AGUEDA TEPANCAL TOSTADO F 57 Zacatecas
## 945 945 ALBERTO JESUS FLOREAN CAZARIN M 22 Durango
## 4992 4992 NEYVI MARURE PORTILLO F 31 Hidalgo
## 2602 2602 FRANCISCO JULIAN OLIVARES PLOMOSO M 50 Michoacán de Ocampo
## 3062 3062 JOSE DE LUJAN MANRIQUE M 52 Baja California Sur
## 1053 1053 FERNEL Y CANUL CANAS M 27 Yucatán
## 5104 5104 YESENIA AZCORRA BERMEJO F 44 Aguascalientes
# Segundo
n <- 625
muestra <- sample(N, n, replace = FALSE)
# Ya no visualizamos muestra, ... son muchos ...
muestra.Simple <- datos[muestra, ]
# Mostramos los primeros y los últimos registros
kable(head(muestra.Simple,10))
| 4483 |
4483 |
BULFRANO |
CHARCO |
EPITACIO |
M |
21 |
Baja California |
| 8797 |
8797 |
ROCIO BEATRIZ |
CANSECO |
ARANZA |
F |
21 |
Sonora |
| 6888 |
6888 |
LOIDA |
VANEGAS |
ISORDIA |
F |
20 |
Sonora |
| 3662 |
3662 |
JESUS HERIBERTO |
ARCURI |
OLIDEN |
M |
23 |
San Luis Potosí |
| 4684 |
4684 |
EDGAR AUGUSTO |
CHINCHILLAS |
CLARO |
M |
44 |
Campeche |
| 78 |
78 |
JOSE GONZALO |
RICARDO |
MAGDALENO |
M |
19 |
México |
| 7687 |
7687 |
MINERVA EDITH |
ZEFERINO |
VITAL |
F |
47 |
Colima |
| 724 |
724 |
JESUS ORLANDO |
PATINO |
ORDU!A |
M |
45 |
Guanajuato |
| 1524 |
1524 |
LUCIO ARTURO |
GURRUSQUIETA |
CARPINTEYRO |
M |
42 |
Nuevo León |
| 7468 |
7468 |
MAYRA CAROLINA |
NADAL |
SANCEN |
F |
53 |
Baja California |
kable(tail(muestra.Simple,10))
| 797 |
797 |
FRANCISCO MANUEL |
BEAR |
VALLESTEROS |
M |
35 |
Veracruz de Ignacio de la Llave |
| 5609 |
5609 |
ESTANISLADA |
BADAL |
CHAPULA |
F |
49 |
Sinaloa |
| 8295 |
8295 |
LOURDES NOEMI |
CANCELA |
ASTELLO |
F |
59 |
Jalisco |
| 2911 |
2911 |
ERIK DE JESUS |
LIVAS |
GANZO |
M |
26 |
Nuevo León |
| 5517 |
5517 |
ROCIO |
BALMACEDA |
BUENAVENTURA |
F |
52 |
Hidalgo |
| 4600 |
4600 |
GUSTAVO ENRIQUE |
HUITZIL |
COCOLETZI |
M |
54 |
Durango |
| 2085 |
2085 |
PEDRO PASCUAL |
TOVIAS |
PERALTA |
M |
47 |
Nuevo León |
| 4365 |
4365 |
GERARDO ANTONIO |
DIONICIO |
MIRANDA |
M |
57 |
Querétaro |
| 1228 |
1228 |
JORGE ERIK |
GOCHEZ |
URIEGAS |
M |
36 |
Guerrero |
| 8302 |
8302 |
GINA |
LEA%OS |
CANIZAL |
F |
38 |
Veracruz de Ignacio de la Llave |
Muestreo aleatorio sistematizado
- Pimero una muestra aleatoria sistematizada a partir de una pobación de 100, generar una muestra que inicie en 5 con saltos de 7 en 7 a partir de datos
- Segundo una muestra que inicie en 37 de 60 en 60 de 10000 registros de la población datos
- Se muestran los primeros 10 y últimos 10
set.seed(2020)
# Primero
muestra <- seq(from = 5, to = 100, by = 7)
muestra
## [1] 5 12 19 26 33 40 47 54 61 68 75 82 89 96
muestra.Simple <- datos[muestra, ]
muestra.Simple
## X nombre paterno materno genero edad
## 5 5 PEDRO ROBERTO ARELLANES GURRION M 31
## 12 12 QUINTIN VICARIO CANSECO M 58
## 19 19 RUBICEL CALAM GOYCOCHEA M 43
## 26 26 JESUS ARNULFO ELGUERA VILLADOBLE M 46
## 33 33 JESUS MANU DE ANDA TAMAY M 46
## 40 40 SERGIO EDUARDO CATANO LLANOS M 57
## 47 47 JOSE BARTOLO PENILLA COY M 18
## 54 54 LUIS ENRIQUE FLORENCIA PERFECTO M 54
## 61 61 ANTONIO CARLOS CEBRIAN DEL CARMEN M 47
## 68 68 ISIDORO QUIRARTE ARRUEL M 49
## 75 75 DAVID SALVADOR HELGUERA ATRISCO M 48
## 82 82 EDGAR JOEL DE PAZ FRANYUTTI M 37
## 89 89 DESIDERIO BARTOLOME AZPILCUETA M 41
## 96 96 J. LUZ BERRA CERECER M 50
## entidad
## 5 Colima
## 12 San Luis Potosí
## 19 Veracruz de Ignacio de la Llave
## 26 Querétaro
## 33 Baja California Sur
## 40 Michoacán de Ocampo
## 47 Baja California
## 54 Zacatecas
## 61 Chihuahua
## 68 Coahuila de Zaragoza
## 75 Nayarit
## 82 Chiapas
## 89 Campeche
## 96 Yucatán
# Segundo
muestra <- seq(from = 37, to = N, by = 60)
# Ya no visualizamos muestra, son muchos ... ...
poblacion <- datos # Sinónimo
muestra.Sistematizada <- datos[muestra, ] # [Filas, Columas]
# Mostramos los primeros y los últimos registros
kable(head(muestra.Sistematizada,10))
| 37 |
37 |
RAUL ROBERTO |
TIERRA |
RAMÍREZ |
M |
51 |
Colima |
| 97 |
97 |
ANICETO |
AZNAR |
GERONIMO |
M |
29 |
Sonora |
| 157 |
157 |
MARIO GILBERTO |
MONTES DE OCA |
SOUZA |
M |
45 |
Nuevo León |
| 217 |
217 |
CARLOS MIGUEL |
NOVELO |
AVENDAÏ¿½O |
M |
38 |
Tlaxcala |
| 277 |
277 |
MARCOS JOSE |
CITAL |
LLERENA |
M |
33 |
Chiapas |
| 337 |
337 |
ISRAEL |
PASILLAS |
PE!ALOZA |
M |
49 |
Puebla |
| 397 |
397 |
FRANCISCO AARON |
TEXIS |
LAZALDE |
M |
41 |
Chihuahua |
| 457 |
457 |
GUSTAVO DE JESUS |
PAREDEZ |
MIGUELES |
M |
31 |
Baja California Sur |
| 517 |
517 |
HAMLET |
TEXIS |
DE ELIGIO |
M |
52 |
Aguascalientes |
| 577 |
577 |
JOSE FRANCISCO |
ZI |
LESCIEUR |
M |
32 |
Oaxaca |
kable(tail(muestra.Sistematizada,10))
| 9457 |
9457 |
MARTA OLIVIA |
GERVASIO |
CAYETANO |
F |
25 |
Guanajuato |
| 9517 |
9517 |
IRASEMA |
AGAPITO |
RONDERO |
F |
18 |
Aguascalientes |
| 9577 |
9577 |
BENIGNA |
VITALES |
BON |
F |
38 |
Tlaxcala |
| 9637 |
9637 |
ROSA LILA |
HUIPE |
SUSUNAGA |
F |
39 |
Yucatán |
| 9697 |
9697 |
LUCIA MARIBEL |
TUZ |
GUITRON |
F |
50 |
Chihuahua |
| 9757 |
9757 |
REYNA DEL CARMEN |
VALENCIANA |
ALCAUTER |
F |
25 |
Quintana Roo |
| 9817 |
9817 |
PALOMA |
SANZON |
PALEMONTE |
F |
32 |
Veracruz de Ignacio de la Llave |
| 9877 |
9877 |
LAURA DANIELA |
BALMES |
BREÑA |
F |
54 |
Baja California |
| 9937 |
9937 |
CLAUDIA IBET |
MUÐOZ |
ARAGONEZ |
F |
29 |
Veracruz de Ignacio de la Llave |
| 9997 |
9997 |
EUDELIA |
SANDRA |
ALTUZAR |
F |
43 |
Chiapas |
Muestreo Aleatorio Estratificado
- Estratos = Entidades
- Determinar que % hay de cada entidad en datos
- Ya se conocen, en el anterior bloque, las frecuencias por medio de la funcion summary()
tabla.frecuencias <- data.frame(fdt_cat(x = datos$entidad))
tabla.frecuencias # Sin ordenar por entidad, pero están ordendas por frecuencia f
## Category f rf rf... cf cf...
## 1 Sonora 342 0.0342 3.42 342 3.42
## 2 México 333 0.0333 3.33 675 6.75
## 3 Quintana Roo 333 0.0333 3.33 1008 10.08
## 4 Chiapas 332 0.0332 3.32 1340 13.40
## 5 Baja California 331 0.0331 3.31 1671 16.71
## 6 Jalisco 330 0.0330 3.30 2001 20.01
## 7 Ciudad de México 328 0.0328 3.28 2329 23.29
## 8 Baja California Sur 327 0.0327 3.27 2656 26.56
## 9 Zacatecas 326 0.0326 3.26 2982 29.82
## 10 Nuevo León 325 0.0325 3.25 3307 33.07
## 11 Sinaloa 325 0.0325 3.25 3632 36.32
## 12 Oaxaca 323 0.0323 3.23 3955 39.55
## 13 Guanajuato 319 0.0319 3.19 4274 42.74
## 14 Querétaro 319 0.0319 3.19 4593 45.93
## 15 Durango 318 0.0318 3.18 4911 49.11
## 16 Campeche 317 0.0317 3.17 5228 52.28
## 17 Chihuahua 314 0.0314 3.14 5542 55.42
## 18 Tamaulipas 312 0.0312 3.12 5854 58.54
## 19 Aguascalientes 311 0.0311 3.11 6165 61.65
## 20 Morelos 311 0.0311 3.11 6476 64.76
## 21 Tlaxcala 307 0.0307 3.07 6783 67.83
## 22 Hidalgo 306 0.0306 3.06 7089 70.89
## 23 Coahuila de Zaragoza 303 0.0303 3.03 7392 73.92
## 24 Guerrero 303 0.0303 3.03 7695 76.95
## 25 Michoacán de Ocampo 300 0.0300 3.00 7995 79.95
## 26 Nayarit 299 0.0299 2.99 8294 82.94
## 27 Yucatán 295 0.0295 2.95 8589 85.89
## 28 Puebla 292 0.0292 2.92 8881 88.81
## 29 Colima 290 0.0290 2.90 9171 91.71
## 30 San Luis Potosí 282 0.0282 2.82 9453 94.53
## 31 Veracruz de Ignacio de la Llave 281 0.0281 2.81 9734 97.34
## 32 Tabasco 266 0.0266 2.66 10000 100.00
colnames(tabla.frecuencias) <- c("categoria", "frec", "frec.rel", "frec.porc", "frec.acum", "frec.rel.acum") # Los nombres de las columnas
tabla.frecuencias # Ya están ordenadas por categoria, es decir por entidad
## categoria frec frec.rel frec.porc frec.acum
## 1 Sonora 342 0.0342 3.42 342
## 2 México 333 0.0333 3.33 675
## 3 Quintana Roo 333 0.0333 3.33 1008
## 4 Chiapas 332 0.0332 3.32 1340
## 5 Baja California 331 0.0331 3.31 1671
## 6 Jalisco 330 0.0330 3.30 2001
## 7 Ciudad de México 328 0.0328 3.28 2329
## 8 Baja California Sur 327 0.0327 3.27 2656
## 9 Zacatecas 326 0.0326 3.26 2982
## 10 Nuevo León 325 0.0325 3.25 3307
## 11 Sinaloa 325 0.0325 3.25 3632
## 12 Oaxaca 323 0.0323 3.23 3955
## 13 Guanajuato 319 0.0319 3.19 4274
## 14 Querétaro 319 0.0319 3.19 4593
## 15 Durango 318 0.0318 3.18 4911
## 16 Campeche 317 0.0317 3.17 5228
## 17 Chihuahua 314 0.0314 3.14 5542
## 18 Tamaulipas 312 0.0312 3.12 5854
## 19 Aguascalientes 311 0.0311 3.11 6165
## 20 Morelos 311 0.0311 3.11 6476
## 21 Tlaxcala 307 0.0307 3.07 6783
## 22 Hidalgo 306 0.0306 3.06 7089
## 23 Coahuila de Zaragoza 303 0.0303 3.03 7392
## 24 Guerrero 303 0.0303 3.03 7695
## 25 Michoacán de Ocampo 300 0.0300 3.00 7995
## 26 Nayarit 299 0.0299 2.99 8294
## 27 Yucatán 295 0.0295 2.95 8589
## 28 Puebla 292 0.0292 2.92 8881
## 29 Colima 290 0.0290 2.90 9171
## 30 San Luis Potosí 282 0.0282 2.82 9453
## 31 Veracruz de Ignacio de la Llave 281 0.0281 2.81 9734
## 32 Tabasco 266 0.0266 2.66 10000
## frec.rel.acum
## 1 3.42
## 2 6.75
## 3 10.08
## 4 13.40
## 5 16.71
## 6 20.01
## 7 23.29
## 8 26.56
## 9 29.82
## 10 33.07
## 11 36.32
## 12 39.55
## 13 42.74
## 14 45.93
## 15 49.11
## 16 52.28
## 17 55.42
## 18 58.54
## 19 61.65
## 20 64.76
## 21 67.83
## 22 70.89
## 23 73.92
## 24 76.95
## 25 79.95
## 26 82.94
## 27 85.89
## 28 88.81
## 29 91.71
## 30 94.53
## 31 97.34
## 32 100.00
- La variable entidad es el estrato para determinar la muestra
- En el valor de la variable tabla.frecuencias$frec.rel y frec.rel.porc, están los porcentajes específicos que le corresponden a cada estrato para determinar la muestra conforme CADA ENTIDAD
- categoria frec frec.rel frec.porc
- Aguascalientes 323 0.0323 3.23 …
- Baja California 295 0.0295 2.95 …
- Baja California Sur 327 0.0327 3.27 …
- …
- …
- Durango 332 0.0332 3.32
- …
- …
- Veracruz de … 311 0.0311 3.11
- Yucatán 306 0.0306 3.06
- Zacatecas 323 0.0323 3.23
Ordenar los datos
Ordenar los datos por estrato, es decir por entidades
- Se utiliza la función arrange() de la librería dplyr previamente cargada.
datosOrdenados <- datos %>%
arrange(entidad)
kable(head(datosOrdenados))
| 3 |
J. MATILDE |
ZAMORANO |
MADUEÑO |
M |
28 |
Aguascalientes |
| 91 |
JOEL ARTURO |
CHIRINOS |
BILBAO |
M |
30 |
Aguascalientes |
| 109 |
GERARDO ALEJANDRO |
COPALCUA |
SEYNOS |
M |
54 |
Aguascalientes |
| 127 |
JOSE ALFRED |
ARROCENA |
CAO |
M |
28 |
Aguascalientes |
| 169 |
ERWIN |
BAZALDUA |
VALLADOLID |
M |
47 |
Aguascalientes |
| 197 |
GUZMAN |
FUERTE |
BA!UELOS |
M |
28 |
Aguascalientes |
kable(tail(datosOrdenados))
| 9995 |
9855 |
FLORA MARIA |
MINO |
CORCHADO |
F |
49 |
Zacatecas |
| 9996 |
9863 |
DIANA VIANEY |
DURANTE |
ONOFRE |
F |
58 |
Zacatecas |
| 9997 |
9898 |
BRENDA LIZZETH |
PALAFOX |
DEHARA |
F |
41 |
Zacatecas |
| 9998 |
9930 |
ANA BERTHA |
HOYOS |
RUBALCABA |
F |
60 |
Zacatecas |
| 9999 |
9938 |
EVA LILIANA |
RODRIGO |
FERTO |
F |
60 |
Zacatecas |
| 10000 |
9993 |
LISSETT |
AYIL |
IBAÑEZ |
F |
29 |
Zacatecas |
Determinar una muestra de 10 para tres estratos
- Aguascalientes, Baja California y Durango
- Se determina una población de cada Estrato: Aguascalientes, Baja California y Durango
- Se sacan una muestra de 10 para cada estrato
- Se genera la muestra de cada estrato
- Se une con rbind() para conformar el muestreo estratificado
# Aguascalientes
Pob.Aguascalientes <- filter(datos, entidad == "Aguascalientes")
N <- nrow(Pob.Aguascalientes)
N
## [1] 311
n <- 10
muestraAguas <- sample(1:N, n, replace = FALSE)
muestraAguas
## [1] 236 87 22 216 273 164 170 198 109 56
muestreo.Estrati.Agu <- Pob.Aguascalientes[muestraAguas, ] # solo son de Agauscalientes
muestreo.Estrati.Agu
## X nombre paterno materno genero edad entidad
## 236 7322 VERONICA DEL CARMEN MUGICA VALSECA F 55 Aguascalientes
## 87 3107 FRANCISCO JAIME RGUEZ NAHUATLATO M 40 Aguascalientes
## 22 671 DAVID SALVADOR RONDEROS DESALES M 43 Aguascalientes
## 216 6856 ALMA SOCORRO MINA ROMUALDO F 40 Aguascalientes
## 273 8474 DULCE PATRICIA SALASAR LLOVERA F 32 Aguascalientes
## 164 5379 GLORIA EDITH PUON COLUNGA F 44 Aguascalientes
## 170 5478 BLANCA KARINA SALMERON DESIRENA F 52 Aguascalientes
## 198 6481 JUANA IGNACIA PIÑEIRO UITZ F 29 Aguascalientes
## 109 3844 ANTONIO JAVIER BOA GUDIN M 46 Aguascalientes
## 56 2129 JOSE FRANCI CANTUA MELQUIADES M 45 Aguascalientes
# Baja California
Pob.BajaCalifornia <- filter(datos, entidad == "Baja California")
N <- nrow(Pob.BajaCalifornia)
N
## [1] 331
muestraBC <- sample(1:N, 10, replace = FALSE)
muestraBC
## [1] 200 42 29 98 322 93 120 232 78 206
muestreo.Estrati.BC <- Pob.BajaCalifornia[muestraBC, ] # solo son de BC
muestreo.Estrati.BC
## X nombre paterno materno genero edad entidad
## 200 6218 MINERVA ALICIA TEXIS TOSCUENTO F 55 Baja California
## 42 1202 JESUS FRANCISCO PRIMERO ALCIVAR M 28 Baja California
## 29 859 RAUL SANTIAGO GORGONIO H M 25 Baja California
## 98 2830 MARTIN ALFREDO DEL CASTILLO CARMEN M 26 Baja California
## 322 9669 BLANCA DEL CARMEN MARINELARENA INTERIAN F 27 Baja California
## 93 2588 PABLO ZENTENO CALTENCO M 51 Baja California
## 120 3299 ANDRES MARTIN SALDA#A DEL OLMO M 51 Baja California
## 232 7015 ROSA DALIA LACES ELIZALDE F 41 Baja California
## 78 2082 JOSUE FRANCISCO PALAPA SARRACINO M 44 Baja California
## 206 6343 VICTOR MANUEL CASTOR NEBUAY F 43 Baja California
# Durango
Pob.Durango <- filter(datos, entidad == "Durango")
N <- nrow(Pob.Durango)
N
## [1] 318
muestraDgo <- sample(1:N, 10, replace = FALSE)
muestraDgo
## [1] 76 176 175 78 7 212 274 213 52 300
muestreo.Estrati.Dgo <- Pob.Durango[muestraDgo, ] # solo son de Dgo
muestreo.Estrati.Dgo
## X nombre paterno materno genero edad entidad
## 76 2417 JUAN GUSTAVO DIRCIO MODESTO M 60 Durango
## 176 5615 MARTINA DEL SOCORRO MINOR YERA F 18 Durango
## 175 5602 CARMEN CECILIA IRABIEN VICTORIA F 24 Durango
## 78 2507 OSCAR VICTOR VELUETA VIGUERIA M 25 Durango
## 7 188 ANCELMO MAYCOTTE AGUEDA M 20 Durango
## 212 6887 MARIA OTILIA MADA BRETADO F 31 Durango
## 274 8494 JULIA ELENA TAFOLLA TEJERO F 45 Durango
## 213 6926 CLEMENCIA CINTORA VICENCIO F 42 Durango
## 52 1480 VICTOR AURELIO VIZUETH AQUILES M 55 Durango
## 300 9505 LAURA ALEJANDRA A TLATILPA F 42 Durango
# Unir las tres muestras en una sola con rbind()
muestraEstratificada <- rbind(muestreo.Estrati.Agu, muestreo.Estrati.BC, muestreo.Estrati.Dgo)
muestraEstratificada # Son 10 + 10 + 10 = 30 registros;10 de cada estrato
## X nombre paterno materno genero edad
## 236 7322 VERONICA DEL CARMEN MUGICA VALSECA F 55
## 87 3107 FRANCISCO JAIME RGUEZ NAHUATLATO M 40
## 22 671 DAVID SALVADOR RONDEROS DESALES M 43
## 216 6856 ALMA SOCORRO MINA ROMUALDO F 40
## 273 8474 DULCE PATRICIA SALASAR LLOVERA F 32
## 164 5379 GLORIA EDITH PUON COLUNGA F 44
## 170 5478 BLANCA KARINA SALMERON DESIRENA F 52
## 198 6481 JUANA IGNACIA PIÑEIRO UITZ F 29
## 109 3844 ANTONIO JAVIER BOA GUDIN M 46
## 56 2129 JOSE FRANCI CANTUA MELQUIADES M 45
## 200 6218 MINERVA ALICIA TEXIS TOSCUENTO F 55
## 42 1202 JESUS FRANCISCO PRIMERO ALCIVAR M 28
## 29 859 RAUL SANTIAGO GORGONIO H M 25
## 98 2830 MARTIN ALFREDO DEL CASTILLO CARMEN M 26
## 322 9669 BLANCA DEL CARMEN MARINELARENA INTERIAN F 27
## 93 2588 PABLO ZENTENO CALTENCO M 51
## 120 3299 ANDRES MARTIN SALDA#A DEL OLMO M 51
## 232 7015 ROSA DALIA LACES ELIZALDE F 41
## 78 2082 JOSUE FRANCISCO PALAPA SARRACINO M 44
## 206 6343 VICTOR MANUEL CASTOR NEBUAY F 43
## 76 2417 JUAN GUSTAVO DIRCIO MODESTO M 60
## 176 5615 MARTINA DEL SOCORRO MINOR YERA F 18
## 175 5602 CARMEN CECILIA IRABIEN VICTORIA F 24
## 781 2507 OSCAR VICTOR VELUETA VIGUERIA M 25
## 7 188 ANCELMO MAYCOTTE AGUEDA M 20
## 212 6887 MARIA OTILIA MADA BRETADO F 31
## 274 8494 JULIA ELENA TAFOLLA TEJERO F 45
## 213 6926 CLEMENCIA CINTORA VICENCIO F 42
## 52 1480 VICTOR AURELIO VIZUETH AQUILES M 55
## 300 9505 LAURA ALEJANDRA A TLATILPA F 42
## entidad
## 236 Aguascalientes
## 87 Aguascalientes
## 22 Aguascalientes
## 216 Aguascalientes
## 273 Aguascalientes
## 164 Aguascalientes
## 170 Aguascalientes
## 198 Aguascalientes
## 109 Aguascalientes
## 56 Aguascalientes
## 200 Baja California
## 42 Baja California
## 29 Baja California
## 98 Baja California
## 322 Baja California
## 93 Baja California
## 120 Baja California
## 232 Baja California
## 78 Baja California
## 206 Baja California
## 76 Durango
## 176 Durango
## 175 Durango
## 781 Durango
## 7 Durango
## 212 Durango
## 274 Durango
## 213 Durango
## 52 Durango
## 300 Durango
Determinar una muestra de 625 para tres estratos DE ACUERDO A SU REPRESENTATIVIDAD en los datos de toda la Población
- Aguascalientes, Baja California y Durango
- Se determina una población de cada Estrato: Aguascalientes, Baja California y Durango
- Se sacan una muestra de 625 para cada estrato multiplicado por su REPRESENTATIVIDAD DEL TOTAL DE LA POBLACIÓN
- categori frec frec.rel frec.porc
- Aguascalientes 323 0.0323 3.23 …
- Baja California 295 0.0295 2.95 …
- Durango 332 0.0332 3.32
- Se genera la muestra DE CADA ESTRATO
- Se une con rbind() para conformar el muestreo estratificado
# Aguascalientes
Pob.Aguascalientes <- filter(datos, entidad == "Aguascalientes")
N <- nrow(Pob.Aguascalientes)
N # Tamaño de cada subploblación
## [1] 311
n <- 625 # Tamaño de la muestra
muestraAguas <- sample(1:N, ceiling(625 * 0.0323), replace = FALSE)
muestraAguas
## [1] 123 82 138 70 111 43 288 141 256 95 77 129 166 259 285 25 171 217 107
## [20] 102 152
# Baja California
Pob.BajaCalifornia <- filter(datos, entidad == "Baja California")
N <- nrow(Pob.BajaCalifornia)
N
## [1] 331
muestraBC <- sample(1:N, ceiling(n * 0.0295), replace = FALSE)
muestraBC
## [1] 50 263 136 213 13 197 118 324 254 23 68 244 210 42 1 214 31 60 16
muestreo.Estrati.BC <- Pob.BajaCalifornia[muestraBC, ] # solo son de BC
muestreo.Estrati.BC
## X nombre paterno materno genero edad entidad
## 50 1341 JUAN HUMBERTO ESCARPULLI ABUNDEZ M 18 Baja California
## 263 8104 MARIA DEL RO BAXIN URESTI F 47 Baja California
## 136 3814 LUIS ANTONI ALTO XOCHITIOTZI M 26 Baja California
## 213 6574 HORTENSIA ZENTENO CHOLULA F 49 Baja California
## 13 401 MARTIN OSCAR CALTZONTZI ANCHEVIDA M 57 Baja California
## 197 6033 LUZ GUADALUPE TISCAREÑO CAUDANA F 54 Baja California
## 118 3247 JOSE HIRAM VILLALOBOS MANDUJANO M 56 Baja California
## 324 9819 MIRIAM FABIOLA HOIL YAÏ¿½EZ F 56 Baja California
## 254 7806 MARIA S PINON SOBERANIS F 38 Baja California
## 23 770 JUAN VALENTIN ROEL BOLAÏ¿½OS M 43 Baja California
## 68 1781 MANUEL DE JE SEIS CECEÑA M 47 Baja California
## 244 7531 TEODORA DAVALOS DEANDA F 35 Baja California
## 210 6464 DULCE SOLEDAD IROLA ITZA F 37 Baja California
## 42 1202 JESUS FRANCISCO PRIMERO ALCIVAR M 28 Baja California
## 1 9 CRUZ ARMANDO TIZATL AHUMADA M 52 Baja California
## 214 6575 MARIA ALMENDRA DIRCIO XOCHICALE F 45 Baja California
## 31 936 JULIO ENRIQUE PANDO ESCAREÑO M 47 Baja California
## 60 1591 BLADIMIR BAXIN MEX M 28 Baja California
## 16 533 EDU OLIVE SANTARROSA M 26 Baja California
# Durango
Pob.Durango <- filter(datos, entidad == "Durango")
N <- nrow(Pob.Durango)
N
## [1] 318
muestraDgo <- sample(1:N, ceiling(n * 0.0332), replace = FALSE)
muestraDgo
## [1] 216 311 26 90 284 296 271 300 178 205 48 20 270 141 209 94 109 103 297
## [20] 40 283
muestreo.Estrati.Dgo <- Pob.Durango[muestraDgo, ] # solo son de Dgo
muestreo.Estrati.Dgo
## X nombre paterno materno genero edad entidad
## 216 7145 ANA BEATRIZ REYEZ ESCOPINICHI F 20 Durango
## 311 9801 ELBA ESTHER RETES CHAGOLLA F 32 Durango
## 26 586 SEIN IX CARLIN M 20 Durango
## 90 2927 ALEJANDRO ENRIQUE TECOCOATZI CISNEROS M 43 Durango
## 284 9014 MAVEL GERTRUDES NICANOR F 36 Durango
## 296 9366 LEONILA ARZALUZ ZOLOETA F 33 Durango
## 271 8429 GRETHEL CALLEJO FORNES F 18 Durango
## 300 9505 LAURA ALEJANDRA A TLATILPA F 42 Durango
## 178 5655 OLGA LIVIA RILEY QUIJANO F 52 Durango
## 205 6503 LIZZETE MONCIVAIS CHIRIVISTA F 19 Durango
## 48 1352 MARCELO EVANS RETANO M 44 Durango
## 20 466 HERVEY CATAÑO REGIN M 48 Durango
## 270 8426 JEMIMA BETANZO ALMADA F 45 Durango
## 141 4615 CELIN REYNALDO MONARCA M 38 Durango
## 209 6634 BRENDA SUJEY CELIZ ESCARRAMAN F 55 Durango
## 94 3010 JESUS HORACIO ELGUEA NANGULARI M 58 Durango
## 109 3333 IVAN ANTONIO MANILA KUMAN M 60 Durango
## 103 3227 ANTONIO ERNESTO CERDAN JARALEÑO M 47 Durango
## 297 9404 BLANCA SONIA MACUITL FLORENCIA F 21 Durango
## 40 1153 SERGIO JESUS NUNCIO ESTOPIER M 44 Durango
## 283 9011 YADIRA CONSUELO BRICEÑO F 41 Durango
# Unir las tres muestras en una sola con rbind()
muestraEstratificada <- rbind(muestreo.Estrati.Agu, muestreo.Estrati.BC, muestreo.Estrati.Dgo)
muestraEstratificada # Son ¿ cuántos registros? .
## X nombre paterno materno genero edad
## 236 7322 VERONICA DEL CARMEN MUGICA VALSECA F 55
## 87 3107 FRANCISCO JAIME RGUEZ NAHUATLATO M 40
## 22 671 DAVID SALVADOR RONDEROS DESALES M 43
## 216 6856 ALMA SOCORRO MINA ROMUALDO F 40
## 273 8474 DULCE PATRICIA SALASAR LLOVERA F 32
## 164 5379 GLORIA EDITH PUON COLUNGA F 44
## 170 5478 BLANCA KARINA SALMERON DESIRENA F 52
## 198 6481 JUANA IGNACIA PIÑEIRO UITZ F 29
## 109 3844 ANTONIO JAVIER BOA GUDIN M 46
## 56 2129 JOSE FRANCI CANTUA MELQUIADES M 45
## 50 1341 JUAN HUMBERTO ESCARPULLI ABUNDEZ M 18
## 263 8104 MARIA DEL RO BAXIN URESTI F 47
## 136 3814 LUIS ANTONI ALTO XOCHITIOTZI M 26
## 213 6574 HORTENSIA ZENTENO CHOLULA F 49
## 13 401 MARTIN OSCAR CALTZONTZI ANCHEVIDA M 57
## 197 6033 LUZ GUADALUPE TISCAREÑO CAUDANA F 54
## 118 3247 JOSE HIRAM VILLALOBOS MANDUJANO M 56
## 324 9819 MIRIAM FABIOLA HOIL YAÏ¿½EZ F 56
## 254 7806 MARIA S PINON SOBERANIS F 38
## 23 770 JUAN VALENTIN ROEL BOLAÏ¿½OS M 43
## 68 1781 MANUEL DE JE SEIS CECEÑA M 47
## 244 7531 TEODORA DAVALOS DEANDA F 35
## 210 6464 DULCE SOLEDAD IROLA ITZA F 37
## 42 1202 JESUS FRANCISCO PRIMERO ALCIVAR M 28
## 1 9 CRUZ ARMANDO TIZATL AHUMADA M 52
## 214 6575 MARIA ALMENDRA DIRCIO XOCHICALE F 45
## 31 936 JULIO ENRIQUE PANDO ESCAREÑO M 47
## 60 1591 BLADIMIR BAXIN MEX M 28
## 16 533 EDU OLIVE SANTARROSA M 26
## 2161 7145 ANA BEATRIZ REYEZ ESCOPINICHI F 20
## 311 9801 ELBA ESTHER RETES CHAGOLLA F 32
## 26 586 SEIN IX CARLIN M 20
## 90 2927 ALEJANDRO ENRIQUE TECOCOATZI CISNEROS M 43
## 284 9014 MAVEL GERTRUDES NICANOR F 36
## 296 9366 LEONILA ARZALUZ ZOLOETA F 33
## 271 8429 GRETHEL CALLEJO FORNES F 18
## 300 9505 LAURA ALEJANDRA A TLATILPA F 42
## 178 5655 OLGA LIVIA RILEY QUIJANO F 52
## 205 6503 LIZZETE MONCIVAIS CHIRIVISTA F 19
## 48 1352 MARCELO EVANS RETANO M 44
## 20 466 HERVEY CATAÑO REGIN M 48
## 270 8426 JEMIMA BETANZO ALMADA F 45
## 141 4615 CELIN REYNALDO MONARCA M 38
## 209 6634 BRENDA SUJEY CELIZ ESCARRAMAN F 55
## 94 3010 JESUS HORACIO ELGUEA NANGULARI M 58
## 1091 3333 IVAN ANTONIO MANILA KUMAN M 60
## 103 3227 ANTONIO ERNESTO CERDAN JARALEÑO M 47
## 297 9404 BLANCA SONIA MACUITL FLORENCIA F 21
## 40 1153 SERGIO JESUS NUNCIO ESTOPIER M 44
## 283 9011 YADIRA CONSUELO BRICEÑO F 41
## entidad
## 236 Aguascalientes
## 87 Aguascalientes
## 22 Aguascalientes
## 216 Aguascalientes
## 273 Aguascalientes
## 164 Aguascalientes
## 170 Aguascalientes
## 198 Aguascalientes
## 109 Aguascalientes
## 56 Aguascalientes
## 50 Baja California
## 263 Baja California
## 136 Baja California
## 213 Baja California
## 13 Baja California
## 197 Baja California
## 118 Baja California
## 324 Baja California
## 254 Baja California
## 23 Baja California
## 68 Baja California
## 244 Baja California
## 210 Baja California
## 42 Baja California
## 1 Baja California
## 214 Baja California
## 31 Baja California
## 60 Baja California
## 16 Baja California
## 2161 Durango
## 311 Durango
## 26 Durango
## 90 Durango
## 284 Durango
## 296 Durango
## 271 Durango
## 300 Durango
## 178 Durango
## 205 Durango
## 48 Durango
## 20 Durango
## 270 Durango
## 141 Durango
## 209 Durango
## 94 Durango
## 1091 Durango
## 103 Durango
## 297 Durango
## 40 Durango
## 283 Durango
summary(muestraEstratificada)
## X nombre paterno materno
## Min. : 9 Length:50 Length:50 Length:50
## 1st Qu.:1638 Class :character Class :character Class :character
## Median :5428 Mode :character Mode :character Mode :character
## Mean :4877
## 3rd Qu.:7479
## Max. :9819
## genero edad entidad
## Length:50 Min. :18.00 Length:50
## Class :character 1st Qu.:32.25 Class :character
## Mode :character Median :43.00 Mode :character
## Mean :40.62
## 3rd Qu.:47.75
## Max. :60.00