Las librerías

library(readr) # leer datos
library(knitr) # Tablas amigables
library(fdth) # Crear tablas de distribución
library(dplyr) # selet, filter, mutate, group...

Los Datos

datos <- read.csv("../Datos/personas.csv")

kable(head(datos))
X nombre paterno materno genero edad entidad
1 GALILEO CARCAÑO SAMUDIO M 41 Baja California
2 EDUARDO JAVIER BELMONT ZEMPOALTECATL M 19 Chihuahua
3 GASTON CERROS ABNAL M 39 Sinaloa
4 ROBERTO OMAR ROGEL BALLEZA M 26 Guanajuato
5 LUIS ARMANDO FRAIJO CONCHAS M 33 Baja California Sur
6 JOSE DE LA CRUZ CECILIO ALAYOLA M 37 Tamaulipas
kable(head(datos))
X nombre paterno materno genero edad entidad
1 GALILEO CARCAÑO SAMUDIO M 41 Baja California
2 EDUARDO JAVIER BELMONT ZEMPOALTECATL M 19 Chihuahua
3 GASTON CERROS ABNAL M 39 Sinaloa
4 ROBERTO OMAR ROGEL BALLEZA M 26 Guanajuato
5 LUIS ARMANDO FRAIJO CONCHAS M 33 Baja California Sur
6 JOSE DE LA CRUZ CECILIO ALAYOLA M 37 Tamaulipas

Explorando los datos

summary(datos)
##        X                       nombre         paterno           materno    
##  Min.   :    1   IVANHOE          :   6   FITTA   :   7   CORDERO   :   8  
##  1st Qu.: 2501   JOSE ABEL        :   6   QUEMADA :   7   MONTEAGUDO:   7  
##  Median : 5000   CECILIA MAGDALENA:   5   TECO    :   7   ROJERO    :   7  
##  Mean   : 5000   FIDEL JESUS      :   5   VARGAZ  :   7   ANDON     :   6  
##  3rd Qu.: 7500   HUMBERTO RENE    :   5   AGIS    :   6   BARQUERA  :   6  
##  Max.   :10000   JESUS A          :   5   BALCAZAR:   6   CHONGO    :   6  
##                  (Other)          :9968   (Other) :9960   (Other)   :9960  
##  genero        edad                       entidad    
##  F:5200   Min.   :18.00   Guanajuato          : 351  
##  M:4800   1st Qu.:28.00   Durango             : 332  
##           Median :39.00   Coahuila de Zaragoza: 330  
##           Mean   :38.93   Oaxaca              : 329  
##           3rd Qu.:50.00   Baja California Sur : 327  
##           Max.   :60.00   Querétaro           : 326  
##                           (Other)             :8005

¿Cuáles son los estados?

estados <- unique(datos$entidad)
estados
##  [1] Baja California                 Chihuahua                      
##  [3] Sinaloa                         Guanajuato                     
##  [5] Baja California Sur             Tamaulipas                     
##  [7] Querétaro                       Hidalgo                        
##  [9] Chiapas                         Zacatecas                      
## [11] Veracruz de Ignacio de la Llave Michoacán de Ocampo            
## [13] Ciudad de México                Tabasco                        
## [15] Campeche                        Tlaxcala                       
## [17] Jalisco                         Durango                        
## [19] Colima                          Puebla                         
## [21] San Luis Potosí                 Yucatán                        
## [23] Morelos                         Quintana Roo                   
## [25] Nuevo León                      Coahuila de Zaragoza           
## [27] México                          Oaxaca                         
## [29] Nayarit                         Sonora                         
## [31] Aguascalientes                  Guerrero                       
## 32 Levels: Aguascalientes Baja California Baja California Sur ... Zacatecas

Elegir por aleatoriedad 5 estados

set.seed(2020)   # A parir de una valor inicial = semilla genera aleatorios

N <- length(estados)   # 32 
n <- 5   # cuantas estados
estados.Elegidos <- sample(1:N, n, replace = FALSE)


muestra.Estados <- estados[estados.Elegidos]
muestra.Estados
## [1] Oaxaca              Michoacán de Ocampo Morelos            
## [4] Yucatán             Quintana Roo       
## 32 Levels: Aguascalientes Baja California Baja California Sur ... Zacatecas

Determinar la muestra de todos los datos

De la población datos generar una subPoblación de solo observaciones que pertenecen a los estados que se construyeron en la muestra.Estados * Determinar el valor de N de toda la subPoblación

datos.SubPoblacion <- datos[datos$entidad %in% muestra.Estados, ] # Filas, Columnas

kable(head(datos.SubPoblacion))
X nombre paterno materno genero edad entidad
18 18 XICOHTENCATL BOSQUES MOSSO M 45 Michoacán de Ocampo
33 33 JOSE ALEJAN VILLAFAN MANCILLAS M 25 Yucatán
36 36 OFIR TECORRAL PERPULY M 59 Morelos
39 39 DOLORES OSALDE SERRALTA M 52 Quintana Roo
43 43 ANTONIO JOSE ALMERAYA VAZQUEZ DEL MERCADO M 23 Michoacán de Ocampo
48 48 JUAN JULIAN CERDIO PEÏ¿½ATE M 60 Oaxaca
N <- nrow(datos.SubPoblacion)
N
## [1] 1515
transform(table(datos.SubPoblacion$entidad))
##                               Var1 Freq
## 1                   Aguascalientes    0
## 2                  Baja California    0
## 3              Baja California Sur    0
## 4                         Campeche    0
## 5                          Chiapas    0
## 6                        Chihuahua    0
## 7                 Ciudad de México    0
## 8             Coahuila de Zaragoza    0
## 9                           Colima    0
## 10                         Durango    0
## 11                      Guanajuato    0
## 12                        Guerrero    0
## 13                         Hidalgo    0
## 14                         Jalisco    0
## 15                          México    0
## 16             Michoacán de Ocampo  296
## 17                         Morelos  294
## 18                         Nayarit    0
## 19                      Nuevo León    0
## 20                          Oaxaca  329
## 21                          Puebla    0
## 22                       Querétaro    0
## 23                    Quintana Roo  290
## 24                 San Luis Potosí    0
## 25                         Sinaloa    0
## 26                          Sonora    0
## 27                         Tabasco    0
## 28                      Tamaulipas    0
## 29                        Tlaxcala    0
## 30 Veracruz de Ignacio de la Llave    0
## 31                         Yucatán  306
## 32                       Zacatecas    0
print ("Hasta aquí Terminamos !")
## [1] "Hasta aquí Terminamos !"