Librerias

library(readr)  # Leer datos
library(dplyr)  # select, filter, mutate... distintas funciones
library(fdth)   # Tablas de frecuencia
library(knitr)  # Tablas amigables

Cargar datos (Creados previamente)

datos<-read.csv("../Datos/personaslv.csv")

kable(head(datos))
X Nombre Paterno Materno Género Edad Entidad
1 MIRNA JANET RAYGOZA TORRECILLAS F 52 Zacatecas
2 NANCY YESENIA Y KU TEJAS F 18 Aguascalientes
3 IRMA KARINA REMENTERIA OLAGUEZ F 30 Tabasco
4 VIANCA BRACHO TLAPA F 20 Tabasco
5 MARIA ALMENDRA MU?OZ NACIANCENO F 50 Morelos
6 JUANA EMMA CHAPARRO TIBURCIO F 43 Sonora
kable(tail(datos))
X Nombre Paterno Materno Género Edad Entidad
9995 9995 RAZIEL TORREALBA CHAIREZ M 31 Colima
9996 9996 CARLOS IGNACIO LLANES BARQUIN M 21 San Luis Potosí
9997 9997 ALBERTO AGUSTIN OLVEDA APALE M 50 Morelos
9998 9998 FRANCISCO DAVID PULIDO BIU M 22 Michoacán de Ocampo
9999 9999 CORNELIO ROSARIO LETICIA M 52 Sonora
10000 10000 MIGUEL ESTEBAN VILCHEZ RICO M 49 Quintana Roo
Estadísticos de los datos leídos
summary(datos)
##        X                       Nombre         Paterno           Materno    
##  Min.   :    1   IVANHOE          :   6   FITTA   :   7   CORDERO   :   8  
##  1st Qu.: 2501   JOSE ABEL        :   6   QUEMADA :   7   MONTEAGUDO:   7  
##  Median : 5000   CECILIA MAGDALENA:   5   TECO    :   7   ROJERO    :   7  
##  Mean   : 5000   FIDEL JESUS      :   5   VARGAZ  :   7   ANDON     :   6  
##  3rd Qu.: 7500   HUMBERTO RENE    :   5   AGIS    :   6   BARQUERA  :   6  
##  Max.   :10000   JESUS A          :   5   BALCAZAR:   6   CHONGO    :   6  
##                  (Other)          :9968   (Other) :9960   (Other)   :9960  
##  Género        Edad                       Entidad    
##  F:5200   Min.   :18.00   Guanajuato          : 351  
##  M:4800   1st Qu.:28.00   Durango             : 332  
##           Median :39.00   Coahuila de Zaragoza: 330  
##           Mean   :38.93   Oaxaca              : 329  
##           3rd Qu.:50.00   Baja California Sur : 327  
##           Max.   :60.00   Querétaro           : 326  
##                           (Other)             :8005

Determinar cuantos estados son

Utilizando unique() , es decir valores que no se repiten en la columna “Entidad”
estados<-unique(datos$Entidad)

estados
##  [1] Zacatecas                       Aguascalientes                 
##  [3] Tabasco                         Morelos                        
##  [5] Sonora                          Durango                        
##  [7] Guerrero                        México                         
##  [9] Baja California Sur             Yucatán                        
## [11] Nuevo León                      Puebla                         
## [13] Chiapas                         Michoacán de Ocampo            
## [15] Nayarit                         Baja California                
## [17] Tamaulipas                      Oaxaca                         
## [19] Querétaro                       Colima                         
## [21] Veracruz de Ignacio de la Llave Quintana Roo                   
## [23] Ciudad de México                Hidalgo                        
## [25] Tlaxcala                        Chihuahua                      
## [27] Campeche                        Jalisco                        
## [29] Guanajuato                      Sinaloa                        
## [31] Coahuila de Zaragoza            San Luis Potosí                
## 32 Levels: Aguascalientes Baja California Baja California Sur ... Zacatecas
De manera aleatoria, seleccionar 5 estados
set.seed(2020)

N<-length(estados)  # Total de datos

n<-5  # Valor de la muestra

estados.elegidos<-sample(1:N, n, replace = FALSE)

muestra.estados<-estados[estados.elegidos]

muestra.estados
## [1] Jalisco          Puebla           Ciudad de México Quintana Roo    
## [5] Hidalgo         
## 32 Levels: Aguascalientes Baja California Baja California Sur ... Zacatecas

Determinar la muestra de todos los datos

De la poblacion, generar una SubPoblacion tomando en cuenta solo a los estados generados en “muestra.estados”

Determinar el valor de N de la SubPoblacion obtenida
datos.subpoblacion<- datos[datos$Entidad %in% muestra.estados, ] #Toma en cuenta todas las columnas

kable(head(datos.subpoblacion))
X Nombre Paterno Materno Género Edad Entidad
19 19 DULCE YAZMIN VERDEJA TORNERO F 50 Puebla
42 42 DULCE MARLENE ZUVIRI MARIAS F 20 Quintana Roo
44 44 LEOPOLDA VENZOR ABASTA F 20 Ciudad de México
47 47 MARTHA VIRGINIA VERGEL A F 47 Hidalgo
48 48 YAHAIRA SCHMIDT COVARRUBIAS F 52 Ciudad de México
61 61 EMILIA GUADALUPE CASAO EURESTI F 60 Jalisco
N<-nrow(datos.subpoblacion)
N
## [1] 1531
transform(table(datos.subpoblacion$Entidad))
##                               Var1 Freq
## 1                   Aguascalientes    0
## 2                  Baja California    0
## 3              Baja California Sur    0
## 4                         Campeche    0
## 5                          Chiapas    0
## 6                        Chihuahua    0
## 7                 Ciudad de México  321
## 8             Coahuila de Zaragoza    0
## 9                           Colima    0
## 10                         Durango    0
## 11                      Guanajuato    0
## 12                        Guerrero    0
## 13                         Hidalgo  321
## 14                         Jalisco  291
## 15                          México    0
## 16             Michoacán de Ocampo    0
## 17                         Morelos    0
## 18                         Nayarit    0
## 19                      Nuevo León    0
## 20                          Oaxaca    0
## 21                          Puebla  308
## 22                       Querétaro    0
## 23                    Quintana Roo  290
## 24                 San Luis Potosí    0
## 25                         Sinaloa    0
## 26                          Sonora    0
## 27                         Tabasco    0
## 28                      Tamaulipas    0
## 29                        Tlaxcala    0
## 30 Veracruz de Ignacio de la Llave    0
## 31                         Yucatán    0
## 32                       Zacatecas    0
print("Fin")
## [1] "Fin"