Librerias
library(readr) # Leer datos
library(dplyr) # select, filter, mutate... distintas funciones
library(fdth) # Tablas de frecuencia
library(knitr) # Tablas amigables
Cargar datos (Creados previamente)
datos<-read.csv("../Datos/personaslv.csv")
kable(head(datos))
| 1 |
MIRNA JANET |
RAYGOZA |
TORRECILLAS |
F |
52 |
Zacatecas |
| 2 |
NANCY YESENIA |
Y KU |
TEJAS |
F |
18 |
Aguascalientes |
| 3 |
IRMA KARINA |
REMENTERIA |
OLAGUEZ |
F |
30 |
Tabasco |
| 4 |
VIANCA |
BRACHO |
TLAPA |
F |
20 |
Tabasco |
| 5 |
MARIA ALMENDRA |
MU?OZ |
NACIANCENO |
F |
50 |
Morelos |
| 6 |
JUANA EMMA |
CHAPARRO |
TIBURCIO |
F |
43 |
Sonora |
kable(tail(datos))
| 9995 |
9995 |
RAZIEL |
TORREALBA |
CHAIREZ |
M |
31 |
Colima |
| 9996 |
9996 |
CARLOS IGNACIO |
LLANES |
BARQUIN |
M |
21 |
San Luis Potosí |
| 9997 |
9997 |
ALBERTO AGUSTIN |
OLVEDA |
APALE |
M |
50 |
Morelos |
| 9998 |
9998 |
FRANCISCO DAVID |
PULIDO |
BIU |
M |
22 |
Michoacán de Ocampo |
| 9999 |
9999 |
CORNELIO |
ROSARIO |
LETICIA |
M |
52 |
Sonora |
| 10000 |
10000 |
MIGUEL ESTEBAN |
VILCHEZ |
RICO |
M |
49 |
Quintana Roo |
Estadísticos de los datos leídos
summary(datos)
## X Nombre Paterno Materno
## Min. : 1 IVANHOE : 6 FITTA : 7 CORDERO : 8
## 1st Qu.: 2501 JOSE ABEL : 6 QUEMADA : 7 MONTEAGUDO: 7
## Median : 5000 CECILIA MAGDALENA: 5 TECO : 7 ROJERO : 7
## Mean : 5000 FIDEL JESUS : 5 VARGAZ : 7 ANDON : 6
## 3rd Qu.: 7500 HUMBERTO RENE : 5 AGIS : 6 BARQUERA : 6
## Max. :10000 JESUS A : 5 BALCAZAR: 6 CHONGO : 6
## (Other) :9968 (Other) :9960 (Other) :9960
## Género Edad Entidad
## F:5200 Min. :18.00 Guanajuato : 351
## M:4800 1st Qu.:28.00 Durango : 332
## Median :39.00 Coahuila de Zaragoza: 330
## Mean :38.93 Oaxaca : 329
## 3rd Qu.:50.00 Baja California Sur : 327
## Max. :60.00 Querétaro : 326
## (Other) :8005
Determinar cuantos estados son
Utilizando unique() , es decir valores que no se repiten en la columna “Entidad”
estados<-unique(datos$Entidad)
estados
## [1] Zacatecas Aguascalientes
## [3] Tabasco Morelos
## [5] Sonora Durango
## [7] Guerrero México
## [9] Baja California Sur Yucatán
## [11] Nuevo León Puebla
## [13] Chiapas Michoacán de Ocampo
## [15] Nayarit Baja California
## [17] Tamaulipas Oaxaca
## [19] Querétaro Colima
## [21] Veracruz de Ignacio de la Llave Quintana Roo
## [23] Ciudad de México Hidalgo
## [25] Tlaxcala Chihuahua
## [27] Campeche Jalisco
## [29] Guanajuato Sinaloa
## [31] Coahuila de Zaragoza San Luis Potosí
## 32 Levels: Aguascalientes Baja California Baja California Sur ... Zacatecas
De manera aleatoria, seleccionar 5 estados
set.seed(2020)
N<-length(estados) # Total de datos
n<-5 # Valor de la muestra
estados.elegidos<-sample(1:N, n, replace = FALSE)
muestra.estados<-estados[estados.elegidos]
muestra.estados
## [1] Jalisco Puebla Ciudad de México Quintana Roo
## [5] Hidalgo
## 32 Levels: Aguascalientes Baja California Baja California Sur ... Zacatecas
Determinar la muestra de todos los datos
De la poblacion, generar una SubPoblacion tomando en cuenta solo a los estados generados en “muestra.estados”
Determinar el valor de N de la SubPoblacion obtenida
datos.subpoblacion<- datos[datos$Entidad %in% muestra.estados, ] #Toma en cuenta todas las columnas
kable(head(datos.subpoblacion))
| 19 |
19 |
DULCE YAZMIN |
VERDEJA |
TORNERO |
F |
50 |
Puebla |
| 42 |
42 |
DULCE MARLENE |
ZUVIRI |
MARIAS |
F |
20 |
Quintana Roo |
| 44 |
44 |
LEOPOLDA |
VENZOR |
ABASTA |
F |
20 |
Ciudad de México |
| 47 |
47 |
MARTHA VIRGINIA |
VERGEL |
A |
F |
47 |
Hidalgo |
| 48 |
48 |
YAHAIRA |
SCHMIDT |
COVARRUBIAS |
F |
52 |
Ciudad de México |
| 61 |
61 |
EMILIA GUADALUPE |
CASAO |
EURESTI |
F |
60 |
Jalisco |
N<-nrow(datos.subpoblacion)
N
## [1] 1531
transform(table(datos.subpoblacion$Entidad))
## Var1 Freq
## 1 Aguascalientes 0
## 2 Baja California 0
## 3 Baja California Sur 0
## 4 Campeche 0
## 5 Chiapas 0
## 6 Chihuahua 0
## 7 Ciudad de México 321
## 8 Coahuila de Zaragoza 0
## 9 Colima 0
## 10 Durango 0
## 11 Guanajuato 0
## 12 Guerrero 0
## 13 Hidalgo 321
## 14 Jalisco 291
## 15 México 0
## 16 Michoacán de Ocampo 0
## 17 Morelos 0
## 18 Nayarit 0
## 19 Nuevo León 0
## 20 Oaxaca 0
## 21 Puebla 308
## 22 Querétaro 0
## 23 Quintana Roo 290
## 24 San Luis Potosí 0
## 25 Sinaloa 0
## 26 Sonora 0
## 27 Tabasco 0
## 28 Tamaulipas 0
## 29 Tlaxcala 0
## 30 Veracruz de Ignacio de la Llave 0
## 31 Yucatán 0
## 32 Zacatecas 0
print("Fin")
## [1] "Fin"