Se cargan librerias
library(readr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
library(knitr)
se carga los datos
datos <- read.csv("C:/Users/dell/Desktop/Modulo 3 Curso de Titulacion/datos/personal_federalizado.csv")
head(datos)
## X CLAVECT RFC CURP NOMBRECOMPLETODETRABAJADOR
## 1 1 01ADG0005J AAMR680705AT3 AAMR680705MASRRS09 ROSA IMELDA ARANDA MARQUEZ
## 2 2 01ADG0005J LAGE740824A21 LAGE740824MASRLL05 MARIA ELIZABETH LARA GALLEGOS
## 3 3 01ADG0005J LOVG681207PS0 LOVG681207HASPLR02 VALENCIA GERARDO LOPEZ VELARDE
## 4 4 01ADG0005J LUCJ750616L1A LUCJ750616HASNSN05 JUAN MANUEL LUNA CASTANON
## 5 5 01ADG0005J LUEB581004V15 LUEB581004MASVDT02 BEATRIZ EUG LUEVANO EDREHIRA
## 6 6 01ADG0005J LUEB581004V15 LUEB581004MASVDT02 BEATRIZ EUG LUEVANO EDREHIRA
## NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA
## 1 ROSA IMELDA ARANDA MARQUEZ A
## 2 MARIA ELIZABETH LARA GALLEGOS A
## 3 VALENCIA GERARDO LOPEZ VELARDE A
## 4 JUAN MANUEL LUNA CASTANON A
## 5 BEATRIZ EUG LUEVANO EDREHIRA A
## 6 BEATRIZ EUG LUEVANO EDREHIRA A
## DESCRIPCIONTIPONOMINA CLAVEDECATEORIA ERROR ENTIDADFEDERATIVA
## 1 ORDINARIA E0121 AGUSCALIENTES AGUASCALIENTES
## 2 ORDINARIA A01805 AGUSCALIENTES AGUASCALIENTES
## 3 ORDINARIA E0363 AGUSCALIENTES AGUASCALIENTES
## 4 ORDINARIA E7211 AGUSCALIENTES AGUASCALIENTES
## 5 ORDINARIA E0181 AGUSCALIENTES AGUASCALIENTES
## 6 ORDINARIA E0689 AGUSCALIENTES AGUASCALIENTES
tail(datos)
## X CLAVECT RFC CURP
## 1610073 1610073 32TAR0077T GAFS880606US3 GAFS880606MSPRRC08
## 1610074 1610074 32TAR0077T MENR7512171D6 MENR751217HZSRYG08
## 1610075 1610075 32TAR0077T MERL901023F49 MERL901023HZSLVS06
## 1610076 1610076 32TAR0077T MOOC740716TE0 MOOC740716MZSRNR00
## 1610077 1610077 32TAR0077T SAMJ7408058C4 SAMJ740805MZSNCN04
## 1610078 1610078 32TAR0077T ZADG600712451 ZADG600712MSPVVD03
## NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR
## 1610073 MA. DEL SOCORRO GARCIA FRAGA MA. DEL SOCORRO
## 1610074 JOSE RIGOBERTO MERCADO NOYOLA JOSE RIGOBERTO
## 1610075 LUIS PEDRO MELENDREZ RUVALCABA LUIS PEDRO
## 1610076 MA. CARMEN MORENO ONTIVEROS MA. CARMEN
## 1610077 JUANA MARIA DE LAS NIEVES SANCHEZ MACIEL JUANA MARIA DE LAS NIEVES
## 1610078 GUADALUPE ZAVALA DAVILA GUADALUPE
## PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA
## 1610073 GARCIA FRAGA A ORDINARIA
## 1610074 MERCADO NOYOLA A ORDINARIA
## 1610075 MELENDREZ RUVALCABA A ORDINARIA
## 1610076 MORENO ONTIVEROS A ORDINARIA
## 1610077 SANCHEZ MACIEL A ORDINARIA
## 1610078 ZAVALA DAVILA A ORDINARIA
## CLAVEDECATEORIA ERROR ENTIDADFEDERATIVA
## 1610073 A03803 ZACATECAS ZACATECAS
## 1610074 S01808 ZACATECAS ZACATECAS
## 1610075 S01808 ZACATECAS ZACATECAS
## 1610076 S01808 ZACATECAS ZACATECAS
## 1610077 A03803 ZACATECAS ZACATECAS
## 1610078 S01807 ZACATECAS ZACATECAS
Explorando los Datos
str(datos)
## 'data.frame': 1610078 obs. of 13 variables:
## $ X : int 1 2 3 4 5 6 7 8 9 10 ...
## $ CLAVECT : chr "01ADG0005J" "01ADG0005J" "01ADG0005J" "01ADG0005J" ...
## $ RFC : chr "AAMR680705AT3" "LAGE740824A21" "LOVG681207PS0" "LUCJ750616L1A" ...
## $ CURP : chr "AAMR680705MASRRS09" "LAGE740824MASRLL05" "LOVG681207HASPLR02" "LUCJ750616HASNSN05" ...
## $ NOMBRECOMPLETODETRABAJADOR: chr "ROSA IMELDA ARANDA MARQUEZ" "MARIA ELIZABETH LARA GALLEGOS" "VALENCIA GERARDO LOPEZ VELARDE" "JUAN MANUEL LUNA CASTANON" ...
## $ NOMBRESTRABAJADOR : chr "ROSA IMELDA" "MARIA ELIZABETH" "VALENCIA GERARDO" "JUAN MANUEL" ...
## $ PRIMERAPELLIDO : chr "ARANDA" "LARA" "LOPEZ" "LUNA" ...
## $ SEGUNDOAPELLIDO : chr "MARQUEZ" "GALLEGOS" "VELARDE" "CASTANON" ...
## $ TIPODENOMINA : chr "A" "A" "A" "A" ...
## $ DESCRIPCIONTIPONOMINA : chr "ORDINARIA" "ORDINARIA" "ORDINARIA" "ORDINARIA" ...
## $ CLAVEDECATEORIA : chr "E0121" "A01805" "E0363" "E7211" ...
## $ ERROR : chr "AGUSCALIENTES" "AGUSCALIENTES" "AGUSCALIENTES" "AGUSCALIENTES" ...
## $ ENTIDADFEDERATIVA : chr "AGUASCALIENTES" "AGUASCALIENTES" "AGUASCALIENTES" "AGUASCALIENTES" ...
summary(datos)
## X CLAVECT RFC CURP
## Min. : 1 Length:1610078 Length:1610078 Length:1610078
## 1st Qu.: 402520 Class :character Class :character Class :character
## Median : 805040 Mode :character Mode :character Mode :character
## Mean : 805040
## 3rd Qu.:1207559
## Max. :1610078
## NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO
## Length:1610078 Length:1610078 Length:1610078
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
##
##
##
## SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA
## Length:1610078 Length:1610078 Length:1610078 Length:1610078
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## ERROR ENTIDADFEDERATIVA
## Length:1610078 Length:1610078
## Class :character Class :character
## Mode :character Mode :character
##
##
##
Registros del estado de Colima
tabla.frecuencias <- fdt_cat(datos$ENTIDADFEDERATIVA)
tabla.frecuencias
## Category f rf rf(%) cf cf(%)
## ESTADO DE MEXICO 163793 0.10 10.17 163793 10.17
## DISTRITO FEDERAL 155278 0.10 9.64 319071 19.82
## VERACRUZ 103592 0.06 6.43 422663 26.25
## OAXACA 87819 0.05 5.45 510482 31.71
## GUERRERO 87070 0.05 5.41 597552 37.11
## JALISCO 84643 0.05 5.26 682195 42.37
## CHIAPAS 72309 0.04 4.49 754504 46.86
## MICHOACAN 71501 0.04 4.44 826005 51.30
## GUANAJUATO 69202 0.04 4.30 895207 55.60
## PUEBLA 62676 0.04 3.89 957883 59.49
## TAMAULIPAS 52238 0.03 3.24 1010121 62.74
## HIDALGO 48874 0.03 3.04 1058995 65.77
## SAN LUIS POTOSÃ\215 45148 0.03 2.80 1104143 68.58
## NUEVO LEÓN 45080 0.03 2.80 1149223 71.38
## CHIHUAHUA 41160 0.03 2.56 1190383 73.93
## SINALOA 38834 0.02 2.41 1229217 76.35
## COAHUILA 37817 0.02 2.35 1267034 78.69
## BAJA CALIFORNIA 32281 0.02 2.00 1299315 80.70
## SONORA 31387 0.02 1.95 1330702 82.65
## TABASCO 29656 0.02 1.84 1360358 84.49
## NAYARIT 28901 0.02 1.80 1389259 86.29
## ZACATECAS 27408 0.02 1.70 1416667 87.99
## MORELOS 27015 0.02 1.68 1443682 89.67
## YUCATÃ\201N 26966 0.02 1.67 1470648 91.34
## QUERÉTARO 23876 0.01 1.48 1494524 92.82
## TLAXCALA 22342 0.01 1.39 1516866 94.21
## QUINTANA ROO 21974 0.01 1.36 1538840 95.58
## AGUASCALIENTES 19968 0.01 1.24 1558808 96.82
## CAMPECHE 15222 0.01 0.95 1574030 97.76
## BAJA CALIFORNIA SUR 12312 0.01 0.76 1586342 98.53
## COLIMA 12283 0.01 0.76 1598625 99.29
## DURANGO 11453 0.01 0.71 1610078 100.00
Muestra de el estado de Colima
n <- 16471 # Muestra nacional
N <- 1610078 # Poblacion Nacional
n.Colima <- ceiling(n * 0.01)
n.Colima
## [1] 165
Generar Pob Colima
Pob.Colima <- filter(datos, ENTIDADFEDERATIVA == "COLIMA")
N <- nrow(Pob.Colima)
N
## [1] 12283
muestraColima <- sample(1:N, n.Colima, replace = FALSE)
muestraColima
## [1] 8996 6155 7445 7562 4764 6986 72 1746 9293 9175 1222 11847
## [13] 1460 1656 12108 5178 2101 11537 9305 7482 6489 8398 3518 7430
## [25] 8664 7212 5476 875 7901 1420 3134 6920 10885 11473 3921 8728
## [37] 551 2001 449 3833 3522 1217 9878 11635 11268 10307 6256 8075
## [49] 3386 9256 6580 4241 3906 10024 9840 9806 9575 1994 9523 2976
## [61] 683 6207 7558 8650 3249 8528 1888 12129 2288 5909 6852 9277
## [73] 1681 11226 4088 5200 2042 2467 2540 4991 859 2258 1777 1199
## [85] 8207 13 1660 8634 1136 11719 201 8444 2815 6404 5996 5977
## [97] 2617 306 5207 6024 7945 8890 11884 694 4296 10781 9027 7794
## [109] 11839 10007 6246 10186 7903 7527 7695 9790 4158 1619 4810 7999
## [121] 4869 4417 542 6654 873 8859 8170 2382 6131 2262 8139 3018
## [133] 9807 10184 7391 2527 11756 6959 6958 6932 2308 9507 2907 6337
## [145] 7472 4560 1283 9244 9110 1118 4823 1064 10183 8843 7634 993
## [157] 7753 4059 9896 6603 11560 443 6220 3079 4769
Muestra Estratificada de Colima
m.estratif.Colima <- Pob.Colima[muestraColima, ]
head(m.estratif.Colima)
## X CLAVECT RFC CURP
## 8996 240065 06DPT0001E SOCL630602DQ9 SOCL630602MCMRRR01
## 6155 237224 06DPR0065A SAPB571126FYA SAPB571126MCMNCL01
## 7445 238514 06DPR0238B COMR640315CH0 COMR640315HCMSRC08
## 7562 238631 06DPR0251W SAVA880209JI6 SAVA880209MCMVZL08
## 4764 235833 06DJN0109R OICG671105UQA OICG671105HJCRHL07
## 6986 238055 06DPR0185N ROCA841127927 ROCA841127MCMCRN06
## NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO
## 8996 MARIA LORENA SORIANO CARDONA MARIA LORENA SORIANO
## 6155 BELEN ARACELI SANCHEZ PACHECO BELEN ARACELI SANCHEZ
## 7445 RICARDO ANTONIO COSIO MARTINEZ RICARDO ANTONIO COSIO
## 7562 ALMA YADIRA SAVALZA VAZQUEZ ALMA YADIRA SAVALZA
## 4764 GUILLERMO ORTIZ CHAVEZ GUILLERMO ORTIZ
## 6986 ANGELA MARICELA ROCHA CARBAJAL ANGELA MARICELA ROCHA
## SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA
## 8996 CARDONA J HONORARIOS L5XCBII
## 6155 PACHECO A ORDINARIA E0281
## 7445 MARTINEZ A ORDINARIA E0299
## 7562 VAZQUEZ J HONORARIOS D02012
## 4764 CHAVEZ A ORDINARIA E0183
## 6986 CARBAJAL A ORDINARIA E0281
## ERROR ENTIDADFEDERATIVA
## 8996 COLIMA COLIMA
## 6155 FORANEO. COLIMA
## 7445 COLIMA COLIMA
## 7562 COLIMA COLIMA
## 4764 FORANEO COLIMA
## 6986 FORANEO. COLIMA
tail(m.estratif.Colima)
## X CLAVECT RFC CURP
## 6603 237672 06DPR0125Z FUHA700904F29 FUHA700904HCMNRN00
## 11560 242629 06FLS0002Q MALM681123A21 MALM681123MCMRPR00
## 443 231512 06ADG0001I ROHR750116KW2 ROHR750116MJCDJC03
## 6220 237289 06DPR0076G VATV810502552 VATV810502MCMRDR08
## 3079 234148 06DES0016L AAHA8703183S5 AAHA870318HCMLRL08
## 4769 235838 06DJN0110G BAMT721003PH8 BAMT721003MCMTRR09
## NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO
## 6603 JOSE ANGEL FUENTES HERNANDEZ JOSE ANGEL FUENTES
## 11560 MARIBEL MARTINEZ LOPEZ MARIBEL MARTINEZ
## 443 ROCIO RODRIGUEZ HIJAR ROCIO RODRIGUEZ
## 6220 VERONICA VARGAS TEODORO VERONICA VARGAS
## 3079 JOSE ALBERTO ALVAREZ HERNANDEZ JOSE ALBERTO ALVAREZ
## 4769 TERESA DEL CARMEN BAUTISTA MARISCAL TERESA DEL CARMEN BAUTISTA
## SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA
## 6603 HERNANDEZ J HONORARIOS D02012
## 11560 LOPEZ A ORDINARIA E0687
## 443 HIJAR J HONORARIOS A02012
## 6220 TEODORO A ORDINARIA E0281
## 3079 HERNANDEZ A ORDINARIA E0363
## 4769 MARISCAL A ORDINARIA S01803
## ERROR ENTIDADFEDERATIVA
## 6603 COLIMA COLIMA
## 11560 COLIMA COLIMA
## 443 COLIMA COLIMA
## 6220 FORANEO. COLIMA
## 3079 FORANEA. COLIMA
## 4769 COLIMA COLIMA