Se cargan librerias

library(readr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(knitr)

se carga los datos

datos <- read.csv("C:/Users/dell/Desktop/Modulo 3 Curso de Titulacion/datos/personal_federalizado.csv")

head(datos)
##   X    CLAVECT           RFC               CURP     NOMBRECOMPLETODETRABAJADOR
## 1 1 01ADG0005J AAMR680705AT3 AAMR680705MASRRS09     ROSA IMELDA ARANDA MARQUEZ
## 2 2 01ADG0005J LAGE740824A21 LAGE740824MASRLL05  MARIA ELIZABETH LARA GALLEGOS
## 3 3 01ADG0005J LOVG681207PS0 LOVG681207HASPLR02 VALENCIA GERARDO LOPEZ VELARDE
## 4 4 01ADG0005J LUCJ750616L1A LUCJ750616HASNSN05      JUAN MANUEL LUNA CASTANON
## 5 5 01ADG0005J LUEB581004V15 LUEB581004MASVDT02   BEATRIZ EUG LUEVANO EDREHIRA
## 6 6 01ADG0005J LUEB581004V15 LUEB581004MASVDT02   BEATRIZ EUG LUEVANO EDREHIRA
##   NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA
## 1       ROSA IMELDA         ARANDA         MARQUEZ            A
## 2   MARIA ELIZABETH           LARA        GALLEGOS            A
## 3  VALENCIA GERARDO          LOPEZ         VELARDE            A
## 4       JUAN MANUEL           LUNA        CASTANON            A
## 5       BEATRIZ EUG        LUEVANO        EDREHIRA            A
## 6       BEATRIZ EUG        LUEVANO        EDREHIRA            A
##   DESCRIPCIONTIPONOMINA CLAVEDECATEORIA         ERROR ENTIDADFEDERATIVA
## 1             ORDINARIA           E0121 AGUSCALIENTES    AGUASCALIENTES
## 2             ORDINARIA          A01805 AGUSCALIENTES    AGUASCALIENTES
## 3             ORDINARIA           E0363 AGUSCALIENTES    AGUASCALIENTES
## 4             ORDINARIA           E7211 AGUSCALIENTES    AGUASCALIENTES
## 5             ORDINARIA           E0181 AGUSCALIENTES    AGUASCALIENTES
## 6             ORDINARIA           E0689 AGUSCALIENTES    AGUASCALIENTES
tail(datos)
##               X    CLAVECT           RFC               CURP
## 1610073 1610073 32TAR0077T GAFS880606US3 GAFS880606MSPRRC08
## 1610074 1610074 32TAR0077T MENR7512171D6 MENR751217HZSRYG08
## 1610075 1610075 32TAR0077T MERL901023F49 MERL901023HZSLVS06
## 1610076 1610076 32TAR0077T MOOC740716TE0 MOOC740716MZSRNR00
## 1610077 1610077 32TAR0077T SAMJ7408058C4 SAMJ740805MZSNCN04
## 1610078 1610078 32TAR0077T ZADG600712451 ZADG600712MSPVVD03
##                       NOMBRECOMPLETODETRABAJADOR         NOMBRESTRABAJADOR
## 1610073             MA. DEL SOCORRO GARCIA FRAGA           MA. DEL SOCORRO
## 1610074            JOSE RIGOBERTO MERCADO NOYOLA            JOSE RIGOBERTO
## 1610075           LUIS PEDRO MELENDREZ RUVALCABA                LUIS PEDRO
## 1610076              MA. CARMEN MORENO ONTIVEROS                MA. CARMEN
## 1610077 JUANA MARIA DE LAS NIEVES SANCHEZ MACIEL JUANA MARIA DE LAS NIEVES
## 1610078                  GUADALUPE ZAVALA DAVILA                 GUADALUPE
##         PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA
## 1610073         GARCIA           FRAGA            A             ORDINARIA
## 1610074        MERCADO          NOYOLA            A             ORDINARIA
## 1610075      MELENDREZ       RUVALCABA            A             ORDINARIA
## 1610076         MORENO       ONTIVEROS            A             ORDINARIA
## 1610077        SANCHEZ          MACIEL            A             ORDINARIA
## 1610078         ZAVALA          DAVILA            A             ORDINARIA
##         CLAVEDECATEORIA     ERROR ENTIDADFEDERATIVA
## 1610073          A03803 ZACATECAS         ZACATECAS
## 1610074          S01808 ZACATECAS         ZACATECAS
## 1610075          S01808 ZACATECAS         ZACATECAS
## 1610076          S01808 ZACATECAS         ZACATECAS
## 1610077          A03803 ZACATECAS         ZACATECAS
## 1610078          S01807 ZACATECAS         ZACATECAS

Explorando los Datos

str(datos)
## 'data.frame':    1610078 obs. of  13 variables:
##  $ X                         : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ CLAVECT                   : chr  "01ADG0005J" "01ADG0005J" "01ADG0005J" "01ADG0005J" ...
##  $ RFC                       : chr  "AAMR680705AT3" "LAGE740824A21" "LOVG681207PS0" "LUCJ750616L1A" ...
##  $ CURP                      : chr  "AAMR680705MASRRS09" "LAGE740824MASRLL05" "LOVG681207HASPLR02" "LUCJ750616HASNSN05" ...
##  $ NOMBRECOMPLETODETRABAJADOR: chr  "ROSA IMELDA ARANDA MARQUEZ" "MARIA ELIZABETH LARA GALLEGOS" "VALENCIA GERARDO LOPEZ VELARDE" "JUAN MANUEL LUNA CASTANON" ...
##  $ NOMBRESTRABAJADOR         : chr  "ROSA IMELDA" "MARIA ELIZABETH" "VALENCIA GERARDO" "JUAN MANUEL" ...
##  $ PRIMERAPELLIDO            : chr  "ARANDA" "LARA" "LOPEZ" "LUNA" ...
##  $ SEGUNDOAPELLIDO           : chr  "MARQUEZ" "GALLEGOS" "VELARDE" "CASTANON" ...
##  $ TIPODENOMINA              : chr  "A" "A" "A" "A" ...
##  $ DESCRIPCIONTIPONOMINA     : chr  "ORDINARIA" "ORDINARIA" "ORDINARIA" "ORDINARIA" ...
##  $ CLAVEDECATEORIA           : chr  "E0121" "A01805" "E0363" "E7211" ...
##  $ ERROR                     : chr  "AGUSCALIENTES" "AGUSCALIENTES" "AGUSCALIENTES" "AGUSCALIENTES" ...
##  $ ENTIDADFEDERATIVA         : chr  "AGUASCALIENTES" "AGUASCALIENTES" "AGUASCALIENTES" "AGUASCALIENTES" ...
summary(datos)
##        X             CLAVECT              RFC                CURP          
##  Min.   :      1   Length:1610078     Length:1610078     Length:1610078    
##  1st Qu.: 402520   Class :character   Class :character   Class :character  
##  Median : 805040   Mode  :character   Mode  :character   Mode  :character  
##  Mean   : 805040                                                           
##  3rd Qu.:1207559                                                           
##  Max.   :1610078                                                           
##  NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR  PRIMERAPELLIDO    
##  Length:1610078             Length:1610078     Length:1610078    
##  Class :character           Class :character   Class :character  
##  Mode  :character           Mode  :character   Mode  :character  
##                                                                  
##                                                                  
##                                                                  
##  SEGUNDOAPELLIDO    TIPODENOMINA       DESCRIPCIONTIPONOMINA CLAVEDECATEORIA   
##  Length:1610078     Length:1610078     Length:1610078        Length:1610078    
##  Class :character   Class :character   Class :character      Class :character  
##  Mode  :character   Mode  :character   Mode  :character      Mode  :character  
##                                                                                
##                                                                                
##                                                                                
##     ERROR           ENTIDADFEDERATIVA 
##  Length:1610078     Length:1610078    
##  Class :character   Class :character  
##  Mode  :character   Mode  :character  
##                                       
##                                       
## 

Registros del estado de Colima

tabla.frecuencias <- fdt_cat(datos$ENTIDADFEDERATIVA)
tabla.frecuencias
##             Category      f   rf rf(%)      cf  cf(%)
##     ESTADO DE MEXICO 163793 0.10 10.17  163793  10.17
##     DISTRITO FEDERAL 155278 0.10  9.64  319071  19.82
##             VERACRUZ 103592 0.06  6.43  422663  26.25
##               OAXACA  87819 0.05  5.45  510482  31.71
##             GUERRERO  87070 0.05  5.41  597552  37.11
##              JALISCO  84643 0.05  5.26  682195  42.37
##              CHIAPAS  72309 0.04  4.49  754504  46.86
##            MICHOACAN  71501 0.04  4.44  826005  51.30
##           GUANAJUATO  69202 0.04  4.30  895207  55.60
##               PUEBLA  62676 0.04  3.89  957883  59.49
##           TAMAULIPAS  52238 0.03  3.24 1010121  62.74
##              HIDALGO  48874 0.03  3.04 1058995  65.77
##     SAN LUIS POTOSÃ\215  45148 0.03  2.80 1104143  68.58
##          NUEVO LEÓN  45080 0.03  2.80 1149223  71.38
##            CHIHUAHUA  41160 0.03  2.56 1190383  73.93
##              SINALOA  38834 0.02  2.41 1229217  76.35
##             COAHUILA  37817 0.02  2.35 1267034  78.69
##      BAJA CALIFORNIA  32281 0.02  2.00 1299315  80.70
##               SONORA  31387 0.02  1.95 1330702  82.65
##              TABASCO  29656 0.02  1.84 1360358  84.49
##              NAYARIT  28901 0.02  1.80 1389259  86.29
##            ZACATECAS  27408 0.02  1.70 1416667  87.99
##              MORELOS  27015 0.02  1.68 1443682  89.67
##             YUCATÃ\201N  26966 0.02  1.67 1470648  91.34
##           QUERÉTARO  23876 0.01  1.48 1494524  92.82
##             TLAXCALA  22342 0.01  1.39 1516866  94.21
##         QUINTANA ROO  21974 0.01  1.36 1538840  95.58
##       AGUASCALIENTES  19968 0.01  1.24 1558808  96.82
##             CAMPECHE  15222 0.01  0.95 1574030  97.76
##  BAJA CALIFORNIA SUR  12312 0.01  0.76 1586342  98.53
##               COLIMA  12283 0.01  0.76 1598625  99.29
##              DURANGO  11453 0.01  0.71 1610078 100.00

Muestra de el estado de Colima

n <- 16471 # Muestra nacional

N <- 1610078 # Poblacion Nacional

n.Colima <- ceiling(n * 0.01)
n.Colima
## [1] 165

Generar Pob Colima

Pob.Colima <- filter(datos, ENTIDADFEDERATIVA == "COLIMA")

N <- nrow(Pob.Colima)
N
## [1] 12283
muestraColima <- sample(1:N, n.Colima, replace = FALSE)
muestraColima
##   [1]  8996  6155  7445  7562  4764  6986    72  1746  9293  9175  1222 11847
##  [13]  1460  1656 12108  5178  2101 11537  9305  7482  6489  8398  3518  7430
##  [25]  8664  7212  5476   875  7901  1420  3134  6920 10885 11473  3921  8728
##  [37]   551  2001   449  3833  3522  1217  9878 11635 11268 10307  6256  8075
##  [49]  3386  9256  6580  4241  3906 10024  9840  9806  9575  1994  9523  2976
##  [61]   683  6207  7558  8650  3249  8528  1888 12129  2288  5909  6852  9277
##  [73]  1681 11226  4088  5200  2042  2467  2540  4991   859  2258  1777  1199
##  [85]  8207    13  1660  8634  1136 11719   201  8444  2815  6404  5996  5977
##  [97]  2617   306  5207  6024  7945  8890 11884   694  4296 10781  9027  7794
## [109] 11839 10007  6246 10186  7903  7527  7695  9790  4158  1619  4810  7999
## [121]  4869  4417   542  6654   873  8859  8170  2382  6131  2262  8139  3018
## [133]  9807 10184  7391  2527 11756  6959  6958  6932  2308  9507  2907  6337
## [145]  7472  4560  1283  9244  9110  1118  4823  1064 10183  8843  7634   993
## [157]  7753  4059  9896  6603 11560   443  6220  3079  4769

Muestra Estratificada de Colima

m.estratif.Colima <- Pob.Colima[muestraColima, ]
head(m.estratif.Colima)
##           X    CLAVECT           RFC               CURP
## 8996 240065 06DPT0001E SOCL630602DQ9 SOCL630602MCMRRR01
## 6155 237224 06DPR0065A SAPB571126FYA SAPB571126MCMNCL01
## 7445 238514 06DPR0238B COMR640315CH0 COMR640315HCMSRC08
## 7562 238631 06DPR0251W SAVA880209JI6 SAVA880209MCMVZL08
## 4764 235833 06DJN0109R OICG671105UQA OICG671105HJCRHL07
## 6986 238055 06DPR0185N ROCA841127927 ROCA841127MCMCRN06
##          NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO
## 8996   MARIA LORENA SORIANO CARDONA      MARIA LORENA        SORIANO
## 6155  BELEN ARACELI SANCHEZ PACHECO     BELEN ARACELI        SANCHEZ
## 7445 RICARDO ANTONIO COSIO MARTINEZ   RICARDO ANTONIO          COSIO
## 7562    ALMA YADIRA SAVALZA VAZQUEZ       ALMA YADIRA        SAVALZA
## 4764         GUILLERMO ORTIZ CHAVEZ         GUILLERMO          ORTIZ
## 6986 ANGELA MARICELA ROCHA CARBAJAL   ANGELA MARICELA          ROCHA
##      SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA
## 8996         CARDONA            J            HONORARIOS         L5XCBII
## 6155         PACHECO            A             ORDINARIA           E0281
## 7445        MARTINEZ            A             ORDINARIA           E0299
## 7562         VAZQUEZ            J            HONORARIOS          D02012
## 4764          CHAVEZ            A             ORDINARIA           E0183
## 6986        CARBAJAL            A             ORDINARIA           E0281
##          ERROR ENTIDADFEDERATIVA
## 8996    COLIMA            COLIMA
## 6155  FORANEO.            COLIMA
## 7445    COLIMA            COLIMA
## 7562    COLIMA            COLIMA
## 4764   FORANEO            COLIMA
## 6986  FORANEO.            COLIMA
tail(m.estratif.Colima)
##            X    CLAVECT           RFC               CURP
## 6603  237672 06DPR0125Z FUHA700904F29 FUHA700904HCMNRN00
## 11560 242629 06FLS0002Q MALM681123A21 MALM681123MCMRPR00
## 443   231512 06ADG0001I ROHR750116KW2 ROHR750116MJCDJC03
## 6220  237289 06DPR0076G VATV810502552 VATV810502MCMRDR08
## 3079  234148 06DES0016L AAHA8703183S5 AAHA870318HCMLRL08
## 4769  235838 06DJN0110G BAMT721003PH8 BAMT721003MCMTRR09
##                NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO
## 6603         JOSE ANGEL FUENTES HERNANDEZ        JOSE ANGEL        FUENTES
## 11560              MARIBEL MARTINEZ LOPEZ           MARIBEL       MARTINEZ
## 443                 ROCIO RODRIGUEZ HIJAR             ROCIO      RODRIGUEZ
## 6220              VERONICA VARGAS TEODORO          VERONICA         VARGAS
## 3079       JOSE ALBERTO ALVAREZ HERNANDEZ      JOSE ALBERTO        ALVAREZ
## 4769  TERESA DEL CARMEN BAUTISTA MARISCAL TERESA DEL CARMEN       BAUTISTA
##       SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA
## 6603        HERNANDEZ            J            HONORARIOS          D02012
## 11560           LOPEZ            A             ORDINARIA           E0687
## 443             HIJAR            J            HONORARIOS          A02012
## 6220          TEODORO            A             ORDINARIA           E0281
## 3079        HERNANDEZ            A             ORDINARIA           E0363
## 4769         MARISCAL            A             ORDINARIA          S01803
##           ERROR ENTIDADFEDERATIVA
## 6603     COLIMA            COLIMA
## 11560    COLIMA            COLIMA
## 443      COLIMA            COLIMA
## 6220   FORANEO.            COLIMA
## 3079   FORANEA.            COLIMA
## 4769     COLIMA            COLIMA