Cargar librerias

library(readr) # leer datos
library(knitr) # Tablas amigables
library(dplyr) # select

Cargar Datos

datos <- read.csv("../Datos/personal_federalizado.csv")


head(datos)
##   X    CLAVECT           RFC               CURP     NOMBRECOMPLETODETRABAJADOR
## 1 1 01ADG0005J AAMR680705AT3 AAMR680705MASRRS09     ROSA IMELDA ARANDA MARQUEZ
## 2 2 01ADG0005J LAGE740824A21 LAGE740824MASRLL05  MARIA ELIZABETH LARA GALLEGOS
## 3 3 01ADG0005J LOVG681207PS0 LOVG681207HASPLR02 VALENCIA GERARDO LOPEZ VELARDE
## 4 4 01ADG0005J LUCJ750616L1A LUCJ750616HASNSN05      JUAN MANUEL LUNA CASTANON
## 5 5 01ADG0005J LUEB581004V15 LUEB581004MASVDT02   BEATRIZ EUG LUEVANO EDREHIRA
## 6 6 01ADG0005J LUEB581004V15 LUEB581004MASVDT02   BEATRIZ EUG LUEVANO EDREHIRA
##   NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA
## 1       ROSA IMELDA         ARANDA         MARQUEZ            A
## 2   MARIA ELIZABETH           LARA        GALLEGOS            A
## 3  VALENCIA GERARDO          LOPEZ         VELARDE            A
## 4       JUAN MANUEL           LUNA        CASTANON            A
## 5       BEATRIZ EUG        LUEVANO        EDREHIRA            A
## 6       BEATRIZ EUG        LUEVANO        EDREHIRA            A
##   DESCRIPCIONTIPONOMINA CLAVEDECATEORIA         ERROR ENTIDADFEDERATIVA
## 1             ORDINARIA           E0121 AGUSCALIENTES    AGUASCALIENTES
## 2             ORDINARIA          A01805 AGUSCALIENTES    AGUASCALIENTES
## 3             ORDINARIA           E0363 AGUSCALIENTES    AGUASCALIENTES
## 4             ORDINARIA           E7211 AGUSCALIENTES    AGUASCALIENTES
## 5             ORDINARIA           E0181 AGUSCALIENTES    AGUASCALIENTES
## 6             ORDINARIA           E0689 AGUSCALIENTES    AGUASCALIENTES
tail(datos)
##               X    CLAVECT           RFC               CURP
## 1610073 1610073 32TAR0077T GAFS880606US3 GAFS880606MSPRRC08
## 1610074 1610074 32TAR0077T MENR7512171D6 MENR751217HZSRYG08
## 1610075 1610075 32TAR0077T MERL901023F49 MERL901023HZSLVS06
## 1610076 1610076 32TAR0077T MOOC740716TE0 MOOC740716MZSRNR00
## 1610077 1610077 32TAR0077T SAMJ7408058C4 SAMJ740805MZSNCN04
## 1610078 1610078 32TAR0077T ZADG600712451 ZADG600712MSPVVD03
##                       NOMBRECOMPLETODETRABAJADOR         NOMBRESTRABAJADOR
## 1610073             MA. DEL SOCORRO GARCIA FRAGA           MA. DEL SOCORRO
## 1610074            JOSE RIGOBERTO MERCADO NOYOLA            JOSE RIGOBERTO
## 1610075           LUIS PEDRO MELENDREZ RUVALCABA                LUIS PEDRO
## 1610076              MA. CARMEN MORENO ONTIVEROS                MA. CARMEN
## 1610077 JUANA MARIA DE LAS NIEVES SANCHEZ MACIEL JUANA MARIA DE LAS NIEVES
## 1610078                  GUADALUPE ZAVALA DAVILA                 GUADALUPE
##         PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA
## 1610073         GARCIA           FRAGA            A             ORDINARIA
## 1610074        MERCADO          NOYOLA            A             ORDINARIA
## 1610075      MELENDREZ       RUVALCABA            A             ORDINARIA
## 1610076         MORENO       ONTIVEROS            A             ORDINARIA
## 1610077        SANCHEZ          MACIEL            A             ORDINARIA
## 1610078         ZAVALA          DAVILA            A             ORDINARIA
##         CLAVEDECATEORIA     ERROR ENTIDADFEDERATIVA
## 1610073          A03803 ZACATECAS         ZACATECAS
## 1610074          S01808 ZACATECAS         ZACATECAS
## 1610075          S01808 ZACATECAS         ZACATECAS
## 1610076          S01808 ZACATECAS         ZACATECAS
## 1610077          A03803 ZACATECAS         ZACATECAS
## 1610078          S01807 ZACATECAS         ZACATECAS

Explorar datos

str(datos)
## 'data.frame':    1610078 obs. of  13 variables:
##  $ X                         : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ CLAVECT                   : chr  "01ADG0005J" "01ADG0005J" "01ADG0005J" "01ADG0005J" ...
##  $ RFC                       : chr  "AAMR680705AT3" "LAGE740824A21" "LOVG681207PS0" "LUCJ750616L1A" ...
##  $ CURP                      : chr  "AAMR680705MASRRS09" "LAGE740824MASRLL05" "LOVG681207HASPLR02" "LUCJ750616HASNSN05" ...
##  $ NOMBRECOMPLETODETRABAJADOR: chr  "ROSA IMELDA ARANDA MARQUEZ" "MARIA ELIZABETH LARA GALLEGOS" "VALENCIA GERARDO LOPEZ VELARDE" "JUAN MANUEL LUNA CASTANON" ...
##  $ NOMBRESTRABAJADOR         : chr  "ROSA IMELDA" "MARIA ELIZABETH" "VALENCIA GERARDO" "JUAN MANUEL" ...
##  $ PRIMERAPELLIDO            : chr  "ARANDA" "LARA" "LOPEZ" "LUNA" ...
##  $ SEGUNDOAPELLIDO           : chr  "MARQUEZ" "GALLEGOS" "VELARDE" "CASTANON" ...
##  $ TIPODENOMINA              : chr  "A" "A" "A" "A" ...
##  $ DESCRIPCIONTIPONOMINA     : chr  "ORDINARIA" "ORDINARIA" "ORDINARIA" "ORDINARIA" ...
##  $ CLAVEDECATEORIA           : chr  "E0121" "A01805" "E0363" "E7211" ...
##  $ ERROR                     : chr  "AGUSCALIENTES" "AGUSCALIENTES" "AGUSCALIENTES" "AGUSCALIENTES" ...
##  $ ENTIDADFEDERATIVA         : chr  "AGUASCALIENTES" "AGUASCALIENTES" "AGUASCALIENTES" "AGUASCALIENTES" ...

Explorar

summary(datos)
##        X             CLAVECT              RFC                CURP          
##  Min.   :      1   Length:1610078     Length:1610078     Length:1610078    
##  1st Qu.: 402520   Class :character   Class :character   Class :character  
##  Median : 805040   Mode  :character   Mode  :character   Mode  :character  
##  Mean   : 805040                                                           
##  3rd Qu.:1207559                                                           
##  Max.   :1610078                                                           
##  NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR  PRIMERAPELLIDO    
##  Length:1610078             Length:1610078     Length:1610078    
##  Class :character           Class :character   Class :character  
##  Mode  :character           Mode  :character   Mode  :character  
##                                                                  
##                                                                  
##                                                                  
##  SEGUNDOAPELLIDO    TIPODENOMINA       DESCRIPCIONTIPONOMINA CLAVEDECATEORIA   
##  Length:1610078     Length:1610078     Length:1610078        Length:1610078    
##  Class :character   Class :character   Class :character      Class :character  
##  Mode  :character   Mode  :character   Mode  :character      Mode  :character  
##                                                                                
##                                                                                
##                                                                                
##     ERROR           ENTIDADFEDERATIVA 
##  Length:1610078     Length:1610078    
##  Class :character   Class :character  
##  Mode  :character   Mode  :character  
##                                       
##                                       
## 

Cargar libreria

library(fdth)

Tabla de Frecuencia

tabla.frecuencias <- fdt_cat(datos$ENTIDADFEDERATIVA)

tabla.frecuencias
##             Category      f   rf rf(%)      cf  cf(%)
##     ESTADO DE MEXICO 163793 0.10 10.17  163793  10.17
##     DISTRITO FEDERAL 155278 0.10  9.64  319071  19.82
##             VERACRUZ 103592 0.06  6.43  422663  26.25
##               OAXACA  87819 0.05  5.45  510482  31.71
##             GUERRERO  87070 0.05  5.41  597552  37.11
##              JALISCO  84643 0.05  5.26  682195  42.37
##              CHIAPAS  72309 0.04  4.49  754504  46.86
##            MICHOACAN  71501 0.04  4.44  826005  51.30
##           GUANAJUATO  69202 0.04  4.30  895207  55.60
##               PUEBLA  62676 0.04  3.89  957883  59.49
##           TAMAULIPAS  52238 0.03  3.24 1010121  62.74
##              HIDALGO  48874 0.03  3.04 1058995  65.77
##     SAN LUIS POTOSÃ\215  45148 0.03  2.80 1104143  68.58
##          NUEVO LEÓN  45080 0.03  2.80 1149223  71.38
##            CHIHUAHUA  41160 0.03  2.56 1190383  73.93
##              SINALOA  38834 0.02  2.41 1229217  76.35
##             COAHUILA  37817 0.02  2.35 1267034  78.69
##      BAJA CALIFORNIA  32281 0.02  2.00 1299315  80.70
##               SONORA  31387 0.02  1.95 1330702  82.65
##              TABASCO  29656 0.02  1.84 1360358  84.49
##              NAYARIT  28901 0.02  1.80 1389259  86.29
##            ZACATECAS  27408 0.02  1.70 1416667  87.99
##              MORELOS  27015 0.02  1.68 1443682  89.67
##             YUCATÃ\201N  26966 0.02  1.67 1470648  91.34
##           QUERÉTARO  23876 0.01  1.48 1494524  92.82
##             TLAXCALA  22342 0.01  1.39 1516866  94.21
##         QUINTANA ROO  21974 0.01  1.36 1538840  95.58
##       AGUASCALIENTES  19968 0.01  1.24 1558808  96.82
##             CAMPECHE  15222 0.01  0.95 1574030  97.76
##  BAJA CALIFORNIA SUR  12312 0.01  0.76 1586342  98.53
##               COLIMA  12283 0.01  0.76 1598625  99.29
##              DURANGO  11453 0.01  0.71 1610078 100.00

Se calcula la muesta total del estado de Puebla

N <- 1610078
n <- 16471 

n.Puebla <- ceiling(n * 0.04)

n.Puebla
## [1] 659

poblacion en Puebla

p.Puebla <- filter(datos, ENTIDADFEDERATIVA == "PUEBLA")
N <- nrow(p.Puebla)

N 
## [1] 62676

Muestra de puebla por columnas

Pueblamues <- sample(1:N, n.Puebla, replace = FALSE)


Pueblamues
##   [1] 13477 42565 48072 11414 14691 52042 32778 43437  4890  3094 38439 49440
##  [13] 28561 36708  2759 41821 28946 47651 50224 58604 48377  3834 42517 19758
##  [25] 28533  2847 41352 19544 54183 31378 49165 31060 55573 61295   472 34956
##  [37] 35428 25742 49583 42963  6839 13080 43873 54597 13706 10935  6502 53664
##  [49] 41723 27085 29316 12912 23946 57458 28026 62621  5404   759 50553 44215
##  [61] 13418 47508 41232 19827 42877 38743 13530 36157 57176 54520 50389 61900
##  [73] 11955 55729 35234 20566 41459 29234 31832 11461 14687  1416 48110   751
##  [85] 21884 10217 22685 46080 44844 13678 49337 56358 60700 39994  6786 12349
##  [97] 25471 17680 50965 14205 18354 25372  8327 46612  8929 39409  2093 44003
## [109] 32135 37455 41972 32160  5517 22209 37315 34586 59586 30846 24313 31674
## [121] 48730 18116 36776   708 15866 54626 57507 19534 20582 25462 26832 34502
## [133] 49733 23708   428 10969 21874 29245 57518 15285  8383 48491 26105 47559
## [145] 55203 39951 26655 15223 12458 16922 47991 40828 57436 26548 12903 25651
## [157]   520  8868 60148 15825 39608 10575 31811 31110 34699  5631 11236 41867
## [169]  9764 39698  6990 33029 23715  4872 22071 61468 12549 54095 21223 17089
## [181] 46329 29188 55980 40381 22386  2483 58337 28743 34958 45853 24165 15889
## [193] 44203 55699 56648  2256 16039  1225  1961 57535 56297 38861   546 19986
## [205] 23273 54014 55548 40634 42035 59641 25518 19593 32387 50560 52528  5944
## [217] 15022 11473  7859 32481 32584 23110 26628 44444 53787 20154 24455 52825
## [229]  9438 51271 47250 12657 20908 51938 55186 36616  7663 12380 12338 60626
## [241] 38546 19053 37774 59573 56607 51410 18526 54254  3710 55703  7352 59944
## [253]   832 44870  9469 20973 14098 58851 18160 32564 28681  7829 61954 53079
## [265] 27323 14585 50659   324 33427 30932 44447 36535 19976 60873 42717 58725
## [277] 27363 41318  3962 36713 48493 25975 38384 22822 11275  6835 45292  1264
## [289] 44199 34169 28958 46130 31300 48001 38038 31682 10873 29723 19046 16134
## [301] 29913 11662  8663  1664 34899 59821 16612 17243 16949 16137 37963 13167
## [313] 27099 56014 25869 48444   707 10189  7491 11917 57538  3226 49648 38216
## [325] 41793  3881  6376 42923 11550 25744 34055 32308 20272 34146 37677  7342
## [337] 35333 45218 12293  8367 49295 23670 25834 49750  9284 18755 61443 14910
## [349] 40434 47688 54658 62657 50452 22385  7333  7849  2947 40006  8688 41028
## [361] 13073 51235 47954  2167 42757 45037  4818 56091  2074 26926  9411 50669
## [373] 18385 16548 27610 29350 38287  5931 52597 14984 50548 39493 15595 29010
## [385] 48437 25681 17173 49849 10054 30683  1226 29097 48212 16233 15471 34159
## [397] 22060 37035 43780 35566 10542 56977  3654 44341 46939 52989 53575 14095
## [409] 48015 14334 39553 31033 16022 18123 34618 60781 45087  5018 24406  6595
## [421] 58838 35794 43609 53167 45108 41990 48948 27390 46413 14565 34728 51329
## [433]   864 57640  7557  3799 56481 56891 38593 53341 29863  4449 26570 24451
## [445] 61301 28753 39734  8316 10926 61365 42239 49731 23297 41520 22327 52215
## [457] 54564 46318  2681 11743 44064 40009 59981  9956 10179 23936 53420 28526
## [469] 40500 42706 29629 17266 17658 42966 22207 17664 14649 35320 48930 43224
## [481] 25243 51035 32443 40610 14869 10665 51946 19585 11355 44186 38358 37671
## [493] 35461 23049 56371 20940 45249 40408 10896 54519  4998 49350  3144 48254
## [505]  1559  4461 44339 49125 58888  4750 50717  4549 14810 20924  1081 37105
## [517] 27601 28568 53958 15578 44024 13447 12239 17359 21102 60875 42888 31145
## [529] 54556 61272 10029 20777     6 60186 44314 34971 54495 38426 44930 41039
## [541]  2203 55781 28782 40115  6077 18407 45936 62592 46357 19632 61633 56850
## [553] 55877 55719   323 32630 33088  6277 18268 17043 43502 55623 52123 10806
## [565] 16106   466 58208 34679 55113 34438 39853  1448 20596  4182 49156 18987
## [577] 36378  6534 56063 32673 33321 11846 36884 50623 25157 48915 54478 53160
## [589] 22606 53233 13079 58415 24967 27416 44697 25091 29159 43935 20609 31769
## [601] 40013 56595 11876  4791 15503 21395 45707  4400 39843 43779 27325 54957
## [613]  6362 30851 41606 50285 28004 27809  7453 12775 34000 46829 56010 45992
## [625]  3711  7266 39475 26885 38332  2617 54971 23496 16591  5339 13888 49607
## [637] 33122 27580 54740 31401 27636   153 10956 60188 49024  7778 23815 17925
## [649] 57034 36090 16249 51612 46253 46736 56140 59164 34856 42553 49651