Practica 3 - Muestreos ‘MICHOACAN’

Las librerías

library(readr) # Leer datos
library(knitr) # Tablas amigables
library(fdth) # Crear tablas de ditribución
library(dplyr) # Comandos select, filter, mutate, group

Los datos

datos <- read.csv("../Datos/personal_federalizado.csv", encoding = "UTF-8")

Explorar los datos

summary(datos)
##        X             CLAVECT              RFC                CURP          
##  Min.   :      1   Length:1610078     Length:1610078     Length:1610078    
##  1st Qu.: 402520   Class :character   Class :character   Class :character  
##  Median : 805040   Mode  :character   Mode  :character   Mode  :character  
##  Mean   : 805040                                                           
##  3rd Qu.:1207559                                                           
##  Max.   :1610078                                                           
##  NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR  PRIMERAPELLIDO    
##  Length:1610078             Length:1610078     Length:1610078    
##  Class :character           Class :character   Class :character  
##  Mode  :character           Mode  :character   Mode  :character  
##                                                                  
##                                                                  
##                                                                  
##  SEGUNDOAPELLIDO    TIPODENOMINA       DESCRIPCIONTIPONOMINA CLAVEDECATEORIA   
##  Length:1610078     Length:1610078     Length:1610078        Length:1610078    
##  Class :character   Class :character   Class :character      Class :character  
##  Mode  :character   Mode  :character   Mode  :character      Mode  :character  
##                                                                                
##                                                                                
##                                                                                
##     ERROR           ENTIDADFEDERATIVA 
##  Length:1610078     Length:1610078    
##  Class :character   Class :character  
##  Mode  :character   Mode  :character  
##                                       
##                                       
## 
kable(head(datos))
X CLAVECT RFC CURP NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA ERROR ENTIDADFEDERATIVA
1 01ADG0005J AAMR680705AT3 AAMR680705MASRRS09 ROSA IMELDA ARANDA MARQUEZ ROSA IMELDA ARANDA MARQUEZ A ORDINARIA E0121 AGUSCALIENTES AGUASCALIENTES
2 01ADG0005J LAGE740824A21 LAGE740824MASRLL05 MARIA ELIZABETH LARA GALLEGOS MARIA ELIZABETH LARA GALLEGOS A ORDINARIA A01805 AGUSCALIENTES AGUASCALIENTES
3 01ADG0005J LOVG681207PS0 LOVG681207HASPLR02 VALENCIA GERARDO LOPEZ VELARDE VALENCIA GERARDO LOPEZ VELARDE A ORDINARIA E0363 AGUSCALIENTES AGUASCALIENTES
4 01ADG0005J LUCJ750616L1A LUCJ750616HASNSN05 JUAN MANUEL LUNA CASTANON JUAN MANUEL LUNA CASTANON A ORDINARIA E7211 AGUSCALIENTES AGUASCALIENTES
5 01ADG0005J LUEB581004V15 LUEB581004MASVDT02 BEATRIZ EUG LUEVANO EDREHIRA BEATRIZ EUG LUEVANO EDREHIRA A ORDINARIA E0181 AGUSCALIENTES AGUASCALIENTES
6 01ADG0005J LUEB581004V15 LUEB581004MASVDT02 BEATRIZ EUG LUEVANO EDREHIRA BEATRIZ EUG LUEVANO EDREHIRA A ORDINARIA E0689 AGUSCALIENTES AGUASCALIENTES
kable(tail(datos))
X CLAVECT RFC CURP NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA ERROR ENTIDADFEDERATIVA
1610073 1610073 32TAR0077T GAFS880606US3 GAFS880606MSPRRC08 MA. DEL SOCORRO GARCIA FRAGA MA. DEL SOCORRO GARCIA FRAGA A ORDINARIA A03803 ZACATECAS ZACATECAS
1610074 1610074 32TAR0077T MENR7512171D6 MENR751217HZSRYG08 JOSE RIGOBERTO MERCADO NOYOLA JOSE RIGOBERTO MERCADO NOYOLA A ORDINARIA S01808 ZACATECAS ZACATECAS
1610075 1610075 32TAR0077T MERL901023F49 MERL901023HZSLVS06 LUIS PEDRO MELENDREZ RUVALCABA LUIS PEDRO MELENDREZ RUVALCABA A ORDINARIA S01808 ZACATECAS ZACATECAS
1610076 1610076 32TAR0077T MOOC740716TE0 MOOC740716MZSRNR00 MA. CARMEN MORENO ONTIVEROS MA. CARMEN MORENO ONTIVEROS A ORDINARIA S01808 ZACATECAS ZACATECAS
1610077 1610077 32TAR0077T SAMJ7408058C4 SAMJ740805MZSNCN04 JUANA MARIA DE LAS NIEVES SANCHEZ MACIEL JUANA MARIA DE LAS NIEVES SANCHEZ MACIEL A ORDINARIA A03803 ZACATECAS ZACATECAS
1610078 1610078 32TAR0077T ZADG600712451 ZADG600712MSPVVD03 GUADALUPE ZAVALA DAVILA GUADALUPE ZAVALA DAVILA A ORDINARIA S01807 ZACATECAS ZACATECAS

Filtrar los datos par obtener solo ‘MICHOACAN’

michoacan.Poblacion <- filter(datos, ENTIDADFEDERATIVA == 'MICHOACAN')

kable(head(michoacan.Poblacion))
X CLAVECT RFC CURP NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA ERROR ENTIDADFEDERATIVA
863666 16ADG0001P AAGC641104 ALTAMIRANO GAMIÑO MA DEL CARMEN NULL NULL NULL A ORDINARIA 0358 MICHOACAN MICHOACAN
863667 16ADG0001P AAGC641104SQ1 AAGC641104MMNLMR04 ALTAMIRANO GAMIÑO MA DEL CARMEN NULL NULL NULL A ORDINARIA 0358 MICHOACAN MICHOACAN
863668 16ADG0001P AAHJ690610SY6 AAHJ690610HMNYRS04 AYALA HURTADO JESUS NULL NULL NULL A ORDINARIA CF53083 MICHOACAN MICHOACAN
863669 16ADG0001P AELA750903 ARTEAGA LOPEZ ANGEL NULL NULL NULL A ORDINARIA 0068 MICHOACAN MICHOACAN
863670 16ADG0001P AELA750903110 AELA750903HMNRPN06 ARTEAGA LOPEZ ANGEL NULL NULL NULL A ORDINARIA 0068 MICHOACAN MICHOACAN
863671 16ADG0001P AEUJ660312 ANGEL URBINA JOSEFINA NULL NULL NULL A ORDINARIA 0358 MICHOACAN MICHOACAN
kable(tail(michoacan.Poblacion))
X CLAVECT RFC CURP NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA ERROR ENTIDADFEDERATIVA
71496 935161 16ZZJ0040Z JAGA6006258N3 JAGA600625MMNMMB08 JAIMES GOMEZ ABAD NULL NULL NULL A ORDINARIA E0465 FORANEO MICHOACAN
71497 935162 16ZZJ0040Z LOMA760304JF8 LOMA760304MDFPNR07 LOPEZ MENDOZA ARACELI NULL NULL NULL A ORDINARIA E0687 MICHOACAN MICHOACAN
71498 935163 16ZZJ0040Z MORS750704UR2 MORS750704HMNNDL02 MONTAÑO RAUDA SALVADOR NULL NULL NULL A ORDINARIA E0465 FORANEO MICHOACAN
71499 935164 16ZZJ0040Z OABA5909292J8 OABA590929MGRRLL04 ORRANTI BAILON ALMA LETICIA NULL NULL NULL A ORDINARIA E0687 MICHOACAN MICHOACAN
71500 935165 16ZZJ0040Z RIMJ580510BS7 RIMJ580510HDFVLC07 RIVERA MALDONADO JACOBO NULL NULL NULL A ORDINARIA E0465 FORANEO MICHOACAN
71501 935166 16ZZJ0040Z SASM721224NK7 SASM721224MGRNTR05 SANCHEZ SOTO MARIA NULL NULL NULL A ORDINARIA E0687 MICHOACAN MICHOACAN

Averiguar la frecuencia de los datos por estado

tabla.distribucion <- fdt_cat(datos$ENTIDADFEDERATIVA, breaks = "Sturges")
tabla.distribucion
##             Category      f   rf rf(%)      cf  cf(%)
##     ESTADO DE MEXICO 163793 0.10 10.17  163793  10.17
##     DISTRITO FEDERAL 155278 0.10  9.64  319071  19.82
##             VERACRUZ 103592 0.06  6.43  422663  26.25
##               OAXACA  87819 0.05  5.45  510482  31.71
##             GUERRERO  87070 0.05  5.41  597552  37.11
##              JALISCO  84643 0.05  5.26  682195  42.37
##              CHIAPAS  72309 0.04  4.49  754504  46.86
##            MICHOACAN  71501 0.04  4.44  826005  51.30
##           GUANAJUATO  69202 0.04  4.30  895207  55.60
##               PUEBLA  62676 0.04  3.89  957883  59.49
##           TAMAULIPAS  52238 0.03  3.24 1010121  62.74
##              HIDALGO  48874 0.03  3.04 1058995  65.77
##      SAN LUIS POTOSÍ  45148 0.03  2.80 1104143  68.58
##           NUEVO LEÓN  45080 0.03  2.80 1149223  71.38
##            CHIHUAHUA  41160 0.03  2.56 1190383  73.93
##              SINALOA  38834 0.02  2.41 1229217  76.35
##             COAHUILA  37817 0.02  2.35 1267034  78.69
##      BAJA CALIFORNIA  32281 0.02  2.00 1299315  80.70
##               SONORA  31387 0.02  1.95 1330702  82.65
##              TABASCO  29656 0.02  1.84 1360358  84.49
##              NAYARIT  28901 0.02  1.80 1389259  86.29
##            ZACATECAS  27408 0.02  1.70 1416667  87.99
##              MORELOS  27015 0.02  1.68 1443682  89.67
##              YUCATÁN  26966 0.02  1.67 1470648  91.34
##            QUERÉTARO  23876 0.01  1.48 1494524  92.82
##             TLAXCALA  22342 0.01  1.39 1516866  94.21
##         QUINTANA ROO  21974 0.01  1.36 1538840  95.58
##       AGUASCALIENTES  19968 0.01  1.24 1558808  96.82
##             CAMPECHE  15222 0.01  0.95 1574030  97.76
##  BAJA CALIFORNIA SUR  12312 0.01  0.76 1586342  98.53
##               COLIMA  12283 0.01  0.76 1598625  99.29
##              DURANGO  11453 0.01  0.71 1610078 100.00

Cuantos registros del estado que me tocó

CR = nrow(datos)    # Total de registros de 'Personal_federalizado.csv
CRM = nrow(michoacan.Poblacion) # Total de registros solo de 'MICHOACAN'

cuantos <-  cat(c("MICHOACAN tiene",CRM,"registros","\n"))
## MICHOACAN tiene 71501 registros
CRM
## [1] 71501

Muestra estratificada conforme a la pobación total

N <- 1610078 # Poblacion
n <- 16471  # Muestra

muestreo.estratificado <- sample(1:N, n , replace = FALSE)
muestra.estratificada <- datos[muestreo.estratificado,]

kable(head(muestra.estratificada))
X CLAVECT RFC CURP NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA ERROR ENTIDADFEDERATIVA
272370 272370 09DES0133Y AIGR771008TUA AIGR771008HDFRLC08 RICARDO ARRIAGA GALLEGOS RICARDO ARRIAGA GALLEGOS A ORDINARIA E2334 DISTRITO FEDERAL DISTRITO FEDERAL
378459 378459 09DST0105U EACL670909IZ9 EACL670909HDFNSS01 JOSE LUIS ENCARNACION CASTAÑON JOSE LUIS ENCARNACION CASTAÑON A ORDINARIA E0462 DISTRITO FEDERAL DISTRITO FEDERAL
674545 674545 14DST0088F TOMP580516TR1 TOMP580516MJCRRT07 TORRES MARTINEZ PATRICIA PATRICIA TORRES MARTINEZ A ORDINARIA E0465 JALISCO JALISCO
783465 783465 15DTV0260K AUCO610905DR7 AUCO610905MGRNVB03 ANTUNEZ CUEVAS OBDULIA OBDULIA ANTUNEZ CUEVAS A ORDINARIA E2781 FORANEO ESTADO DE MEXICO
1229451 1229451 23DST0030N POAM760909JE0 POAM760909HQRRCG02 PORTILLO ACOSTA MIGUEL ANGEL MIGUEL ANGEL PORTILLO ACOSTA A ORDINARIA E0463 QUINTANA ROO QUINTANA ROO
1349710 1349710 27DCC0157Y PESD721003MP6 PESD721003MTCRNS05 DEISY PEREZ SANTIAGO DEISY PEREZ SANTIAGO A ORDINARIA E1489 TABASCO TABASCO
kable(tail(muestra.estratificada))
X CLAVECT RFC CURP NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA ERROR ENTIDADFEDERATIVA
805547 805547 15EJN0427K AODS660506000 AODS660506MMCPZL02 APOLONIO DIAZ SILVIA SILVIA APOLONIO DIAZ A ORDINARIA A0306360 MEXICO ESTADO DE MEXICO
1042319 1042319 20DCC1035A GATR8312162NA GATR831216MOCRRS01 GARCIA TORRES ROSA DE LOS ANGELES ROSA DE LOS ANGELES GARCIA TORRES A ORDINARIA E1489 OAXACA OAXACA
115387 115387 07DPR1472M PADE750909AY0 PADE750909HCSSMD05 PASCACIO DOMINGUEZ EDUARDO DE JESUS EDUARDO DE JESUS PASCACIO DOMINGUEZ A ORDINARIA E0281 FORANEO. CHIAPAS
640051 640051 14DJN1987C BAHM560110ML9 BAHM560110MJCLRR09 BALTAZAR HERRERA MARTHA ALICIA MARTHA ALICIA BALTAZAR HERRERA A ORDINARIA E0121 JALISCO JALISCO
1262370 1262370 24DST0001R PEAJ530903KT6 PEAJ530903HDFRLR09 JORGE PERFECTO ALBA JORGE PERFECTO ALBA A ORDINARIA E0465 FORANEO SAN LUIS POTOSÍ
680652 680652 14DTV0033Q AELJ7306144Y1 AELJ730614MJCSZS05 ASCENCIO LOZA MA DE JESUS MA DE JESUS ASCENCIO LOZA A ORDINARIA E2781 JALISCO JALISCO

Determinar un muestreo aleatorio simple del estado que me tocó (MICHOACAN)

misdatosdistribucion <- filter(tabla.distribucion, Category == 'MICHOACAN')  # Obtener mis datos de las frecuencias
n.Michoacan <- ceiling(n * (misdatosdistribucion$rf))
n.Michoacan
## [1] 732
# DATOS CALCULADOS ANTERIORMENTE
# Michoacan.Poblacion  # Datos solo de MICHOACAN
# CR = nrow(datos)    # Total de registros de 'Personal_federalizado.csv
# CRM = nrow(michoacan.Poblacion) # Total de registros solo de 'MICHOACAN'

N <- CRM # Solo Michoacan
N
## [1] 71501
muestraSimpleMichoacan <- sample(1:N, n.Michoacan , replace = FALSE)
kable(head(muestraSimpleMichoacan))
x
17685
64558
44033
60512
13347
45015
kable(tail(muestraSimpleMichoacan))
x
26417
5397
49012
51730
59125
57952
muestreo.Estrati.Michoacan <- michoacan.Poblacion[muestraSimpleMichoacan, ]
kable(head(muestreo.Estrati.Michoacan))
X CLAVECT RFC CURP NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA ERROR ENTIDADFEDERATIVA
17685 881350 16DJN0365O EUPS600110373 EUPS600110MMNQSR02 EQUIHUA PASAYE SARA NULL NULL NULL A ORDINARIA E0181 FORANEA. MICHOACAN
64558 928223 16ETV0492Z ZUSE560808 ZUÑIGA SALAS EMILIANO NULL NULL NULL A ORDINARIA 0358 MICHOACAN MICHOACAN
44033 907698 16DPR4414Y GAGR750101A67 GAGR750101MDFLMS06 GALARZA GOMEZ ROSA MARIA NULL NULL NULL A ORDINARIA E0281 FORANEO. MICHOACAN
60512 924177 16ETV0137I SESS631208 SEPULVEDA SOLORIO SERGIO NULL NULL NULL A ORDINARIA 0358 MICHOACAN MICHOACAN
13347 877012 16DES0155T TOPR610120Q47 TOPR610120MMNRZS02 TORRES DE LA PAZ ROSALVA NULL NULL NULL A ORDINARIA E0365 DE SECUNDARIA MICHOACAN
45015 908680 16DPR4683S ROMJ600918KH7 ROMJ600918HGTSRS07 ROSILLO MORALES J. JESUS NULL NULL NULL A ORDINARIA E0221 FORANEO. MICHOACAN
kable(tail(muestreo.Estrati.Michoacan))
X CLAVECT RFC CURP NOMBRECOMPLETODETRABAJADOR NOMBRESTRABAJADOR PRIMERAPELLIDO SEGUNDOAPELLIDO TIPODENOMINA DESCRIPCIONTIPONOMINA CLAVEDECATEORIA ERROR ENTIDADFEDERATIVA
26417 890082 16DPR0454Y QUPA5607101G3 QUPA560710MDFNRM06 QUINTERO PEREZ AMALIA ISABEL NULL NULL NULL A ORDINARIA E0281 FORANEO. MICHOACAN
5397 869062 16DCC0063D HIFC631113F99 HIFC631113MMNPRR01 HIPOLITO FRAGA MA CAROLINA NULL NULL NULL A ORDINARIA E1489 MICHOACAN MICHOACAN
49012 912677 16DPT0007F VEMN740129CP7 VEMN740129MMNLCR02 NORMA LETICIA VELAZQUEZ MACHUCA NORMA LETICIA VELAZQUEZ MACHUCA A ORDINARIA L5XCBII MICHOACAN MICHOACAN
51730 915395 16DST0030D EARI780427S36 EARI780427HSLSDS02 ESPARZA RODRIGUEZ JOSE ISRAE NULL NULL NULL A ORDINARIA E0465 FORANEO MICHOACAN
59125 922790 16ETV0044T MOMJ591122 MORALES MERCADO JAIME NULL NULL NULL A ORDINARIA 0067 MICHOACAN MICHOACAN
57952 921617 16EJN0004C GUML630817NB5 GUML630817MMNZRT04 GUZMAN MORALES LETICIA NULL NULL NULL A ORDINARIA E0199 MICHOACAN MICHOACAN