El objetivo del siguiente trabajo es dar a conocer lo sencillo que es utilizar R para cualquiera, incluso si las bases de datos se encuentran en formatos de otros software como STATA.
Los datos de ENAHO se descargaron en http://iinei.inei.gob.pe/microdatos/.
library(foreign) # Carga paquete para activar funciones para leer data de otros softwares conocidos como STATA, SPSS, etc
library(dplyr) # Carga paquete para activar funciones para manejar data de forma sencilla
library(readxl) # Carga paquete para activar funciones para leer archivos de excel
setwd("D:/onedrive/best/INEI Bruto/ENAHO") # primero configura tu lugar de trabajo o working directory
sumaria<-read.dta("sumaria-2017-12g.dta") # utiliza la funcion read.dta para leer el archivo de sumaria en formato STATA
departamentos<-read_xlsx("departamentos.xlsx") # utiliza la funcion read_xlsx para leer el archivo de excel
# A continuación se manejará las bases de datos con dplyr
sumaria<-sumaria %>% select(gashog2d,linea,mieperho,factor07,ubigeo,conglome,vivienda,hogar) # de las diversas variables que hay, sólo seleccionar estas variables
sumaria<-sumaria %>% mutate(gpcm=gashog2d/(12*mieperho),facpob=factor07*mieperho) # crea las variables gpcm y facpob
sumaria<-sumaria %>%
mutate(p0 = ifelse(gpcm>linea , 0, 1)) # crea la variable dummy (1 o 0) p0 para definir cuantos individuos tienen pobreza monetaria
sumaria$ubigeo1=substr(sumaria$ubigeo,1,2) # crea la variable ubigeo1, eligiendo las 2 primeras cifras de la variable ubigeo para identificar el departamento
sumaria<-inner_join(sumaria,departamentos)# crea la base de datos sumaria, uniendo 2 bases de datos.
modulo1<-read.dta("enaho01-2017-100.dta")
modulo1<-modulo1 %>% select(conglome,vivienda,hogar,p102,p103, p103a,p111a, p110, p110a, p113a, p1121, result)
bd<-inner_join(sumaria,modulo1) # crea la base de datos bd, uniendo sumaria y modulo1
bd<-bd %>%filter(result=="completa") # de la base de datos, filtra la variable result sólo con resultados compeltos
saveRDS(bd,"ENAHO2017.RDS") # guarda la BD en caso quieras usarlo en otro momento
Cuando observamos el gasto por individuo.
Cuando observamos el gasto por individuo.