Objetivo

El objetivo del siguiente trabajo es dar a conocer lo sencillo que es utilizar R para cualquiera, incluso si las bases de datos se encuentran en formatos de otros software como STATA.

Preparando la base de Datos

Los datos de ENAHO se descargaron en http://iinei.inei.gob.pe/microdatos/.

library(foreign) # Carga paquete para activar funciones para leer data de otros softwares conocidos como STATA, SPSS, etc
library(dplyr) # Carga paquete para activar funciones para manejar data de forma sencilla
library(readxl) # Carga paquete para activar funciones para leer archivos de excel

setwd("D:/onedrive/best/INEI Bruto/ENAHO") # primero configura tu lugar de trabajo o working directory
sumaria<-read.dta("sumaria-2017-12g.dta") # utiliza la funcion read.dta para leer el archivo de sumaria en formato STATA
departamentos<-read_xlsx("departamentos.xlsx") # utiliza la funcion read_xlsx para leer el archivo de excel

# A continuación se manejará las bases de datos con dplyr

sumaria<-sumaria %>% select(gashog2d,linea,mieperho,factor07,ubigeo,conglome,vivienda,hogar) # de las diversas variables que hay, sólo seleccionar estas variables

sumaria<-sumaria %>% mutate(gpcm=gashog2d/(12*mieperho),facpob=factor07*mieperho) # crea las variables gpcm y facpob

sumaria<-sumaria %>%
  mutate(p0 = ifelse(gpcm>linea , 0, 1)) # crea la variable dummy (1 o 0) p0 para definir cuantos individuos tienen pobreza monetaria

sumaria$ubigeo1=substr(sumaria$ubigeo,1,2) # crea la variable ubigeo1, eligiendo las 2 primeras cifras de la variable ubigeo para identificar el departamento

sumaria<-inner_join(sumaria,departamentos)# crea la base de datos sumaria, uniendo 2 bases de datos.


modulo1<-read.dta("enaho01-2017-100.dta") 
modulo1<-modulo1 %>% select(conglome,vivienda,hogar,p102,p103, p103a,p111a, p110, p110a, p113a, p1121, result)

bd<-inner_join(sumaria,modulo1) # crea la base de datos bd, uniendo sumaria y modulo1
bd<-bd %>%filter(result=="completa") # de la base de datos, filtra la variable result sólo con resultados compeltos

saveRDS(bd,"ENAHO2017.RDS") # guarda la BD en caso quieras usarlo en otro momento

Análisis exploratorio del Gasto

Cuando observamos el gasto por individuo.

Cuando observamos el gasto por individuo.