Agosto 2022

Introducción

  • En la siguiente presentación se mostrará el uso de algunos gráficos para la visualización de datos.
  • Se utilizarán las bases de datos de la Encuesta Nacional de Hogares (ENAHO) del INEI
setwd("C:/Rstudio/analisislambda")
sumaria <- read_dta("634-Modulo34/sumaria-2018.dta")
educacion <- read_dta("634-Modulo03/enaho01a-2018-300.dta")

Bases de datos

  • A partir de las bases de datos sumaria y educacion se crea una base de datos llamada basefinal

  • Y se renombran las variables p207 por Sexo y p209 por Estado civil

basefinal <- rename(basefinal,"Sexo"=p207)
basefinal <- rename(basefinal,"Estado civil"=p209)

Box Plot

ggplot(sumaria,aes(x=mes,y=inghog2d)) +
  geom_boxplot() +
  ggtitle("Gráfico de ingresos por mes", subtitle = "(En soles)") +
  xlab("Meses del año") +
  ylab("Ingreso del hogar")

Gráfico de Dispersión

ggplot(basefinal,aes(gashog2d,inghog2d)) +
  geom_point(aes(color = factor(pobreza),alpha = 0.2))

Histograma

ggplot(sumaria,aes(gashog2d)) +
  geom_histogram(bins = 100, color = "blue", fill = "green")

Gráfico de Barras

ggplot(grafico, aes(x = as.integer(estrsocial), y = gasto, 
                    fill = as.factor(Sexo), 
                    label = scales::comma(gasto, accuracy = 2))) +
  geom_bar(stat= "identity", show.legend = T) + 
  geom_text(size = 2.5, position = position_stack(vjus = 0.75))