(explicar brevemente que se analiza en el tab que les toco)
En primer lugar se importaron las librerías y se seleccionaron las preguntas que correspondian al tab del Excel.
library(haven)
library(dplyr)
FormasDe<- read_sav("~/Data Science/Proyecto 2/hogares.sav")
FormasDe <- select(FormasDe, DEPTO, AREA, POBREZA, P01D21, P01D27, P01D28)
names(FormasDe) <- c("Departamento", "Area", "Pobreza", "EliminarBasura", "UsaLenia", "ObtenerLenia")
FormasDe$ObtenerLenia[is.nan(FormasDe$ObtenerLenia)] <- 0
FormasDe <-FormasDe[complete.cases(FormasDe),]
FormasDe$Departamento <- as.factor(FormasDe$Departamento)
FormasDe$Area <- as.factor(FormasDe$Area)
FormasDe$Pobreza <- as.factor(FormasDe$Pobreza)
levels(FormasDe$Departamento)<- c("Guatemala", "El Progreso", "Sacatepequez", "Chimaltenango", "Escuintla", "Santa Rosa", "Solola", "Totonicapan", "Quetzaltenango", "Suchitepequez", "Retalhuleu", "San Marcos", "Huehuetenango", "Quiche", "Baja Verapaz", "Alta Verapaz", "Peten", "Izabal", "Zacapa", "Chiquimula", "Jalapa", "Jutiapa")
levels(FormasDe$Area)<- c("Urbana", "Rural")
levels(FormasDe$Pobreza) <- c ("Pobre extremo", "Pobre no extremo", "No pobre")
A continuación se reprodujeron los resultados de formas de eliminar la basura cuyas opciones son servicio municipal o quemarla. Se hizo en total, por área (rural y urbana), por nivel de pobreza y por departamento.
FormasDe_Total <- FormasDe %>%
summarise(Servicio_Municipal = sum(ifelse(EliminarBasura==1,1,0))/n()*100, Quemar = sum(ifelse(EliminarBasura==3,1,0))/n()*100)
FormasDe_Total
FormasDe_Area <- FormasDe %>%
group_by(Area) %>%
summarise(Servicio_Municipal = sum(ifelse(EliminarBasura==1,1,0))/n()*100, Quemar = sum(ifelse(EliminarBasura==3,1,0))/n()*100)
FormasDe_Area
FormasDe_Pobreza <- FormasDe %>%
group_by(Pobreza) %>%
summarise(Servicio_Municipal = sum(ifelse(EliminarBasura==1,1,0))/n()*100, Quemar = sum(ifelse(EliminarBasura==3,1,0))/n()*100)
FormasDe_Pobreza
FormasDe_Dep <- FormasDe %>%
group_by(Departamento) %>%
summarise(Servicio_Municipal = sum(ifelse(EliminarBasura==1,1,0))/n()*100, Quemar = sum(ifelse(EliminarBasura==3,1,0))/n()*100)
FormasDe_Dep
Luego, se sacaron los porcentajes sobre las personas que usan leña para cocinar.
UsaLenia_Total <- FormasDe %>%
summarise(UsaLenia = sum(ifelse(UsaLenia==1,1,0))/n()*100)
UsaLenia_Total
UsaLenia_Area <- FormasDe %>%
group_by(Area)%>%
summarise(UsaLenia = sum(ifelse(UsaLenia==1,1,0))/n()*100)
UsaLenia_Area
UsaLenia_Pobreza <- FormasDe %>%
group_by(Pobreza)%>%
summarise(UsaLenia = sum(ifelse(UsaLenia==1,1,0))/n()*100)
UsaLenia_Pobreza
UsaLenia_Departamento <- FormasDe %>%
group_by(Departamento)%>%
summarise(UsaLenia = sum(ifelse(UsaLenia==1,1,0))/n()*100)
UsaLenia_Departamento
Por último, se reprodujeron los resultados relacionados con la forma de obtener leña que es comprarla o recojerla.
FormasLenia_Total <- FormasDe %>%
filter(UsaLenia==1)%>%
summarise(Comprada = sum(ifelse(ObtenerLenia==1,1,0))/n()*100, Recogida = sum(ifelse(ObtenerLenia==4,1,0))/n()*100)
FormasLenia_Total
FormasLenia_Area <- FormasDe %>%
filter(UsaLenia==1)%>%
group_by(Area) %>%
summarise(Comprada = sum(ifelse(ObtenerLenia==1,1,0))/n()*100, Recogida = sum(ifelse(ObtenerLenia==4,1,0))/n()*100)
FormasLenia_Area
FormasLenia_Pobreza <- FormasDe %>%
filter(UsaLenia==1)%>%
group_by(Pobreza) %>%
summarise(Comprada = sum(ifelse(ObtenerLenia==1,1,0))/n()*100, Recogida = sum(ifelse(ObtenerLenia==4,1,0))/n()*100)
FormasLenia_Pobreza
FormasLenia_Dep <- FormasDe %>%
filter(UsaLenia==1)%>%
group_by(Departamento) %>%
summarise(Comprada = sum(ifelse(ObtenerLenia==1,1,0))/n()*100, Recogida = sum(ifelse(ObtenerLenia==4,1,0))/n()*100)
FormasLenia_Dep
Se decidió hacer summary de las tablas más importantes para encontrar estadísticas relevantes.
summary(FormasDe_Dep)
Departamento Servicio_Municipal Quemar
Guatemala : 1 Min. : 2.293 Min. :10.63
El Progreso : 1 1st Qu.:11.027 1st Qu.:48.43
Sacatepequez : 1 Median :13.788 Median :53.16
Chimaltenango: 1 Mean :17.286 Mean :52.88
Escuintla : 1 3rd Qu.:25.564 3rd Qu.:64.99
Santa Rosa : 1 Max. :42.807 Max. :84.48
(Other) :16
summary(FormasLenia_Dep)
Departamento Comprada Recogida
Guatemala : 1 Min. :18.62 Min. :20.39
El Progreso : 1 1st Qu.:29.32 1st Qu.:28.72
Sacatepequez : 1 Median :43.30 Median :40.15
Chimaltenango: 1 Mean :43.91 Mean :41.81
Escuintla : 1 3rd Qu.:56.58 3rd Qu.:55.64
Santa Rosa : 1 Max. :67.76 Max. :63.10
(Other) :16
summary(UsaLenia_Departamento)
Departamento UsaLenia
Guatemala : 1 Min. :29.12
El Progreso : 1 1st Qu.:74.29
Sacatepequez : 1 Median :84.78
Chimaltenango: 1 Mean :80.25
Escuintla : 1 3rd Qu.:90.43
Santa Rosa : 1 Max. :96.34
(Other) :16
En primer lugar se decidió analizar mediante una gráfica las formas de tirar basura por área.
grafica_area <- FormasDe_Area %>% gather(Forma.Eliminar, Porcentaje, -Area)
ggplot(data=grafica_area, aes(x=Area, y=Porcentaje, fill=Forma.Eliminar)) + geom_bar(stat="identity", position="stack") + labs(x="Área", title="Forma de Eliminar Basura por Área")
Se hizo una gráfica sobre las formas de recoger leña por departamento.
grafica_dep <- FormasLenia_Dep %>% gather(Forma.de.Conseguir.Lenia, Cantidad, -Departamento)
grafica_dep$Forma.de.Conseguir.Lenia <- factor(grafica_dep$Forma.de.Conseguir.Lenia)
grafica_dep$Cantidad <- as.numeric(grafica_dep$Cantidad) / 100
grafica_dep %>% ggplot(aes(Departamento, Cantidad)) +
geom_col(aes(fill = Forma.de.Conseguir.Lenia, group = Forma.de.Conseguir.Lenia), position = "nudge") +
theme(axis.text.x = element_text(angle = 90))