# Base de datos
datos <- read.csv("data-eav2025.csv")

# Diccionario
dic <- read.csv("diccionario-eav2025.csv")

#Variable dependiente
datos$agua_problema <- factor(datos$al_menos_un_problema_agua,
                              levels = c(0,1),
                              labels = c("No", "Sí"))
#Variable independiente 
datos$ingreso <- factor(datos$p165)
datos$educacion <- factor(datos$p166)
datos$ocupacion <- factor(datos$p167)
datos$municipio <- factor(datos$nom_mun_mv)
###VARIABLE DEPENDIENTE (barra y pie para tener ambas)
# Tabla
table(datos$agua_problema)
## 
##   No   Sí 
## 2283 2672
# BARRAS
barplot(table(datos$agua_problema),
        col = c("brown", "tomato"),
        main = "Inseguridad hídrica",
        ylab = "Frecuencia")

# PIE
pie(table(datos$agua_problema),
    col = c("brown", "tomato"),
    main = "Proporción de inseguridad hídrica")

## VARIABLE INGRESO (CATEGÓRICO)
barplot(table(datos$ingreso),
        las = 2,
        col = "skyblue",
        main = "Ingreso del hogar",
        ylab = "Frecuencia")

## ¿Relacion con problemas de agua?
tabla_ingreso <- table(datos$ingreso, datos$agua_problema)

barplot(tabla_ingreso,
        beside = TRUE,
        col = c("skyblue", "tomato"),
        main = "Ingreso vs problemas de agua",
        ylab = "Frecuencia")

legend("topright",
       legend = c("Ingreso", "Agua"),
       fill = c("skyblue", "tomato"))

##VARIABLE EDUCACIÓN (CATEGÓRICA)
barplot(table(datos$educacion),
        las = 2,
        col = "lightgreen",
        main = "Nivel educativo",
        ylab = "Frecuencia")

### ¿Relacion con problemas de agua?
tabla_edu <- table(datos$educacion, datos$agua_problema)

barplot(tabla_edu,
        beside = TRUE,
        col = c("lightgreen", "tomato"),
        main = "Educación vs problemas de agua")

legend("topright",
       legend = c("Educación", "Agua"),
       fill = c("lightgreen", "tomato"))

### VARIABLE OCUPACIÓN 
barplot(table(datos$ocupacion),
        las = 2,
        col = "orange",
        main = "Condición de ocupación",
        ylab = "Frecuencia")

### ¿Relacion con problemas de agua?
tabla_ocu <- table(datos$ocupacion, datos$agua_problema)

barplot(tabla_ocu,
        beside = TRUE,
        col = c("orange", "tomato"),
        main = "Ocupación vs problemas de agua")

legend("topright",
       legend = c("Ocupación", "Agua"),
       fill = c("orange", "tomato"))

### VARIABLE MUNICIPIO
barplot(table(datos$municipio),
        las = 2,
        col = "gray",
        main = "Distribución por municipio",
        ylab = "Frecuencia")

### ¿Relacion con problemas de agua?
tabla_mun <- table(datos$municipio, datos$agua_problema)

barplot(tabla_mun,
        beside = TRUE,
        col = c("gray", "tomato"),
        las = 2,
        main = "Problemas de agua por municipio")

legend("topright",
       legend = c("Municipio", "Agua"),
       fill = c("gray", "tomato"))