# Cargar las librerías necesarias
library(tidyverse)
 
# 1. Leer la Base de Datos del DENUE INEGI
# Nota: Los archivos del DENUE suelen venir con codificación 'latin1'
df_denue <- read_csv("denue.csv", locale = locale(encoding = "latin1"))
 
# 2. Filtrado por municipio (SanCarlos)
df_SanCarlos <- df_denue %>% 
  filter(municipio == "San Carlos")
 
# 3. Exportar la base nueva (Para su posterior uso en Power BI)
# La exportamos en formato CSV con codificación UTF-8 para evitar problemas de caracteres en Power BI
write_csv(df_SanCarlos, "denue_SanCarlos_exportado.csv")
 
# (Opcional) Importarla nuevamente si deseas continuar el tratamiento desde el nuevo archivo
df_powerbi_ready <- read_csv("denue_SanCarlos_exportado.csv")
 
# 4. Describir personas ocupadas y principal actividad comercial mediante gráficos
 
# Gráfico A: Distribución de Personas Ocupadas
grafico_personas <- df_SanCarlos %>%
  count(per_ocu) %>%
  ggplot(aes(x = reorder(per_ocu, n), y = n, fill = per_ocu)) +
  geom_col(show.legend = FALSE) +
  coord_flip() + # Volteamos el gráfico para leer mejor las etiquetas
  theme_minimal() +
  labs(
    title = "Establecimientos por Rango de Personas Ocupadas en SanCarlos",
    x = "Rango de Personas Ocupadas",
    y = "Cantidad de Establecimientos"
  ) +
  theme(plot.title = element_text(face = "bold"))
 
# Mostramos el gráfico A
print(grafico_personas)

# Gráfico B: Top 10 Principales Actividades Comerciales
grafico_actividad <- df_SanCarlos %>%
  count(nombre_act) %>%
  top_n(10, n) %>% # Filtramos solo el top 10 para no saturar el gráfico
  ggplot(aes(x = reorder(str_wrap(nombre_act, 40), n), y = n, fill = nombre_act)) +
  geom_col(show.legend = FALSE) +
  coord_flip() +
  theme_minimal() +
  labs(
    title = "Top 10 Actividades Comerciales en sancarlos",
    x = "Actividad Comercial",
    y = "Cantidad de Establecimientos"
  ) +
  theme(plot.title = element_text(face = "bold"))
 
# Mostramos el gráfico B
print(grafico_actividad)