1 Desarrollamos las estimaciones de las tipologías de proyectos

La Tabla 1 presenta los primeros 10 registros del dataset original, que ilustran la variedad de nudos críticos identificados en las comunas del Estado Mérida durante el período de estudio. Se observa que la comuna “SIMON BOLÍVAR” registró tres nudos críticos diferentes bajo el mismo código de ubicación geográfica (UBIGEO 140102) y código de circuito comunal (CC 14-01-2007): infraestructura (drenajes), electricidad y telecomunicaciones. Esta multiplicidad de problemáticas sugiere que esta comuna enfrenta desafíos simultáneos en múltiples frentes, lo que podría requerir una intervención coordinada y multisectorial.

El sistema de codificación utilizado evidencia la estructura jerárquica de la planificación territorial. El identificador único ID_COMUNA, compuesto por la combinación de COD_UBIGEO (que identifica ubicación geográfica a nivel municipal y parroquial) y COD_CC (que identifica el circuito comunal específico), permite una georreferenciación precisa de cada proyecto y facilita el análisis territorial de las intervenciones. Estos ejemplos iniciales evidencian la heterogeneidad de nudos críticos de las comunas y la necesidad de abordajes diferenciados en la planificación de las ACA. La recurrencia de ciertas tipologías de problemas, particularmente aquellos relacionados con infraestructura básica y servicios públicos, sugiere patrones comunes que merecen atención especial en el análisis posterior de correlaciones y efectividad de proyectos.

## -------------**Creación de variables dummy y resumen por comuna**---------------------##
df_raw <- read_excel ("C:/Users/william/Desktop/monografia aca merida/datos/ACA Modelaje R Final.xlsx", 
    sheet = "Resumen") %>%
  mutate(ID_COMUNA = paste0(COD_UBIGEO, "-", COD_CC))

# Crear dummies desde las variables cualitativas
df_dummies <- df_raw %>%
  dummy_cols(
    select_columns = c(
      "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG",
      "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION",
      "CLASIFICACION_DEL_PROYECTO"
    ),
    remove_first_dummy = FALSE
  )

# ---------------------Primera tabla - Variables originales (primeros 10 registros)---------------------
tabla1 <- df_raw %>%
  select(
    `Nudo Críticos por Tipología CFG` = CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
    `Nudos Críticos por Tipología de Gobierno` = CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
    `COD UBIGEO` = COD_UBIGEO,
    `COD CC` = COD_CC,
    COMUNA,
    `ID COMUNA` = ID_COMUNA
  ) %>%
  head(10)

kable(tabla1, caption = "Tabla 1. Primeros 10 registros de datos originales") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), font_size = 10) %>%
  footnote(general = "Nota. ID_COMUNA = Identificador único de comuna y combinación del código UBIGEO y código SITUR de cada comuna; COD_UBIGEO = Código de ubicación geográfica a nivel nacional y Mérida.",
           general_title = "")
Tabla 1. Primeros 10 registros de datos originales
Nudo Críticos por Tipología CFG Nudos Críticos por Tipología de Gobierno COD UBIGEO COD CC COMUNA ID COMUNA
INFRAESTRUCTURA DRENAJES 140102 14-01-2007 COMUNA SIMON BOLÍVAR. 140102-14-01-2007
ELECTRICIDAD ELECTRICIDAD 140102 14-01-2007 COMUNA SIMON BOLÍVAR. 140102-14-01-2007
TELECOMUNICACIONES TELECOMUNICACIONES 140102 14-01-2007 COMUNA SIMON BOLÍVAR. 140102-14-01-2007
MANEJO INTEGRAL DEL AGUA AGUA POTABLE 140102 C-MIX-2021-01-0003 COMUNA ETERNO GIGANTE 140102-C-MIX-2021-01-0003
VIVIENDA VIVIENDA 140102 C-MIX-2021-01-0003 COMUNA ETERNO GIGANTE 140102-C-MIX-2021-01-0003
MANEJO INTEGRAL DEL AGUA AGUA RESIDUAL 140102 C-MIX-2018-11-0084 COMUNA LUZ DEL ALBA 140102-C-MIX-2018-11-0084
AMBIENTE CANALIZACION 140102 C-MIX-2018-11-0084 COMUNA LUZ DEL ALBA 140102-C-MIX-2018-11-0084
INFRAESTRUCTURA VIVIENDA 140102 C-MIX-2018-11-0084 COMUNA LUZ DEL ALBA 140102-C-MIX-2018-11-0084
MANEJO INTEGRAL DEL AGUA AGUA POTABLE 140102 C-MIX-2021-02-0005 COMUNA FRANCISCO DE MIRANDA 140102-C-MIX-2021-02-0005
INFRAESTRUCTURA DRENAJES 140102 C-MIX-2021-02-0005 COMUNA FRANCISCO DE MIRANDA 140102-C-MIX-2021-02-0005
Nota. ID_COMUNA = Identificador único de comuna y combinación del código UBIGEO y código SITUR de cada comuna; COD_UBIGEO = Código de ubicación geográfica a nivel nacional y Mérida.
#------------------------Segunda tabla - Variables importantes (primeros 10 registros)--------------------
tabla2 <- df_raw %>%
  select(
    n_proyectos,
    PLAZOS,
    CLASIFICACION_DEL_PROYECTO,
    TIPOLOGIA_CFG_NUM,
    GOBERNACION_NUM,
    RATIO_ACA_PROYECTO_CULMINADO,
    Clasificacion_Actores_institucionales
  ) %>%
  head(10)

kable(tabla2, caption = "Tabla 2. Primeros 10 registros de variables de análisis principales") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), font_size = 10)
Tabla 2. Primeros 10 registros de variables de análisis principales
n_proyectos PLAZOS CLASIFICACION_DEL_PROYECTO TIPOLOGIA_CFG_NUM GOBERNACION_NUM RATIO_ACA_PROYECTO_CULMINADO Clasificacion_Actores_institucionales
4 1 3 5 5 3 2
4 1 1 4 6 1 2
4 1 1 13 17 1 2
4 2 3 6 2 3 2
4 2 1 16 21 1 1
4 1 1 6 3 1 2
4 1 1 1 4 1 1
4 1 3 5 21 3 3
4 2 1 6 2 1 2
4 2 1 5 5 1 2

Posteriormente, las variables cualitativas fueron codificadas y operacionalizadas para el análisis cuantitativo, como se detalló en el Marco Metodológico.

2 Análisis de tendencia central y de dispersión de las variables originales

Para complementar el análisis de las variables ordinales y categóricas, las Tablas de frecuencias muestra la distribución de las mismas y porcentajes de las variables clave. Los datos revelan que el 76,77% de las comunas participaron en las cuatro consultas nacionales, demostrando un compromiso sostenido con el proceso de planificación. Sin embargo, casi la mitad de los proyectos (48,99%) fueron catalogados como “No Considerados”, indicando una significativa desconexión entre la identificación de problemas y su posterior priorización ejecutiva. Solo el 25,25% de los proyectos alcanzaron el estado de “Culminados”. La planificación temporal muestra que la abrumadora mayoría de los proyectos (83,84%) se diseñaron para un horizonte de tiempo de mediano plazo (1-2 años), coherente con la naturaleza estructural de los nudos críticos. Respecto a los actores institucionales, se observa una predominancia de la gestión por parte de entidades e instituciones nacionales y estadales (51,52%), mientras que la participación de actores municipales/comunales (19,19%) y privados ( 3,54%) es considerablemente menor.

#-------------------- Análisis de tendencia central y dispersión--------------------#
analisis_tendencia <- df_raw %>%
  select(n_proyectos, PLAZOS,CLASIFICACION_DEL_PROYECTO, TIPOLOGIA_CFG_NUM, GOBERNACION_NUM, 
         RATIO_ACA_PROYECTO_CULMINADO, Clasificacion_Actores_institucionales) %>%
  psych::describe() %>%
  rownames_to_column("Variable") %>%
  select(Variable, n, mean, sd, min, max, median, skew, kurtosis)

# Análisis de frecuencias para variables categóricas n_proyectos
frecuencias_n_proyectos <- df_raw %>%
  count(n_proyectos) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 2)) %>%
  rename(Frecuencia = n, Categoría = n_proyectos)
kable(frecuencias_n_proyectos, caption = "Distribución de frecuencias para la variable n_proyectos") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Distribución de frecuencias para la variable n_proyectos
Categoría Frecuencia Porcentaje
2 6 3.03
3 40 20.20
4 152 76.77
# Análisis de frecuencias para variables categóricas Clasificación del proyecto
frecuencias_clasificacion_proyecto <- df_raw %>%
  count(CLASIFICACION_DEL_PROYECTO) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 2)) %>%
  rename(Frecuencia = n, Categoría = CLASIFICACION_DEL_PROYECTO)
kable(frecuencias_clasificacion_proyecto, caption = "Distribución de frecuencias para la variable CLASIFICACION_DEL_PROYECTO") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Distribución de frecuencias para la variable CLASIFICACION_DEL_PROYECTO
Categoría Frecuencia Porcentaje
1 97 48.99
2 3 1.52
3 48 24.24
4 50 25.25
# Análisis de frecuencias para variables categóricas Plazos
frecuencias_plazos <- df_raw %>%
  count(PLAZOS) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 2)) %>%
  rename(Frecuencia = n, Categoría = PLAZOS)

kable(frecuencias_plazos, caption = "Distribución de frecuencias para la variable PLAZOS") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Distribución de frecuencias para la variable PLAZOS
Categoría Frecuencia Porcentaje
0 6 3.03
1 26 13.13
2 166 83.84
# Análisis de RATIO_ACA_PROYECTO_CULMINADO
frecuencias_ratio <- df_raw %>%
  count(RATIO_ACA_PROYECTO_CULMINADO) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 2)) %>%
  rename(Frecuencia = n, Categoría = RATIO_ACA_PROYECTO_CULMINADO)

kable(frecuencias_ratio, caption = "Distribución de frecuencias para la variable RATIO_ACA_PROYECTO_CULMINADO") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Distribución de frecuencias para la variable RATIO_ACA_PROYECTO_CULMINADO
Categoría Frecuencia Porcentaje
1 97 48.99
2 3 1.52
3 48 24.24
4 50 25.25
# Análisis de actores institucionales
frecuencias_actores <- df_raw %>%
  count(Clasificacion_Actores_institucionales) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 2)) %>%
  rename(Frecuencia = n, Categoría = Clasificacion_Actores_institucionales)

kable(frecuencias_actores, caption = "Distribución de frecuencias para la variable Clasificacion_Actores_institucionales") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Distribución de frecuencias para la variable Clasificacion_Actores_institucionales
Categoría Frecuencia Porcentaje
1 51 25.76
2 102 51.52
3 38 19.19
4 7 3.54
##--------------------------Trafico de frecuencias---------------------------

# Combinar todos los dataframes de frecuencias en uno solo
plot_data <- bind_rows(
  frecuencias_n_proyectos %>% mutate(Variable = "Número de Consultas (n_proyectos)"),
  frecuencias_clasificacion_proyecto %>% mutate(Variable = "Estado del Proyecto"),
  frecuencias_ratio %>% mutate(Variable = "Ratio de Efectividad"),
  frecuencias_plazos %>% mutate(Variable = "Plazo de Ejecución (PLAZOS)"),
  frecuencias_actores %>% mutate(Variable = "Actor Institucional Principal")
) %>%
  mutate(Categoría = as.factor(Categoría))

# Definir etiquetas descriptivas para cada categoría
plot_data <- plot_data %>%
  mutate(
    Etiqueta_Categoria = case_when(
      Variable == "Estado del Proyecto" ~ case_when(
        Categoría == 1 ~ "1 - No Considerado",
        Categoría == 2 ~ "2 - No Culminado",
        Categoría == 3 ~ "3 - En Ejecución",
        Categoría == 4 ~ "4 - Culminado"
      ),
      Variable == "Ratio de Efectividad" ~ case_when(
        Categoría == 1 ~ "1 - Muy Baja",
        Categoría == 2 ~ "2 - Baja",
        Categoría == 3 ~ "3 - Media",
        Categoría == 4 ~ "4 - Alta"
      ),
      Variable == "Plazo de Ejecución (PLAZOS)" ~ case_when(
        Categoría == 0 ~ "0 - Sin Dato",
        Categoría == 1 ~ "1 - Corto Plazo",
        Categoría == 2 ~ "2 - Mediano Plazo"
      ),
      Variable == "Actor Institucional Principal" ~ case_when(
        Categoría == 1 ~ "1 - Ministerio",
        Categoría == 2 ~ "2 - Gob. Nac/Est.",
        Categoría == 3 ~ "3 - Mun./Comunal",
        Categoría == 4 ~ "4 - Privado"
      ),
      Variable == "Número de Consultas (n_proyectos)" ~ as.character(Categoría),
      TRUE ~ as.character(Categoría)
    )
  )

# Calcular el límite superior del eje Y para asegurar que las etiquetas encajen
y_max <- max(plot_data$Frecuencia) * 1.1

# Crear el gráfico de barras con facetas mejorado
ggplot(plot_data, aes(x = Etiqueta_Categoria, y = Frecuencia, fill = Etiqueta_Categoria)) +
  geom_col(show.legend = FALSE) +  
  geom_text(aes(label = Frecuencia), vjust = -0.5, size = 3.5) +  
  facet_wrap(~ Variable, scales = "free_x", ncol = 5) + 
  scale_fill_viridis_d() + 
  labs(
    title = "Distribución de Frecuencias de Variables Clave",
    x = "Categorías",
    y = "Frecuencia (Número de Proyectos)",
    caption = "Elaboración Propia - William Gutierrez"  
  ) +
  theme_minimal() +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1, size = 9),  
    strip.text = element_text(face = "bold", size = 10), 
    plot.title = element_text(hjust = 0.5, face = "bold"),  
    plot.caption = element_text(hjust = 1, size = 9, face = "italic")  
  ) +
  ylim(0, y_max)  

El Gráfico de Distribución de Frecuencias de Variables Claves representa gráficamente estas distribuciones de frecuencia, permitiendo una comparación inmediata de las proporciones entre categorías.

El gráfico confirma el patrón identificado en la tabla, destacando visualmente la predominancia de: 1) la participación en cuatro consultas, 2) los proyectos no considerados, 3) los plazos de ejecución medianos, y 4) la gestión por actores nacionales/estatales. La representación gráfica facilita la identificación de desequilibrios en la distribución de las variables, particularmente la brecha entre proyectos no considerados y culminado.

3 Frecuencia global por cada tipología de CFG y Gobernación, ¿qué problema es el más común?

Para establecer cuáles son los nudos críticos más recurrentes en todo el Estado Mérida, primero calculamos la frecuencia absoluta y relativa de cada tipología CFG y de gobernación. Esto nos permite identificar las áreas de mayor concentración de problemas y priorizar las líneas de análisis posteriores.

4 Frecuencias de Consejo Federal de Gobierno (CFG)

Las Gráficas donde se presenta un gráfico de Pareto que analiza la distribución de los nudos críticos según el número de proyectos ACA identificados para cada tipología CFG, es crucial para priorizar la asignación de recursos y esfuerzos a la planificación, ya que revela que los problemas no están distribuidos de manera uniforme, sino que se concentran en unas pocas áreas críticas.

Al revisar los gráficos, se puede ver que el 62,6% de todos los proyectos se concentra en sólo cuatro tipologías. El Manejo Integral del Agua es la problemática principal, representando por sí sola más de una cuarta parte (27,27%) de todos los proyectos ACA.

Esto indica que la crisis hídrica no es un problema aislado, sino la principal prioridad de las comunidades merideñas, superando con creces a la segunda tipología, Vialidad (15,15%), por un margen de 12 puntos porcentuales. La curva de porcentaje acumulado (línea amarilla y roja del interactivo) muestra una pendiente pronunciada al inicio, que se va suavizando después de las primeras 7 tipologías, confirmando el principio de Pareto o 80/20 (El 20% de las causas explican el 80% de los efectos): aproximadamente el 80% de los proyectos (80,81%, siendo exactos) se concentra en resolver sólo el 44% de las tipologías (7 de 17), es decir, un pequeño número de causas.

Este hallazgo sugiere que una estrategia de intervención pública focalizada en estas siete áreas principales podría resolver la gran mayoría de los problemas identificados con una mayor eficiencia en el uso de recursos.

De manera similar, al realizar el análisis desde una perspectiva territorial confirma y refuerza los hallazgos del análisis por proyectos. Manejo Integral del Agua mantiene su posición dominante al afectar 43 comunas (23,76% del total), lo que indica que este problema no se limita a áreas específicas, sino que tiene carácter sistémico a nivel estatal, en la Tabla 5 existe una notable consistencia en el ordenamiento de las primeras posiciones entre ambas tablas valida la robustez del diagnóstico, las primeras 4 tipologías mantienen el mismo orden tanto por proyectos como por comunas, además las primeras 6 tipologías muestran variaciones mínimas en su posicionamiento. El 74.03% de todas las afectaciones territoriales se concentra en las primeras 6 tipologías

La distribución territorial revela que los problemas principales del Estado Mérida no son fenómenos localizados sino deficiencias estructurales generalizadas:

• Manejo Integral del Agua está presente en más del 67,18% de las comunas estudiadas

• Vialidad afecta a 27 comunas, representando una distribución territorial considerable

• Vivienda y Electricidad mantienen presencia significativa con 21 y 18 comunas respectivamente.

##-------------------------------Resumen CFG por Comuna-------------------------------##
cfg_cols <- df_dummies %>% 
  select(starts_with("CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_")) %>% 
  names()

df_cfg_summary <- df_dummies %>%
  group_by(ID_COMUNA) %>%
  summarise(
    n_proyectos = n(),
    across(all_of(cfg_cols), list(
      count = ~ sum(.x, na.rm = TRUE),
      pct = ~ sum(.x, na.rm = TRUE) / n() * 100
    ))
  ) %>%
  ungroup()

##-----------------------Resumen de Gobernación por comuna----------------------
gob_cols <- df_dummies %>% 
  select(starts_with("CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_")) %>% 
  names()

df_gob_summary <- df_dummies %>%
  group_by(ID_COMUNA) %>%
  summarise(
    n_proyectos = n(),
    across(all_of(gob_cols), list(
      count = ~ sum(.x, na.rm = TRUE),
      pct = ~ sum(.x, na.rm = TRUE) / n() * 100
    ))
  ) %>%
  ungroup()

##------------------------Análisis de frecuencias-------------------------------

# Función mejorada para análisis completo
analizar_frecuencia <- function(data, var, fill_color, line_color, titulo, tipo = "proyectos") {
  # Determinar nombre de etiqueta según tipo
  y_label <- ifelse(tipo == "proyectos", "Número de proyectos", "Número de comunas")
  
  # Frecuencias globales
  freq <- data %>%
    count({{var}}, name = "n") %>%
    arrange(desc(n)) %>%
    mutate(
      pct = n / sum(n) * 100,
      cum_pct = cumsum(pct),
      etiqueta = paste0(n, "\n(", round(pct, 1), "%)")
    )
  
  # Gráfico combinado
  plot <- ggplot(freq, 
         aes(x = reorder({{var}}, n), y = n)) +
    geom_col(fill = fill_color, alpha = 0.8) +
    geom_text(aes(label = etiqueta), 
              hjust = -0.1, size = 3.5, color = "black", lineheight = 0.8) +
    geom_line(aes(y = cum_pct * max(n) / 100), 
              group = 1, color = line_color, size = 0.8) +
    geom_point(aes(y = cum_pct * max(n) / 100), 
               color = line_color, size = 2) +
    scale_y_continuous(
      name = y_label,
      sec.axis = sec_axis(~ . * 100 / max(freq$n), 
                         name = "Porcentaje acumulado (%)",
                         labels = scales::percent_format(scale = 1))
    ) +
    coord_flip() +
    labs(
      title = titulo,
      subtitle = "Barras: frecuencia absoluta | Texto: conteo y % individual | Línea: % acumulado",
      x = NULL
    ) +
    theme_minimal(base_size = 12) +
    expand_limits(y = max(freq$n) * 1.15)
  
  return(list(freq = freq, plot = plot))
}

# Función mejorada para frecuencia por comuna
analizar_frecuencia_comuna <- function(data, var, fill_color, line_color, titulo) {
  freq_comuna <- data %>%
    distinct(ID_COMUNA, {{var}}) %>%  
    count({{var}}, name = "n_comunas") %>%
    arrange(desc(n_comunas)) %>%
    mutate(
      pct_comunas = n_comunas / sum(n_comunas) * 100,
      cum_pct = cumsum(pct_comunas),
      etiqueta = paste0(n_comunas, "\n(", round(pct_comunas, 1), "%)")
    )
  
  # Gráfico combinado
  plot <- ggplot(freq_comuna, 
         aes(x = reorder({{var}}, n_comunas), y = n_comunas)) +
    geom_col(fill = fill_color, alpha = 0.8) +
    geom_text(aes(label = etiqueta), 
              hjust = -0.1, size = 3.5, color = "black", lineheight = 0.8) +
    geom_line(aes(y = cum_pct * max(n_comunas) / 100),
              group = 1, color = line_color, size = 0.8) +
    geom_point(aes(y = cum_pct * max(n_comunas) / 100),
               color = line_color, size = 2) +
    scale_y_continuous(
      name = "Número de comunas",
      sec.axis = sec_axis(~ . * 100 / max(freq_comuna$n_comunas),
                         name = "Porcentaje acumulado (%)",
                         labels = scales::percent_format(scale = 1))
    ) +
    coord_flip() +
    expand_limits(y = max(freq_comuna$n_comunas) * 1.15) +
    labs(
      title = titulo,
      subtitle = "Barras: frecuencia absoluta | Texto: conteo y % de comunas | Línea: % acumulado",
      x = NULL
    ) +
    theme_minimal(base_size = 12)
  
  return(list(freq_comuna = freq_comuna, plot = plot))
}
## ----------------------------Análisis para CFG--------------------------------

# Conteo y proporciones globales por Tipologia CFG

cfg_global_proyectos <- analizar_frecuencia(
  df_dummies,
  CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
  "darkblue", "gold",
  "Frecuencia global de tipologías CFG (Proyectos)"
)
cfg_global_comunas <- analizar_frecuencia_comuna(
  df_dummies,
  CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
  "darkblue", "gold",
  "Frecuencia de tipologías CFG por comuna"
)


##----------------------------Mostrar resultados-------------------------------------
# Conteo y proporciones globales sobre la variable original
freq_cfg <- df_dummies %>%
  count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n") %>%
  arrange(desc(n)) %>%
  mutate(
    pct     = n / sum(n) * 100,
    cum_pct = cumsum(pct)
  )
#-------------------------Top 10 barras simples--------------------------------
freq_cfg %>%
  slice(1:10) %>%
  ggplot(aes(
    x = reorder(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, n),
    y = n
  )) +
    geom_col(fill = "darkblue") +
    coord_flip() +
    labs(
      title = "Top 10 tipologías CFG más frecuentes",
      x     = "Tipología CFG",
      y     = "Número de proyectos"
    ) +
    theme_minimal()

##--------------------Grafico de frecuencias de tipologías CFG------------------
print(cfg_global_proyectos$plot)

#--------Frecuencia absoluta y relativa de comunas por tipología CFG---------
freq_cfg_comuna <- df_dummies %>%
  distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG) %>%
  count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n_comunas") %>%
  arrange(desc(n_comunas)) %>%
  mutate(
    pct_comunas = n_comunas / sum(n_comunas) * 100,
    cum_pct     = cumsum(pct_comunas)
  )

#---------------------------------Top 10 comunas--------------------------------
freq_cfg_comuna %>%
  slice(1:10) %>%
  ggplot(aes(
    x = reorder(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, n_comunas),
    y = n_comunas
  )) +
    geom_col(fill = "darkblue") +
    coord_flip() +
    labs(
      title = "Top 10 tipologías CFG por número de comunas",
      x     = "Tipología CFG",
      y     = "Número de comunas"
    ) +
    theme_minimal()

##----------------Grafico de frecuencias de tipologías CFG--------------------
print(cfg_global_comunas$plot)

# ==============================================================================
#  TABLA COMPLETA DE FRECUENCIAS CFG POR PROYECTOS
# ==============================================================================

crear_tabla_cfg_proyectos <- function(data) {
  
  # Calcular frecuencias
  tabla_cfg <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n_proyectos") %>%
    arrange(desc(n_proyectos)) %>%
    mutate(
      porcentaje = round(n_proyectos / sum(n_proyectos) * 100, 2),
      pct_acumulado = round(cumsum(porcentaje), 2),
      ranking = row_number()
    ) %>%
    rename(
      "Ranking" = ranking,
      "Tipología CFG" = CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      "N° Proyectos" = n_proyectos,
      "Porcentaje (%)" = porcentaje,
      "% Acumulado" = pct_acumulado
    )
  
  # Crear tabla formateada con kableExtra
  tabla_final <- tabla_cfg %>%
    kable(
      caption = "Tabla 4.1: Distribución de Frecuencias de Tipologías CFG por Número de Proyectos",
      align = c("c", "l", "c", "c", "c"),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 12
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#2c3e50") %>%
    column_spec(2, width = "20em") %>%
    column_spec(3:5, width = "8em") %>%
    row_spec(1:4, background = "#e8f4fd") %>%  # Resaltar top 4
    add_header_above(c(" " = 2, "Frecuencias Absolutas y Relativas" = 3)) %>%
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Nota: Las primeras 4 tipologías concentran el 62.6% de todos los nudos críticos"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_cfg, tabla = tabla_final))
}

# ==============================================================================
#  TABLA COMPLETA DE FRECUENCIAS CFG POR COMUNAS
# ==============================================================================

crear_tabla_cfg_comunas <- function(data) {
  
  # Calcular frecuencias por comuna (sin repetir comunas)
  tabla_cfg_comunas <- data %>%
    distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG) %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n_comunas") %>%
    arrange(desc(n_comunas)) %>%
    mutate(
      porcentaje = round(n_comunas / sum(n_comunas) * 100, 2),
      pct_acumulado = round(cumsum(porcentaje), 2),
      ranking = row_number()
    ) %>%
    rename(
      "Ranking" = ranking,
      "Tipología CFG" = CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      "N° Comunas" = n_comunas,
      "Porcentaje (%)" = porcentaje,
      "% Acumulado" = pct_acumulado
    )
  
  # Crear tabla formateada
  tabla_final <- tabla_cfg_comunas %>%
    kable(
      caption = "Tabla 4.2: Distribución de Frecuencias de Tipologías CFG por Número de Comunas Afectadas",
      align = c("c", "l", "c", "c", "c"),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 12
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#2c3e50") %>%
    column_spec(2, width = "20em") %>%
    column_spec(3:5, width = "8em") %>%
    row_spec(1:4, background = "#e8f4fd") %>%  # Resaltar top 4
    add_header_above(c(" " = 2, "Distribución Territorial" = 3)) %>%
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Nota: Una comuna puede tener múltiples tipologías, pero se cuenta una sola vez por tipología"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_cfg_comunas, tabla = tabla_final))
}

# ==============================================================================
# TABLA COMPARATIVA CFG: PROYECTOS VS COMUNAS
# ==============================================================================

crear_tabla_comparativa_cfg <- function(data) {
  
  # Datos por proyectos
  cfg_proyectos <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n_proyectos") %>%
    mutate(pct_proyectos = round(n_proyectos / sum(n_proyectos) * 100, 2))
  
  # Datos por comunas
  cfg_comunas <- data %>%
    distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG) %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n_comunas") %>%
    mutate(pct_comunas = round(n_comunas / sum(n_comunas) * 100, 2))
  
  # Unir ambas tablas
  tabla_comparativa <- cfg_proyectos %>%
    inner_join(cfg_comunas, by = "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG") %>%
    arrange(desc(n_proyectos)) %>%
    mutate(
      ranking = row_number(),
      intensidad = round(n_proyectos / n_comunas, 2)  # Proyectos por comuna promedio
    ) %>%
    select(
      ranking,
      CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      n_proyectos, pct_proyectos,
      n_comunas, pct_comunas,
      intensidad
    ) %>%
    rename(
      "Rank" = ranking,
      "Tipología CFG" = CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      "N° Proy." = n_proyectos,
      "% Proy." = pct_proyectos,
      "N° Com." = n_comunas,
      "% Com." = pct_comunas,
      "Intensidad" = intensidad
    )
  
  # Crear tabla formateada
  tabla_final <- tabla_comparativa %>%
    kable(
      caption = "Tabla 4.3: Análisis Comparativo CFG - Proyectos vs Comunas Afectadas",
      align = c("c", "l", rep("c", 5)),
      format = "html",
      digits = 2
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 11
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#2c3e50", width = "3em") %>%
    column_spec(2, width = "15em") %>%
    column_spec(3:7, width = "6em") %>%
    add_header_above(c(" " = 2, "Por Proyectos" = 2, "Por Comunas" = 2, "Indicador" = 1)) %>%
    row_spec(1:3, background = "#ffe6e6") %>%  # Top 3 en rojo suave
    row_spec(4:7, background = "#fff2e6") %>%  # Siguientes 4 en naranja suave
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Intensidad = N° Proyectos / N° Comunas (promedio de proyectos por comuna por tipología)"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_comparativa, tabla = tabla_final))
}

# ==============================================================================
#  TABLA RESUMEN EJECUTIVO CFG (TOP 10)
# ==============================================================================

crear_tabla_resumen_cfg <- function(data) {
  
  # Calcular estadísticas resumidas
  total_proyectos <- nrow(data)
  total_comunas <- n_distinct(data$ID_COMUNA)
  
  resumen_cfg <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "proyectos") %>%
    arrange(desc(proyectos)) %>%
    slice(1:10) %>%  # Solo top 10
    mutate(
      pct_proyectos = round(proyectos / total_proyectos * 100, 1),
      pct_acum = round(cumsum(pct_proyectos), 1)
    ) %>%
    # Agregar datos de comunas
    left_join(
      data %>%
        distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG) %>%
        count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "comunas"),
      by = "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG"
    ) %>%
    mutate(
      pct_comunas = round(comunas / total_comunas * 100, 1),
      posicion = row_number(),
      categoria = case_when(
        posicion <= 3 ~ "🔴 Crítico",
        posicion <= 7 ~ "🟡 Alto",
        TRUE ~ "🟢 Medio"
      )
    ) %>%
    select(
      posicion, categoria,
      CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      proyectos, pct_proyectos, pct_acum,
      comunas, pct_comunas
    ) %>%
    rename(
      "Pos." = posicion,
      "Nivel" = categoria,
      "Tipología CFG" = CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      "Proy." = proyectos,
      "%" = pct_proyectos,
      "% Acum." = pct_acum,
      "Com." = comunas,
      "% Com." = pct_comunas
    )
  
  # Crear tabla formateada
  tabla_final <- resumen_cfg %>%
    kable(
      caption = "Tabla 4.4: Resumen Ejecutivo - Top 10 Tipologías CFG Más Críticas",
      align = c("c", "c", "l", rep("c", 5)),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 11
    ) %>%
    column_spec(1, bold = TRUE, width = "3em") %>%
    column_spec(2, width = "8em") %>%
    column_spec(3, width = "15em") %>%
    column_spec(4:8, width = "5em") %>%
    add_header_above(c(" " = 3, "Análisis por Proyectos" = 3, "Por Comunas" = 2)) %>%
    footnote(
      general = paste0(
        "Total analizado: ", total_proyectos, " proyectos en ", total_comunas, " comunas. ",
        "El Top 10 concentra el ", round(sum(resumen_cfg$`%`), 1), "% de todos los nudos críticos."
      ),
      general_title = "Nota:",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = resumen_cfg, tabla = tabla_final))
}

## Graficos intereactivos de las frecuencias de Pareto

##=======================Frecuencia Global CFG - Proyectos========================##


# Función CORREGIDA para gráfico interactivo de Pareto HORIZONTAL
crear_pareto_horizontal_interactivo <- function(data, variable, titulo, color_barras = "#2E86AB", color_linea = "#E69F00") {
    
    # Convertir variable a símbolo y luego a nombre
    var_sym <- ensym(variable)
    var_name <- as.character(var_sym)
    
    # Calcular frecuencias usando evaluación tidy
    freq_data <- data %>%
        count(!!var_sym) %>%
        arrange(desc(n)) %>%
        mutate(
            porcentaje = n / sum(n) * 100,
            acumulado = cumsum(porcentaje),
            etiqueta = paste0(
                "Frecuencia: ", n, "\n",
                "Porcentaje: ", round(porcentaje, 1), "%\n",
                "Acumulado: ", round(acumulado, 1), "%"
            ),
            # Crear variable ordenada para el eje Y (horizontal)
            variable_ordenada = reorder(!!var_sym, n)
        )
    
    # Para plotly horizontal, necesitamos Y como categorías ordenadas y X como valores
    freq_data$variable_char <- as.character(freq_data$variable_ordenada)
    freq_data$variable_char <- factor(freq_data$variable_char, 
                                      levels = levels(freq_data$variable_ordenada))
    
    # Calcular el máximo para escalar la línea correctamente
    max_frecuencia <- max(freq_data$n)
    escala_linea <- max_frecuencia / 100
    
    # Crear gráfico interactivo HORIZONTAL
    plot_ly(freq_data) %>%
        add_bars(
            y = ~variable_char,  # Eje Y para las categorías (horizontal)
            x = ~n,              # Eje X para los valores (horizontal)
            name = "Frecuencia",
            orientation = 'h',   # ¡IMPORTANTE: gráfico horizontal!
            marker = list(
                color = color_barras,
                line = list(color = '#1a5276', width = 1)
            ),
            text = ~etiqueta,
            hoverinfo = "text",
            textposition = "none"
        ) %>%
        add_trace(
            y = ~variable_char,
            x = ~acumulado * escala_linea,  # Escalar la línea al mismo rango que las barras
            name = "Porcentaje Acumulado",
            type = 'scatter',
            mode = 'lines+markers',
            line = list(
                color = color_linea, 
                width = 3,
                dash = 'solid'
            ),
            marker = list(
                color = color_linea,
                size = 6,
                symbol = 'circle'
            ),
            yaxis = "y",
            xaxis = "x",
            hoverinfo = "x+text",
            text = ~paste("Acumulado: ", round(acumulado, 1), "%")
        ) %>%
        layout(
            title = list(
                text = titulo,
                x = 0.05,
                font = list(size = 16, color = "#2c3e50")
            ),
            yaxis = list(
                title = "",
                showgrid = FALSE,
                tickfont = list(size = 11)
            ),
            xaxis = list(
                title = "Frecuencia de Proyectos",
                showgrid = TRUE,
                gridcolor = "#f0f0f0",
                side = "bottom"
            ),
            showlegend = TRUE,
            legend = list(
                x = 0.02, 
                y = 0.98,
                bgcolor = "rgba(255,255,255,0.8)",
                font = list(size = 12)
            ),
            margin = list(l = 150, r = 50, b = 80, t = 60),  # Margen izquierdo mayor para etiquetas largas
            hoverlabel = list(
                bgcolor = "white",
                bordercolor = "black",
                font = list(size = 12)
            ),
            # Eje secundario para el porcentaje (parte superior)
            xaxis2 = list(
                title = "Porcentaje Acumulado (%)",
                overlaying = "x",
                side = "top",
                range = c(0, 100),
                showgrid = FALSE,
                tickfont = list(color = color_linea)
            )
        ) %>%
        config(
            displayModeBar = TRUE,
            modeBarButtonsToRemove = c("pan2d", "lasso2d", "select2d"),
            displaylogo = FALSE
        )
}

# Gráfico interactivo para CFG por proyectos - VERSIÓN HORIZONTAL CORREGIDA
crear_pareto_horizontal_interactivo(
    df_dummies,
    CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
    "Distribución de Tipologías CFG - Pareto por Número de Proyectos",
    "#3498db", "#e74c3c"
)
##=======================Frecuencia Global CFG - Comunas========================##

# Función para Pareto por comunas (HORIZONTAL)
crear_pareto_comunas_interactivo <- function(data, variable, titulo, color_barras = "#2c3e50", color_linea = "#f39c12") {
    
    # Convertir variable a símbolo
    var_sym <- ensym(variable)
    
    # Calcular frecuencias por comuna (sin repetir comunas)
    freq_data <- data %>%
        distinct(ID_COMUNA, !!var_sym) %>%  
        count(!!var_sym, name = "n_comunas") %>%
        arrange(desc(n_comunas)) %>%
        mutate(
            porcentaje = n_comunas / sum(n_comunas) * 100,
            acumulado = cumsum(porcentaje),
            etiqueta = paste0(
                "Comunas: ", n_comunas, "\n",
                "Porcentaje: ", round(porcentaje, 1), "%\n",
                "Acumulado: ", round(acumulado, 1), "%"
            ),
            # Crear variable ordenada para el eje Y (horizontal)
            variable_ordenada = reorder(!!var_sym, n_comunas)
        )
    
    # Preparar datos para plotly horizontal
    freq_data$variable_char <- as.character(freq_data$variable_ordenada)
    freq_data$variable_char <- factor(freq_data$variable_char, 
                                      levels = levels(freq_data$variable_ordenada))
    
    # Calcular el máximo para escalar la línea correctamente
    max_comunas <- max(freq_data$n_comunas)
    escala_linea <- max_comunas / 100
    
    # Crear gráfico interactivo HORIZONTAL
    plot_ly(freq_data) %>%
        add_bars(
            y = ~variable_char,
            x = ~n_comunas,
            name = "Número de Comunas",
            orientation = 'h',
            marker = list(
                color = color_barras,
                line = list(color = '#1c2833', width = 1)
            ),
            text = ~etiqueta,
            hoverinfo = "text",
            textposition = "none"
        ) %>%
        add_trace(
            y = ~variable_char,
            x = ~acumulado * escala_linea,
            name = "Porcentaje Acumulado",
            type = 'scatter',
            mode = 'lines+markers',
            line = list(
                color = color_linea, 
                width = 3,
                dash = 'solid'
            ),
            marker = list(
                color = color_linea,
                size = 6,
                symbol = 'circle'
            ),
            hoverinfo = "x+text",
            text = ~paste("Acumulado: ", round(acumulado, 1), "%")
        ) %>%
        layout(
            title = list(
                text = titulo,
                x = 0.05,
                font = list(size = 16, color = "#2c3e50")
            ),
            yaxis = list(
                title = "",
                showgrid = FALSE,
                tickfont = list(size = 11)
            ),
            xaxis = list(
                title = "Número de Comunas Afectadas",
                showgrid = TRUE,
                gridcolor = "#f0f0f0"
            ),
            showlegend = TRUE,
            legend = list(
                x = 0.02, 
                y = 0.98,
                bgcolor = "rgba(255,255,255,0.8)"
            ),
            margin = list(l = 150, r = 50, b = 80, t = 60),
            hoverlabel = list(
                bgcolor = "white",
                bordercolor = "black",
                font = list(size = 12)
            ),
            xaxis2 = list(
                title = "Porcentaje Acumulado (%)",
                overlaying = "x",
                side = "top",
                range = c(0, 100),
                showgrid = FALSE,
                tickfont = list(color = color_linea)
            )
        ) %>%
        config(
            displayModeBar = TRUE,
            modeBarButtonsToRemove = c("pan2d", "lasso2d", "select2d"),
            displaylogo = FALSE
        )
}

# Gráfico interactivo para CFG por comunas
crear_pareto_comunas_interactivo(
    df_dummies,
    CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
    "Distribución de Tipologías CFG - Pareto por Número de Comunas Afectadas",
    "#2c3e50", "#f39c12"
)

5 Análisis de Tipologías CFG: Tablas Descriptivas

En esta sección presentamos el análisis detallado de las tipologías CFG mediante tablas descriptivas que permiten visualizar la distribución, frecuencia e impacto territorial de los nudos críticos identificados.

Este revela una distribución altamente concentrada de los nudos críticos, donde Manejo Integral del Agua emerge inequívocamente como el problema más común del Estado Mérida. Con 54 proyectos representando el 27,27% del total, esta tipología supera por un margen considerable a todas las demás categorías, estableciendo una brecha significativa de 12 puntos porcentuales con respecto a Vialidad, que ocupa el segundo lugar con 30 proyectos (15,15%).

El análisis del porcentaje acumulado demuestra la aplicación práctica del principio de Pareto en la problemática estatal:

• Las primeras 4 tipologías (Manejo Integral del Agua, Vialidad, Vivienda y Electricidad) concentran el 62,63% de todos los nudos críticos

• Las primeras 7 tipologías alcanzan el 80,81% del total, confirmando que aproximadamente el 80% de los problemas se concentra en menos del 50% de las categorías. Esta concentración indica que una estrategia de intervención focalizada en estas áreas principales podría atender la mayoría de los problemas identificados con una eficiencia considerable en el uso de recursos públicos.

La distribución permite establecer tres niveles de criticidad claramente diferenciados: Nivel Crítico Alto (Posiciones 1-4): Manejo Integral del Agua, Vialidad, Vivienda y Electricidad representan los servicios básicos fundamentales del estado, con frecuencias que van desde 54 hasta 19 proyectos.

Nivel Crítico Medio (Posiciones 5-7): Salud, Infraestructura y Ambiente configuran un segundo grupo de problemas significativos, con frecuencias entre 14 y 10 proyectos.

Nivel Crítico Bajo (Posiciones 8-16): Las nueve tipologías restantes presentan frecuencias menores a 10 proyectos cada una, representando problemas importantes, pero de menor escala relativa.

5.1 Tabla de Distribución de Frecuencias de Tipologías CFG por Número de Proyectos

Tabla 4.1: Distribución de Frecuencias de Tipologías CFG por Número de Proyectos
Frecuencias Absolutas y Relativas
Tipología CFG N° Proyectos Porcentaje (%) % Acumulado Ranking
MANEJO INTEGRAL DEL AGUA 54 27.27 27.27 1
VIALIDAD 30 15.15 42.42 2
VIVIENDA 21 10.61 53.03 3
ELECTRICIDAD 19 9.60 62.63 4
SALUD 14 7.07 69.70 5
INFRAESTRUCTURA 12 6.06 75.76 6
AMBIENTE 10 5.05 80.81 7
EDUCACIÓN 9 4.55 85.36 8
TRANSPORTE 7 3.54 88.90 9
TELECOMUNICACIONES 6 3.03 91.93 10
MUROS 5 2.53 94.46 11
SOCIO PRODUCTIVO 4 2.02 96.48 12
SEGURIDAD 3 1.52 98.00 13
CANALIZACION 2 1.01 99.01 14
ORGANIZACION COMUNAL 1 0.51 99.52 15
PROCESOS INDUSTRIALES 1 0.51 100.03 16
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Nota: Las primeras 4 tipologías concentran el 62.6% de todos los nudos críticos

Nota: La tabla muestra la distribución absoluta y relativa de las tipologías CFG según el número de proyectos asociados.

5.2 Tabla de Distribución de Frecuencias de Tipologías CFG por Número de Comunas Afectadas

Tabla 4.2: Distribución de Frecuencias de Tipologías CFG por Número de Comunas Afectadas
Distribución Territorial
Tipología CFG N° Comunas Porcentaje (%) % Acumulado Ranking
MANEJO INTEGRAL DEL AGUA 43 23.63 23.63 1
VIALIDAD 27 14.84 38.47 2
VIVIENDA 21 11.54 50.01 3
ELECTRICIDAD 18 9.89 59.90 4
SALUD 14 7.69 67.59 5
INFRAESTRUCTURA 11 6.04 73.63 6
AMBIENTE 10 5.49 79.12 7
EDUCACIÓN 9 4.95 84.07 8
TRANSPORTE 7 3.85 87.92 9
TELECOMUNICACIONES 6 3.30 91.22 10
MUROS 5 2.75 93.97 11
SOCIO PRODUCTIVO 4 2.20 96.17 12
SEGURIDAD 3 1.65 97.82 13
CANALIZACION 2 1.10 98.92 14
ORGANIZACION COMUNAL 1 0.55 99.47 15
PROCESOS INDUSTRIALES 1 0.55 100.02 16
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Nota: Una comuna puede tener múltiples tipologías, pero se cuenta una sola vez por tipología

Nota: Esta tabla representa la distribución territorial de las tipologías, contabilizando cuántas comunas están afectadas por cada tipo de nudo crítico.

5.3 Tabla de Análisis Comparativo CFG - Proyectos vs Comunas Afectadas

Tabla 4.3: Análisis Comparativo CFG - Proyectos vs Comunas Afectadas
Por Proyectos
Por Comunas
Indicador
Rank Tipología CFG N° Proy. % Proy. N° Com. % Com. Intensidad
1 MANEJO INTEGRAL DEL AGUA 54 27.27 43 23.63 1.26
2 VIALIDAD 30 15.15 27 14.84 1.11
3 VIVIENDA 21 10.61 21 11.54 1.00
4 ELECTRICIDAD 19 9.60 18 9.89 1.06
5 SALUD 14 7.07 14 7.69 1.00
6 INFRAESTRUCTURA 12 6.06 11 6.04 1.09
7 AMBIENTE 10 5.05 10 5.49 1.00
8 EDUCACIÓN 9 4.55 9 4.95 1.00
9 TRANSPORTE 7 3.54 7 3.85 1.00
10 TELECOMUNICACIONES 6 3.03 6 3.30 1.00
11 MUROS 5 2.53 5 2.75 1.00
12 SOCIO PRODUCTIVO 4 2.02 4 2.20 1.00
13 SEGURIDAD 3 1.52 3 1.65 1.00
14 CANALIZACION 2 1.01 2 1.10 1.00
15 ORGANIZACION COMUNAL 1 0.51 1 0.55 1.00
16 PROCESOS INDUSTRIALES 1 0.51 1 0.55 1.00
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Intensidad = N° Proyectos / N° Comunas (promedio de proyectos por comuna por tipología)

Nota: El indicador de intensidad (proyectos/comuna) permite identificar tipologías con mayor concentración de problemas por territorio.

5.4 Tabla de Resumen Ejecutivo - Top 10 Tipologías CFG Más Críticas

Tabla 4.4: Resumen Ejecutivo - Top 10 Tipologías CFG Más Críticas
Análisis por Proyectos
Por Comunas
Pos. Nivel Tipología CFG Proy. % % Acum. Com. % Com.
1 🔴 Crítico MANEJO INTEGRAL DEL AGUA 54 27.3 27.3 43 72.9
2 🔴 Crítico VIALIDAD 30 15.2 42.5 27 45.8
3 🔴 Crítico VIVIENDA 21 10.6 53.1 21 35.6
4 🟡 Alto ELECTRICIDAD 19 9.6 62.7 18 30.5
5 🟡 Alto SALUD 14 7.1 69.8 14 23.7
6 🟡 Alto INFRAESTRUCTURA 12 6.1 75.9 11 18.6
7 🟡 Alto AMBIENTE 10 5.1 81.0 10 16.9
8 🟢 Medio EDUCACIÓN 9 4.5 85.5 9 15.3
9 🟢 Medio TRANSPORTE 7 3.5 89.0 7 11.9
10 🟢 Medio TELECOMUNICACIONES 6 3.0 92.0 6 10.2
Nota: Total analizado: 198 proyectos en 59 comunas. El Top 10 concentra el 92% de todos los nudos críticos.

Nota: Clasificación por nivel de criticidad basado en la frecuencia de aparición y distribución territorial.

6 Frecuencias de Gobernación

Se observa una clara distribución de Pareto, donde las mismas cuatro categorías principales, la cartera de proyectos de la Gobernación está dominada por una clara priorización de los servicios básicos. Las cuatro primeras categorías (Agua Potable – 14,14%, Vivienda – 11,62%, Electricidad – 9,60%, Vialidad – 9,09%) concentran 44,45% de todos los proyectos. Esto indica que la estrategia institucional se centra en atender los déficits más esenciales para la calidad de vida y el desarrollo: acceso al agua, vivienda digna, energía y conectividad.

Un segundo grupo de categorías recibe una atención significativa, aunque menor. “Equipamiento Salud” (7,07%), “Agua Residual” (6,57%), “Drenajes” (6,57%) y “Equipamiento Educativo” (6,06%) representan un 26,27% adicional de los proyectos. La línea de porcentaje acumulado muestra que se necesitan las primeras 8 categorías para alcanzar aproximadamente el 70% de los proyectos. Las 13 categorías restantes constituyen una “larga cola” de problemáticas que, si bien son críticas para las comunidades que las padecen, representan una porción menor de la cartera global de la Gobernación.

La distribución sigue un principio de Pareto, donde una minoría de categorías concentra la mayoría de los esfuerzos institucionales.

#----------------------------Resumen Gobernación por Comuna----------------------
## Análisis para Gobernación ----
# Conteo y proporciones globales por Tipologia de Gobernación
freq_gob <- df_dummies %>%
  count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n") %>%
  arrange(desc(n)) %>%
  mutate(pct = n / sum(n) * 100)


#  Gráfico de barras (Top 10) de gobernación por proyectos
freq_gob %>%
  slice(1:10) %>%
  ggplot(aes(x = reorder(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, n),
             y = n)) +
    geom_col(fill = "darkred") +
    coord_flip() +
    labs(
      title = "Top 10 categorías de Gobernación más frecuentes",
      x     = "Categoría de Gobernación",
      y     = "Número de proyectos"
    ) +
    theme_minimal()

# Frecuencia absoluta y relativa por comuna
freq_gob_comuna <- df_dummies %>%
  distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION) %>%  
  count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n_comunas") %>%
  arrange(desc(n_comunas)) %>%
  mutate(
    pct_comunas = n_comunas / sum(n_comunas) * 100,
    cum_pct     = cumsum(pct_comunas)
  )


#----------------------------Gráfico de top 10 por comuna---------------------------
freq_gob_comuna %>%
  slice(1:10) %>%
  ggplot(aes(
    x = reorder(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, n_comunas),
    y = n_comunas
  )) +
  geom_col(fill = "darkred") +
  coord_flip() +
  labs(
    title = "Top 10 categorías de Gobernación por número de comunas",
    x     = "Categoría de Gobernación",
    y     = "Número de comunas"
  ) +
  theme_minimal()

# ------------------------Global - Proyectos-------------------------------------------
gob_global_proyectos <- analizar_frecuencia(
  df_raw,
  CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
  "darkred", "gold",
  "Frecuencia global de categorías de Gobernación (Proyectos)",
  "proyectos"
)

# -------------------------Global - Comunas--------------------------------------------
gob_global_comunas <- analizar_frecuencia_comuna(
  df_raw,
  CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
  "darkred", "gold",
  "Frecuencia de categorías de Gobernación por comuna"
)

#----------------------Grafico de frecuencias de categorías de Gobernación-------------
print(gob_global_proyectos$plot)

#----Grafico Frecuencia absoluta y relativa de comunas por categoría de Gobernación----
print(gob_global_comunas$plot)

# ==============================================================================
#  TABLA COMPLETA DE FRECUENCIAS GOBERNACIÓN POR PROYECTOS
# ==============================================================================
crear_tabla_gob_proyectos <- function(data) {
  
  # Calcular frecuencias
  tabla_gob <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n_proyectos") %>%
    arrange(desc(n_proyectos)) %>%
    mutate(
      porcentaje = round(n_proyectos / sum(n_proyectos) * 100, 2),
      pct_acumulado = round(cumsum(porcentaje), 2),
      ranking = row_number()
    ) %>%
    rename(
      "Ranking" = ranking,
      "Categoría Gobernación" = CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      "N° Proyectos" = n_proyectos,
      "Porcentaje (%)" = porcentaje,
      "% Acumulado" = pct_acumulado
    )
  
  # Crear tabla formateada con kableExtra
  tabla_final <- tabla_gob %>%
    kable(
      caption = "Tabla 5.1: Distribución de Frecuencias de Categorías de Gobernación por Número de Proyectos",
      align = c("c", "l", "c", "c", "c"),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 12
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#8B0000") %>%
    column_spec(2, width = "20em") %>%
    column_spec(3:5, width = "8em") %>%
    row_spec(1:4, background = "#ffebee") %>%  # Resaltar top 4
    add_header_above(c(" " = 2, "Frecuencias Absolutas y Relativas" = 3)) %>%
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Nota: Las primeras 4 categorías concentran el 51.5% de todos los proyectos"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_gob, tabla = tabla_final))
}

# ==============================================================================
#  TABLA COMPLETA DE FRECUENCIAS GOBERNACIÓN POR COMUNAS
# ==============================================================================
crear_tabla_gob_comunas <- function(data) {
  
  # Calcular frecuencias por comuna (sin repetir comunas)
  tabla_gob_comunas <- data %>%
    distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION) %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n_comunas") %>%
    arrange(desc(n_comunas)) %>%
    mutate(
      porcentaje = round(n_comunas / sum(n_comunas) * 100, 2),
      pct_acumulado = round(cumsum(porcentaje), 2),
      ranking = row_number()
    ) %>%
    rename(
      "Ranking" = ranking,
      "Categoría Gobernación" = CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      "N° Comunas" = n_comunas,
      "Porcentaje (%)" = porcentaje,
      "% Acumulado" = pct_acumulado
    )
  
  # Crear tabla formateada
  tabla_final <- tabla_gob_comunas %>%
    kable(
      caption = "Tabla 5.2: Distribución de Frecuencias de Categorías de Gobernación por Número de Comunas Afectadas",
      align = c("c", "l", "c", "c", "c"),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 12
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#8B0000") %>%
    column_spec(2, width = "20em") %>%
    column_spec(3:5, width = "8em") %>%
    row_spec(1:4, background = "#ffebee") %>%  # Resaltar top 4
    add_header_above(c(" " = 2, "Distribución Territorial" = 3)) %>%
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Nota: Una comuna puede tener múltiples categorías, pero se cuenta una sola vez por categoría"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_gob_comunas, tabla = tabla_final))
}

# ==============================================================================
# TABLA COMPARATIVA GOBERNACIÓN: PROYECTOS VS COMUNAS
# ==============================================================================
crear_tabla_comparativa_gob <- function(data) {
  
  # Datos por proyectos
  gob_proyectos <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n_proyectos") %>%
    mutate(pct_proyectos = round(n_proyectos / sum(n_proyectos) * 100, 2))
  
  # Datos por comunas
  gob_comunas <- data %>%
    distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION) %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n_comunas") %>%
    mutate(pct_comunas = round(n_comunas / sum(n_comunas) * 100, 2))
  
  # Unir ambas tablas
  tabla_comparativa <- gob_proyectos %>%
    inner_join(gob_comunas, by = "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION") %>%
    arrange(desc(n_proyectos)) %>%
    mutate(
      ranking = row_number(),
      intensidad = round(n_proyectos / n_comunas, 2)  # Proyectos por comuna promedio
    ) %>%
    select(
      ranking,
      CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      n_proyectos, pct_proyectos,
      n_comunas, pct_comunas,
      intensidad
    ) %>%
    rename(
      "Rank" = ranking,
      "Categoría Gobernación" = CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      "N° Proy." = n_proyectos,
      "% Proy." = pct_proyectos,
      "N° Com." = n_comunas,
      "% Com." = pct_comunas,
      "Intensidad" = intensidad
    )
  
  # Crear tabla formateada
  tabla_final <- tabla_comparativa %>%
    kable(
      caption = "Tabla 5.3: Análisis Comparativo Gobernación - Proyectos vs Comunas Afectadas",
      align = c("c", "l", rep("c", 5)),
      format = "html",
      digits = 2
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 11
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#8B0000", width = "3em") %>%
    column_spec(2, width = "15em") %>%
    column_spec(3:7, width = "6em") %>%
    add_header_above(c(" " = 2, "Por Proyectos" = 2, "Por Comunas" = 2, "Indicador" = 1)) %>%
    row_spec(1:3, background = "#ffcdd2") %>%  # Top 3 en rojo suave
    row_spec(4:7, background = "#ffecb3") %>%  # Siguientes 4 en amarillo suave
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Intensidad = N° Proyectos / N° Comunas (promedio de proyectos por comuna por categoría)"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_comparativa, tabla = tabla_final))
}

# ==============================================================================
#  TABLA RESUMEN EJECUTIVO GOBERNACIÓN (TOP 10)
# ==============================================================================
crear_tabla_resumen_gob <- function(data) {
  
  # Calcular estadísticas resumidas
  total_proyectos <- nrow(data)
  total_comunas <- n_distinct(data$ID_COMUNA)
  
  resumen_gob <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "proyectos") %>%
    arrange(desc(proyectos)) %>%
    slice(1:10) %>%  # Solo top 10
    mutate(
      pct_proyectos = round(proyectos / total_proyectos * 100, 1),
      pct_acum = round(cumsum(pct_proyectos), 1)
    ) %>%
    # Agregar datos de comunas
    left_join(
      data %>%
        distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION) %>%
        count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "comunas"),
      by = "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION"
    ) %>%
    mutate(
      pct_comunas = round(comunas / total_comunas * 100, 1),
      posicion = row_number(),
      categoria = case_when(
        posicion <= 3 ~ "🔴 Crítico",
        posicion <= 7 ~ "🟡 Alto",
        TRUE ~ "🟢 Medio"
      )
    ) %>%
    select(
      posicion, categoria,
      CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      proyectos, pct_proyectos, pct_acum,
      comunas, pct_comunas
    ) %>%
    rename(
      "Pos." = posicion,
      "Nivel" = categoria,
      "Categoría Gobernación" = CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      "Proy." = proyectos,
      "%" = pct_proyectos,
      "% Acum." = pct_acum,
      "Com." = comunas,
      "% Com." = pct_comunas
    )
  
  # Crear tabla formateada
  tabla_final <- resumen_gob %>%
    kable(
      caption = "Tabla 5.4: Resumen Ejecutivo - Top 10 Categorías de Gobernación Más Críticas",
      align = c("c", "c", "l", rep("c", 5)),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 11
    ) %>%
    column_spec(1, bold = TRUE, width = "3em") %>%
    column_spec(2, width = "8em") %>%
    column_spec(3, width = "15em") %>%
    column_spec(4:8, width = "5em") %>%
    add_header_above(c(" " = 3, "Análisis por Proyectos" = 3, "Por Comunas" = 2)) %>%
    footnote(
      general = paste0(
        "Total analizado: ", total_proyectos, " proyectos en ", total_comunas, " comunas. ",
        "El Top 10 concentra el ", round(sum(resumen_gob$`%`), 1), "% de todos los proyectos."
      ),
      general_title = "Nota:",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = resumen_gob, tabla = tabla_final))
}
##======================= Frecuencia Global Gobernación - Proyectos ========================##

# Gráfico interactivo de Pareto HORIZONTAL para Gobernación - Proyectos
crear_pareto_horizontal_interactivo(
    df_dummies,
    CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
    "Distribución de Tipologías de Gobernación - Pareto por Número de Proyectos",
    "#16a085", "#d35400"   # Colores personalizados (verde/rojo quemado)
)
##======================= Frecuencia Global Gobernación - Comunas ========================##

# Gráfico interactivo de Pareto HORIZONTAL para Gobernación - Comunas
crear_pareto_comunas_interactivo(
    df_dummies,
    CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
    "Distribución de Tipologías de Gobernación - Pareto por Número de Comunas Afectadas",
    "#34495e", "#f1c40f"   # Colores personalizados (gris oscuro/amarillo)
)

7 Análisis de Categorías de Gobernación: Tablas Descriptivas

En esta sección presentamos el análisis detallado de las categorías de gobernación mediante tablas descriptivas que permiten visualizar la distribución, frecuencia e impacto territorial de los nudos críticos identificados.

Las tablas revelan una distribución de problemas más diversificada que en el análisis CFG, pero con una clara concentración en las primeras posiciones. AGUA POTABLE emerge como la categoría más crítica, con 28 proyectos que representan el 14,14% del total, consolidando la problemática hídrica como prioridad absoluta en la gestión gubernamental.

La distribución sigue un patrón de Pareto modificado, donde las primeras 4 categorías (AGUA POTABLE, VIVIENDA, ELECTRICIDAD y VIALIDAD) concentran el 44,45% de todos los proyectos, las otras primeras 8 categorías alcanzan el 70,72% del total, confirmando que el 70% de los proyectos se enfoca en resolver el 38% de las categorías (8 de 21).

Esta distribución permite establecer tres niveles de criticidad claramente diferenciados:

Nivel Crítico Alto (Posiciones 1-4):

• AGUA POTABLE (28 proyectos, 14.14%)

• VIVIENDA (23 proyectos, 11.62%)

• ELECTRICIDAD (19 proyectos, 9.60%)

• VIALIDAD (18 proyectos, 9.09%)

Nivel Crítico Medio (Posiciones 5-8):

• EQUIPAMIENTO SALUD (14 proyectos, 7.07%)

• AGUA RESIDUAL (13 proyectos, 6.57%)

• DRENAJES (13 proyectos, 6.57%)

• EQUIPAMIENTO EDUCATIVO (12 proyectos, 6.06%)

Nivel Crítico Bajo (Posiciones 9-21):

Las trece categorías restantes presentan frecuencias menores a 10 proyectos cada una.

no de los hallazgos claves es la consistencia en el ranking y validación de la priorización, el orden de las categorías principales es notablemente consistente con el análisis por números de proyectos, ahora los resultados por número de comunas es consistente, ya que el Agua Potable (13,61%), Vivienda (11,52%), Electricidad (9,42%) y Vialidad (8,90%**) vuelven a ocupar los cuatro primeros lugares. Esta consistencia es un hallazgo ya que demuestra que los problemas en los que la Gobernación más se enfoca (mayor número de proyectos) son precisamente los que están más generalizados en el territorio (afectan a más comunas). Valida que la priorización institucional es acertada y está alineada con la realidad geográfica de las carencias.

8 Análisis de Categorías de Gobernación: Tablas Descriptivas

Desde la perspectiva de la Gobernación, el principio de Pareto se mantiene, pero con una distribución ligeramente más diversificada. Las primeras 4 categorías (Agua Potable, Vivienda, Electricidad, Vialidad), que constituyen el 19% del total (4 de 21), acaparan el 44,45% de los proyectos institucionales. La regla del 80/20 se cumple al considerar que las primeras 8 categorías (38% del total) explican el 70,72% de la cartera de proyectos gubernamentales.

8.1 Tabla de Distribución de Frecuencias de Categorías de Gobernación por Número de Proyectos

Tabla 5.1: Distribución de Frecuencias de Categorías de Gobernación por Número de Proyectos
Frecuencias Absolutas y Relativas
Categoría Gobernación N° Proyectos Porcentaje (%) % Acumulado Ranking
AGUA POTABLE 28 14.14 14.14 1
VIVIENDA 23 11.62 25.76 2
ELECTRICIDAD 19 9.60 35.36 3
VIALIDAD 18 9.09 44.45 4
EQUIPAMIENTO SALUD 14 7.07 51.52 5
AGUA RESIDUAL 13 6.57 58.09 6
DRENAJES 13 6.57 64.66 7
EQUIPAMIENTO EDUCATIVO 12 6.06 70.72 8
CANALIZACION 10 5.05 75.77 9
TRANSPORTE 8 4.04 79.81 10
VIALIDAD AGRICOLA 8 4.04 83.85 11
TELECOMUNICACIONES 6 3.03 86.88 12
INFRAESTRUCTURA 5 2.53 89.41 13
MUROS 5 2.53 91.94 14
SOCIO PRODUCTIVO 4 2.02 93.96 15
EQUIPAMIENTO SEGURIDAD 3 1.52 95.48 16
PUENTE 3 1.52 97.00 17
SISTEMAS DE RIEGO 3 1.52 98.52 18
AGUA 1 0.51 99.03 19
GAS 1 0.51 99.54 20
ORGANIZACION COMUNAL 1 0.51 100.05 21
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Nota: Las primeras 4 categorías concentran el 51.5% de todos los proyectos

Nota: La tabla muestra la distribución absoluta y relativa de las categorías de gobernación según el número de proyectos asociados.

8.2 Tabla de Distribución de Frecuencias de Categorías de Gobernación por Número de Comunas Afectadas

Tabla 5.2: Distribución de Frecuencias de Categorías de Gobernación por Número de Comunas Afectadas
Distribución Territorial
Categoría Gobernación N° Comunas Porcentaje (%) % Acumulado Ranking
AGUA POTABLE 26 13.54 13.54 1
VIVIENDA 22 11.46 25.00 2
ELECTRICIDAD 18 9.38 34.38 3
VIALIDAD 17 8.85 43.23 4
EQUIPAMIENTO SALUD 14 7.29 50.52 5
DRENAJES 13 6.77 57.29 6
AGUA RESIDUAL 12 6.25 63.54 7
EQUIPAMIENTO EDUCATIVO 12 6.25 69.79 8
CANALIZACION 10 5.21 75.00 9
TRANSPORTE 8 4.17 79.17 10
VIALIDAD AGRICOLA 8 4.17 83.34 11
TELECOMUNICACIONES 6 3.12 86.46 12
INFRAESTRUCTURA 5 2.60 89.06 13
MUROS 5 2.60 91.66 14
SOCIO PRODUCTIVO 4 2.08 93.74 15
EQUIPAMIENTO SEGURIDAD 3 1.56 95.30 16
PUENTE 3 1.56 96.86 17
SISTEMAS DE RIEGO 3 1.56 98.42 18
AGUA 1 0.52 98.94 19
GAS 1 0.52 99.46 20
ORGANIZACION COMUNAL 1 0.52 99.98 21
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Nota: Una comuna puede tener múltiples categorías, pero se cuenta una sola vez por categoría

Nota: Esta tabla representa la distribución territorial de las categorías de gobernación, contabilizando cuántas comunas están afectadas por cada tipo de nudo crítico.

8.3 Tabla de Análisis Comparativo Gobernación - Proyectos vs Comunas Afectadas

Tabla 5.3: Análisis Comparativo Gobernación - Proyectos vs Comunas Afectadas
Por Proyectos
Por Comunas
Indicador
Rank Categoría Gobernación N° Proy. % Proy. N° Com. % Com. Intensidad
1 AGUA POTABLE 28 14.14 26 13.54 1.08
2 VIVIENDA 23 11.62 22 11.46 1.05
3 ELECTRICIDAD 19 9.60 18 9.38 1.06
4 VIALIDAD 18 9.09 17 8.85 1.06
5 EQUIPAMIENTO SALUD 14 7.07 14 7.29 1.00
6 AGUA RESIDUAL 13 6.57 12 6.25 1.08
7 DRENAJES 13 6.57 13 6.77 1.00
8 EQUIPAMIENTO EDUCATIVO 12 6.06 12 6.25 1.00
9 CANALIZACION 10 5.05 10 5.21 1.00
10 TRANSPORTE 8 4.04 8 4.17 1.00
11 VIALIDAD AGRICOLA 8 4.04 8 4.17 1.00
12 TELECOMUNICACIONES 6 3.03 6 3.12 1.00
13 INFRAESTRUCTURA 5 2.53 5 2.60 1.00
14 MUROS 5 2.53 5 2.60 1.00
15 SOCIO PRODUCTIVO 4 2.02 4 2.08 1.00
16 EQUIPAMIENTO SEGURIDAD 3 1.52 3 1.56 1.00
17 PUENTE 3 1.52 3 1.56 1.00
18 SISTEMAS DE RIEGO 3 1.52 3 1.56 1.00
19 AGUA 1 0.51 1 0.52 1.00
20 GAS 1 0.51 1 0.52 1.00
21 ORGANIZACION COMUNAL 1 0.51 1 0.52 1.00
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Intensidad = N° Proyectos / N° Comunas (promedio de proyectos por comuna por categoría)

Nota: El indicador de intensidad (proyectos/comuna) permite identificar categorías con mayor concentración de problemas por territorio.

8.4 Tabla de Resumen Ejecutivo - Top 10 Categorías de Gobernación Más Críticas

Tabla 5.4: Resumen Ejecutivo - Top 10 Categorías de Gobernación Más Críticas
Análisis por Proyectos
Por Comunas
Pos. Nivel Categoría Gobernación Proy. % % Acum. Com. % Com.
1 🔴 Crítico AGUA POTABLE 28 14.1 14.1 26 44.1
2 🔴 Crítico VIVIENDA 23 11.6 25.7 22 37.3
3 🔴 Crítico ELECTRICIDAD 19 9.6 35.3 18 30.5
4 🟡 Alto VIALIDAD 18 9.1 44.4 17 28.8
5 🟡 Alto EQUIPAMIENTO SALUD 14 7.1 51.5 14 23.7
6 🟡 Alto AGUA RESIDUAL 13 6.6 58.1 12 20.3
7 🟡 Alto DRENAJES 13 6.6 64.7 13 22.0
8 🟢 Medio EQUIPAMIENTO EDUCATIVO 12 6.1 70.8 12 20.3
9 🟢 Medio CANALIZACION 10 5.1 75.9 10 16.9
10 🟢 Medio TRANSPORTE 8 4.0 79.9 8 13.6
Nota: Total analizado: 198 proyectos en 59 comunas. El Top 10 concentra el 79.9% de todos los proyectos.

Nota: Clasificación por nivel de criticidad basado en la frecuencia de aparición y distribución territorial.

9 Índice Shannon y Pielou por Comunas y Tipología CFG y de Gobernación

El índice de Shannon se utiliza como una herramienta cuantitativa para medir la diversidad de tipologías de conflicto y la diversidad institucional (gobernación), cuantifica la diversidad de categorías en una comunidad considerando tanto la riqueza (número de categorías) como la uniformidad en su distribución involucradas en los proyectos analizados.

\[ H^\prime = - \sum_{i=1}^{S} p_i \ln(p_i) \]

Leyenda:

Explicación rápida de los símbolos:

𝐻→ Índice de Shannon.

𝑆 → Número total de categorías (o tipologías de nudos críticos).

𝑝𝑖 → Proporción de la categoría

i respecto al total.

Se utiliza los índices de Shannon y Pielou como herramientas para:

  1. Medir la diversidad de problemáticas (CFG) y actores (Gobernación) en comunas merideñas.

  2. Interpretar su significado mediante el marco de hipótesis (Tabla de Hipótesis 1), que contrasta escenarios de capacidad vs. disfunción.

  3. Diseñar políticas diferenciadas según el perfil de cada comuna (coordinación interinstitucional para H’ alto, asesoría técnica para H’ bajo con baja J’).

Para abordar de manera efectica el indice Shannon-Pieolou, nos vamos a plantear unas hipotesis:

Valor de Shannon ALTO (H’ > 1.5)

  • Las comunidades tienen capacidad de diagnóstico y organización, esto es una comuna con visión integral, capaz de mapear completamente sus problemáticas. -

  • Existe síntomas de Abandono Institucional, refleja carencias generalizadas. La comuna documenta todo por desesperación. Proyectos repetitivos que no se resuelven. Baja tasa de culminación.Podría subestimarse una genuina capacidad organizativa.

Valor de Shannon BAJO (H’ < 1.0)

  • Tienen una Focalización Estratégica, Las comunas prioriza de manera pragmática los problemas más críticos y viables. Problemas claramente identificados como primordiales. Mayores tasas de éxito. Puede ignorar problemáticas “menores”.

  • Desconexión e Inviabilidad, las comunas persigue soluciones monumentales e inviables. Proyectos de escala nacional/estadal. Persistencia del mismo problema sin evolución. Baja efectividad.

knitr::opts_chunk$set(echo = TRUE)

conflict_prefer("select", "dplyr")
conflict_prefer("filter", "dplyr")


#--------------------------Crear mapeo único de ID_COMUNA a COMUNA-----------------------------
commune_map <- df_raw %>%
  distinct(ID_COMUNA, COMUNA) %>%
  mutate(COMUNA = str_trim(COMUNA))  # Limpiar espacios extras

## Detectar dinámicamente las columnas dummy
cfg_cols <- grep("^CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_", 
                 names(df_dummies), value = TRUE)
gob_cols <- grep("^CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_", 
                 names(df_dummies), value = TRUE)

## Calcular diversidad para las Tipología CFG con nombres de comunas
div_cfg <- df_dummies %>%
  group_by(ID_COMUNA) %>%
  summarise(
    n_proyectos = n(),
    across(all_of(cfg_cols), sum, na.rm = TRUE)
  ) %>%
  ungroup() %>%
  # Agregar nombres de comunas
  left_join(commune_map, by = "ID_COMUNA") %>%
  # Calcular índices de diversidad
  {
    cnts <- select(., all_of(cfg_cols))
    tib <- select(., ID_COMUNA, COMUNA, n_proyectos)
    H <- vegan::diversity(cnts, index = "shannon")
    richesse <- rowSums(cnts > 0)
    J <- ifelse(richesse > 0, H / log(richesse), NA_real_)
    bind_cols(tib, H_shannon = H, pielou = J)
  }

# Crear columna combinada para mostrar en tablas
div_cfg <- div_cfg %>%
  mutate(COMUNA_ID_NOMBRE = paste(ID_COMUNA, "-", COMUNA))

# Tabla: Top 10 comunas más diversas (con ID y nombre)
top10_cfg <- div_cfg %>%
  arrange(desc(H_shannon)) %>%
  slice(1:10) %>%
  select(COMUNA_ID_NOMBRE, H_shannon, pielou, n_proyectos)

# Tabla: Top 10 comunas menos diversas (con ID y nombre)
bottom10_cfg <- div_cfg %>%
  arrange(H_shannon) %>%
  slice(1:10) %>%
  select(COMUNA_ID_NOMBRE, H_shannon, pielou, n_proyectos)

# Mostrar tablas en formato kable para Tipología CFG
cat("\n\n**10 comunas con mayor diversidad (Shannon_CFG)**\n")
## 
## 
## **10 comunas con mayor diversidad (Shannon_CFG)**
knitr::kable(top10_cfg, 
             col.names = c("Comuna (ID - Nombre)", "H_CFG (Shannon)", "J_CFG (Pielou)", "N° Proyectos"),
             digits = 3,
             caption = "Top 10 comunas con mayor índice de Shannon para CFG")
Top 10 comunas con mayor índice de Shannon para CFG
Comuna (ID - Nombre) H_CFG (Shannon) J_CFG (Pielou) N° Proyectos
141212-C-MIX-2016-02-0018 - 26. Comuna Prócer José Félix Ribas 1.831 0.941 9
141701-C-RUR-2018-11-0003 - COMUNA SOCIOPRODUCTIVA ALTO DE LA CARBONERA 1.792 1.000 6
141203-CEC-ME-025 - 18. PARROQUIA CARACCIOLO PARRA PÉREZ - COMUNA EN CONSTRUCCIÓN LAS HEROÍNAS DE MERIDA 1.609 1.000 5
141705-14-17-0000 - 25. Comuna El Paso de Bolívar 1813 1.609 1.000 5
141206-C-MIX-2018-11-0158 - COMUNA EN CONSTRUCCIÓN MUCUJÚN 1.561 0.970 6
141211-14-12-0001 - 7. Consejo Comunal Milla Parte Media 1.330 0.959 6
141211-14-12-0001 - 30. Consejo Comunal Unión Social 10 de Febrero 1.330 0.959 6
140101-C-MIX-2018-11-0147 - 8. COMUNA FIELES A CHÁVEZ 1.099 1.000 3
140101-C-RUR-2018-11-0018 - 14. COMUNA TIERRA DE ZAMORA 1.099 1.000 3
140101-C-RUR-2018-11-0019 - 12. COMUNA MANUELITA SÁENZ 1.099 1.000 3
cat("\n\n**10 comunas con menor diversidad (Shannon_CFG)**\n")
## 
## 
## **10 comunas con menor diversidad (Shannon_CFG)**
knitr::kable(bottom10_cfg,
             col.names = c("Comuna (ID - Nombre)", "H_CFG (Shannon)", "J_CFG (Pielou)", "N° Proyectos"),
             digits = 3,
             caption = "Top 10 comunas con menor índice de Shannon para CFG")
Top 10 comunas con menor índice de Shannon para CFG
Comuna (ID - Nombre) H_CFG (Shannon) J_CFG (Pielou) N° Proyectos
140101-C-URB-2018-11-0018 - 11. COMUNA UNIÓN DE CHÁVEZ 0.637 0.918 3
140103-14-01-0005 - 19. COMUNA El PASO DE LOS ANDES 0.637 0.918 3
140602-C-MIX-2021-05-0007 - COMUNA SU LEGADO ES NUESTRA FORTALEZA SIMON PABLO FIGUEROA. 0.637 0.918 3
140605-14-06-0001 - 20. COMUNA LOMAS UNIDAS MACHO CAPAZ 0.637 0.918 3
140606-C-RUR-2021-03-0002 - COMUNA IGNACIO FERNÁNDEZ PEÑA 0.637 0.918 3
141704-CEC-ME-108 - 27. Comuna en Construcción de Escaguey 0.637 0.918 3
142102-C-MIX-2021-10-0011 - COMUNA LOS IDEALES DE CHÁVEZ 0.637 0.918 3
142104-14-21-0002 - COMUNA PATRIA NUEVA. 0.637 0.918 3
140102-C-MIX-2021-01-0003 - COMUNA ETERNO GIGANTE 0.693 1.000 2
142006-C-MIX-2016-05-0006 - COMUNA SAN JUAN DE LOS LIBERTADORES COMANDANTE SUPREMO 0.868 0.790 6
## Preparar datos para gráfico consolidado para CFG
tabla_extremos_cfg <- bind_rows(
  top10_cfg  %>% mutate(tipo = "Top 10 ↑") %>% rename(COMUNA = COMUNA_ID_NOMBRE),
  bottom10_cfg %>% mutate(tipo = "Top 10 ↓") %>% rename(COMUNA = COMUNA_ID_NOMBRE)
) %>%
  # Crear etiqueta ordenada por H_shannon
  mutate(COMUNA_ORD = reorder(COMUNA, H_shannon))

#---------------Gráfico: Shannon (barras) + Pielou (línea) para CFG------------------------#
maxH <- max(tabla_extremos_cfg$H_shannon)

# Ajustar el gráfico con dimensiones específicas
cfg_plot <- ggplot(tabla_extremos_cfg, aes(x = COMUNA_ORD, y = H_shannon, fill = tipo)) +
  geom_line(aes(y = pielou * maxH, group = 1), 
            color = "#E69F00", size = 1.0, linetype = "dashed") +
  geom_point(aes(y = pielou * maxH), 
             color = "#D55E00", size = 2.5, shape = 18) +
  # Etiquetas de Pielou desplazadas a la derecha
  geom_text(aes(y = pielou * maxH, label = sprintf("J=%.2f", pielou)),
            hjust = -0.3, size = 2.5, color = "#D55E00") +  # Ajustado hjust

  geom_col(width = 0.7, alpha = 0.9) +
  geom_text(aes(y = H_shannon, label = sprintf("%.2f (%.1f)", H_shannon, exp(H_shannon))),
            hjust = 1.1, size = 2.8, color = "white", fontface = "bold") +  # Tamaño ajustado
  facet_wrap(~ tipo, scales = "free_y", ncol = 1) +
  coord_flip() +
  scale_y_continuous(
    name = "Índice de Shannon (H)",
    limits = c(0, maxH * 1.15), 
    sec.axis = sec_axis(~ . / maxH, name = "Índice de Pielou (J)",
                        labels = scales::number_format(accuracy = 0.1))
  ) +
  scale_fill_manual(values = c("Top 10 ↑" = "#56B4E9", "Top 10 ↓" = "#CC79A7")) +
  labs(
    title = "Diversidad de Tipologías CFG por Comuna",
    subtitle = "Top 10 comunas con mayor y menor diversidad | Barras: Shannon (H) | Línea: Pielou (J)",
    x = "Comuna (ID - Nombre)",
    caption = "Fuente: Elaboración propia datos de proyectos ACA - William Gutierrez"
  ) +
  theme_minimal(base_size = 10) +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    plot.subtitle = element_text(size = 10, color = "gray40", hjust = 0.5),
    axis.title.y = element_text(margin = margin(r = 10)),
    axis.title.x = element_text(margin = margin(t = 10)),
    axis.text.y = element_text(size = 8),  # Reducir tamaño texto eje Y
    panel.grid.major.y = element_blank(),
    strip.text = element_text(face = "bold", size = 11),
    legend.position = "none",
    plot.margin = margin(1, 2, 1, 1, "cm")  # Aumentar margen derecho
  )

# Guardar con dimensiones específicas
ggsave("cfg_diversity_plot.png", cfg_plot, width = 14, height = 10, dpi = 300)
print(cfg_plot)

## Calcular diversidad para Tipología de Gobernación con nombres
div_gob <- df_dummies %>%
  group_by(ID_COMUNA) %>%
  summarise(
    n_proyectos = n(),
    across(all_of(gob_cols), sum, na.rm = TRUE)
  ) %>%
  ungroup() %>%
  # Agregar nombres de comunas
  left_join(commune_map, by = "ID_COMUNA") %>%
  # Calcular índices de diversidad
  {
    cnts <- select(., all_of(gob_cols))
    tib <- select(., ID_COMUNA, COMUNA, n_proyectos)
    H <- vegan::diversity(cnts, index = "shannon")
    richesse <- rowSums(cnts > 0)
    J <- ifelse(richesse > 0, H / log(richesse), NA_real_)
    bind_cols(tib, H_shannon = H, pielou = J)
  }

# Crear columna combinada para mostrar en tablas
div_gob <- div_gob %>%
  mutate(COMUNA_ID_NOMBRE = paste(ID_COMUNA, "-", COMUNA))

## Mostrar tablas con nombres
top10_gob <- div_gob %>% 
  arrange(desc(H_shannon)) %>% 
  slice(1:10) %>%
  select(COMUNA_ID_NOMBRE, n_proyectos, H_shannon, pielou)

bottom10_gob <- div_gob %>% 
  arrange(H_shannon) %>% 
  slice(1:10) %>%
  select(COMUNA_ID_NOMBRE, n_proyectos, H_shannon, pielou)

cat("\n\n**Top 10 comunas con mayor diversidad (Shannon) de Gobernación**\n")
## 
## 
## **Top 10 comunas con mayor diversidad (Shannon) de Gobernación**
knitr::kable(top10_gob,
             col.names = c("Comuna (ID - Nombre)", "N° Proyectos", "H_GOB (Shannon)", "J_GOB (Pielou)"),
             digits = 3, 
             caption = "Top 10 comunas con mayor índice de Shannon para Gobernación")
Top 10 comunas con mayor índice de Shannon para Gobernación
Comuna (ID - Nombre) N° Proyectos H_GOB (Shannon) J_GOB (Pielou)
141212-C-MIX-2016-02-0018 - 26. Comuna Prócer José Félix Ribas 9 2.197 1.000
141206-C-MIX-2018-11-0158 - COMUNA EN CONSTRUCCIÓN MUCUJÚN 6 1.792 1.000
141203-CEC-ME-025 - 18. PARROQUIA CARACCIOLO PARRA PÉREZ - COMUNA EN CONSTRUCCIÓN LAS HEROÍNAS DE MERIDA 5 1.609 1.000
141705-14-17-0000 - 25. Comuna El Paso de Bolívar 1813 5 1.609 1.000
141701-C-RUR-2018-11-0003 - COMUNA SOCIOPRODUCTIVA ALTO DE LA CARBONERA 6 1.561 0.970
142006-C-MIX-2016-05-0006 - COMUNA SAN JUAN DE LOS LIBERTADORES COMANDANTE SUPREMO 6 1.561 0.970
141211-14-12-0001 - 7. Consejo Comunal Milla Parte Media 6 1.330 0.959
141211-14-12-0001 - 30. Consejo Comunal Unión Social 10 de Febrero 6 1.330 0.959
140101-C-MIX-2018-11-0147 - 8. COMUNA FIELES A CHÁVEZ 3 1.099 1.000
140101-C-RUR-2018-11-0018 - 14. COMUNA TIERRA DE ZAMORA 3 1.099 1.000
cat("\n\n**Top 10 comunas con menor diversidad (Shannon) de Gobernación**\n")
## 
## 
## **Top 10 comunas con menor diversidad (Shannon) de Gobernación**
knitr::kable(bottom10_gob,
             col.names = c("Comuna (ID - Nombre)", "N° Proyectos", "H_GOB (Shannon)", "J_GOB (Pielou)"),
             digits = 3, 
             caption = "Top 10 comunas con menor índice de Shannon para Gobernación")
Top 10 comunas con menor índice de Shannon para Gobernación
Comuna (ID - Nombre) N° Proyectos H_GOB (Shannon) J_GOB (Pielou)
140101-C-URB-2018-11-0018 - 11. COMUNA UNIÓN DE CHÁVEZ 3 0.637 0.918
141704-CEC-ME-108 - 27. Comuna en Construcción de Escaguey 3 0.637 0.918
140102-C-MIX-2021-01-0003 - COMUNA ETERNO GIGANTE 2 0.693 1.000
140101-C-MIX-2018-11-0147 - 8. COMUNA FIELES A CHÁVEZ 3 1.099 1.000
140101-C-RUR-2018-11-0018 - 14. COMUNA TIERRA DE ZAMORA 3 1.099 1.000
140101-C-RUR-2018-11-0019 - 12. COMUNA MANUELITA SÁENZ 3 1.099 1.000
140102-14-01-0006 - COMUNA SOCIALISTA EZEQUIEL ZAMORA 3 1.099 1.000
140102-14-01-2007 - COMUNA SIMON BOLÍVAR. 3 1.099 1.000
140102-C-MIX-2018-11-0019 - COMUNA PRESIDENTE OBRERO 3 1.099 1.000
140102-C-MIX-2018-11-0084 - COMUNA LUZ DEL ALBA 3 1.099 1.000
## Preparar datos para gráfico de Gobernación
tabla_extremos_gob <- bind_rows(
  top10_gob %>% mutate(tipo = "Top 10 ↑") %>% rename(COMUNA = COMUNA_ID_NOMBRE),
  bottom10_gob %>% mutate(tipo = "Top 10 ↓") %>% rename(COMUNA = COMUNA_ID_NOMBRE)
) %>%
  # Crear etiqueta ordenada por H_shannon
  mutate(COMUNA_ORD = reorder(COMUNA, H_shannon))


#-------------------------Gráfica de tipología de gobernación-----------------------------#
maxH_gob <- max(tabla_extremos_gob$H_shannon)

gob_plot <- ggplot(tabla_extremos_gob, aes(x = COMUNA_ORD, y = H_shannon, fill = tipo)) +
  geom_line(aes(y = pielou * maxH_gob, group = 1), 
            color = "#E69F00", size = 1.0, linetype = "dashed") +
  geom_point(aes(y = pielou * maxH_gob), 
             color = "#D55E00", size = 2.5, shape = 18) +
  # Etiquetas de Pielou desplazadas a la derecha
  geom_text(aes(y = pielou * maxH_gob, label = sprintf("J=%.2f", pielou)),
            hjust = -0.2, size = 2.5, color = "#D55E00") +
  # Luego dibujar las barras de Shannon
  geom_col(width = 0.7, alpha = 0.9) +
  geom_text(aes(y = H_shannon, label = sprintf("%.2f (%.1f)", H_shannon, exp(H_shannon))),
            hjust = 1.1, size = 2.8, color = "white", fontface = "bold") +
  facet_wrap(~ tipo, scales = "free_y", ncol = 1) +
  coord_flip() +
  scale_y_continuous(
    name = "Índice de Shannon (H)",
    limits = c(0, maxH_gob * 1.15),
    sec.axis = sec_axis(~ . / maxH_gob, name = "Índice de Pielou (J)",
                        labels = scales::number_format(accuracy = 0.1))
  ) +
  scale_fill_manual(values = c("Top 10 ↑" = "#56B4E9", "Top 10 ↓" = "#CC79A7")) +
  labs(
    title = "Diversidad Institucional (Gobernación) por Comuna",
    subtitle = "Top 10 comunas con mayor y menor diversidad | Barras: Shannon (H) | Línea: Pielou (J)",
    x = "Comuna (ID - Nombre)",
    caption = "Fuente: Elaboración propia datos de proyectos ACA - William Gutierrez"
  ) +
  theme_minimal(base_size = 10) +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    plot.subtitle = element_text(size = 10, color = "gray40", hjust = 0.5),
    axis.title.y = element_text(margin = margin(r = 10)),
    axis.title.x = element_text(margin = margin(t = 10)),
    axis.text.y = element_text(size = 8),  # Reducir tamaño texto eje Y
    panel.grid.major.y = element_blank(),
    strip.text = element_text(face = "bold", size = 11),
    legend.position = "none",
    plot.margin = margin(1, 2, 1, 1, "cm")  # Aumentar margen derecho
  )

# Guardar con dimensiones específicas
ggsave("gob_diversity_plot.png", gob_plot, width = 14, height = 10, dpi = 300)
print(gob_plot)

# ---------------------------------------------------
# CFG: gráfico con tooltips y ajuste para Pielou
# ---------------------------------------------------
maxH <- max(tabla_extremos_cfg$H_shannon, na.rm = TRUE)

cfg_plot2 <- ggplot(tabla_extremos_cfg, 
                    aes(x = COMUNA_ORD, 
                        y = H_shannon,
                        fill = tipo)) +
  # BARRAS con tooltip (text)
  geom_col(aes(text = paste0(
                    "Comuna: ", COMUNA, "\n",
                    "H = ", sprintf("%.2f", H_shannon), 
                    " (exp=", sprintf("%.1f", exp(H_shannon)), ")\n",
                    "J = ", sprintf("%.2f", pielou), "\n",
                    "N = ", n_proyectos
                )),
           width = 0.7, alpha = 0.95) +
  # LINEA y PUNTOS de Pielou (escalados)
  geom_line(aes(y = pielou * maxH, group = 1), 
            color = "#E69F00", size = 1.0, linetype = "dashed") +
  geom_point(aes(y = pielou * maxH,
                 text = paste0("Comuna: ", COMUNA, "\n",
                               "J = ", sprintf("%.2f", pielou), "\n",
                               "H = ", sprintf("%.2f", H_shannon))),
             color = "#D55E00", size = 3, shape = 18) +
  
  # Etiquetas de Pielou: colocadas ligeramente hacia la derecha (hjust negativo)
  geom_text(aes(y = pielou * maxH, label = sprintf("J=%.2f", pielou)),
            hjust = -0.08, size = 2.8, color = "#D55E00") +
  # Etiquetas dentro de las barras (H y exp(H))
  geom_text(aes(y = H_shannon, 
                label = sprintf("%.2f (%.1f)", H_shannon, exp(H_shannon))),
            hjust = 1.05, size = 2.9, color = "white", fontface = "bold") +
  facet_wrap(~ tipo, scales = "free_y", ncol = 1) +
  coord_flip() +
  scale_y_continuous(
    name = "Índice de Shannon (H)",
    limits = c(0, maxH * 1.30),   # aumentar para dar espacio a Pielou
    sec.axis = sec_axis(~ . / maxH, name = "Índice de Pielou (J)",
                        labels = scales::number_format(accuracy = 0.01))
  ) +
  scale_fill_manual(values = c("Top 10 ↑" = "#56B4E9", "Top 10 ↓" = "#CC79A7")) +
  labs(
    title = "Diversidad de Tipologías CFG por Comuna",
    subtitle = "Top 10 comunas con mayor y menor diversidad | Barras: Shannon (H) | Línea: Pielou (J)",
    x = "Comuna (ID - Nombre)",
    caption = "Fuente: Elaboración propia datos de proyectos ACA - William Gutierrez"
  ) +
  theme_minimal(base_size = 11) +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    plot.subtitle = element_text(size = 10, color = "gray40", hjust = 0.5),
    axis.text.y = element_text(size = 8),
    panel.grid.major.y = element_blank(),
    strip.text = element_text(face = "bold", size = 11),
    legend.position = "none",
    plot.margin = margin(t = 12, r = 120, b = 12, l = 180),  # margen derecho grande
    panel.spacing = unit(1, "lines"),
    panel.clip = "off"    # <-- permite que textos fuera del panel no se corten (ggplot2 >=3.4)
  )

# Guardar opcional (si quieres la imagen estática)
ggsave("cfg_diversity_plot_adj.png", cfg_plot2, width = 14, height = 10, dpi = 300)

# ---------------------------------------------------
# GOB: gráfico con tooltips y ajuste para Pielou
# ---------------------------------------------------
maxH_gob <- max(tabla_extremos_gob$H_shannon, na.rm = TRUE)

gob_plot2 <- ggplot(tabla_extremos_gob, aes(x = COMUNA_ORD, y = H_shannon, fill = tipo)) +
  geom_col(aes(text = paste0(
                    "Comuna: ", COMUNA, "\n",
                    "H = ", sprintf("%.2f", H_shannon), 
                    " (exp=", sprintf("%.1f", exp(H_shannon)), ")\n",
                    "J = ", sprintf("%.2f", pielou), "\n",
                    "N = ", n_proyectos
                )),
           width = 0.7, alpha = 0.95) +
  geom_line(aes(y = pielou * maxH_gob, group = 1), 
            color = "#E69F00", size = 1.0, linetype = "dashed") +
  geom_point(aes(y = pielou * maxH_gob,
                 text = paste0("Comuna: ", COMUNA, "\n",
                               "J = ", sprintf("%.2f", pielou), "\n",
                               "H = ", sprintf("%.2f", H_shannon))),
             color = "#D55E00", size = 3, shape = 18) +
  geom_text(aes(y = pielou * maxH_gob, label = sprintf("J=%.2f", pielou)),
            hjust = -0.08, size = 2.8, color = "#D55E00") +
  geom_text(aes(y = H_shannon, label = sprintf("%.2f (%.1f)", H_shannon, exp(H_shannon))),
            hjust = 1.05, size = 2.9, color = "white", fontface = "bold") +
  facet_wrap(~ tipo, scales = "free_y", ncol = 1) +
  coord_flip() +
  scale_y_continuous(
    name = "Índice de Shannon (H)",
    limits = c(0, maxH_gob * 1.30),
    sec.axis = sec_axis(~ . / maxH_gob, name = "Índice de Pielou (J)",
                        labels = scales::number_format(accuracy = 0.01))
  ) +
  scale_fill_manual(values = c("Top 10 ↑" = "#56B4E9", "Top 10 ↓" = "#CC79A7")) +
  labs(
    title = "Diversidad Institucional (Gobernación) por Comuna",
    subtitle = "Top 10 comunas con mayor y menor diversidad | Barras: Shannon (H) | Línea: Pielou (J)",
    x = "Comuna (ID - Nombre)",
    caption = "Fuente: Elaboración propia datos de proyectos ACA - William Gutierrez"
  ) +
  theme_minimal(base_size = 11) +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    plot.subtitle = element_text(size = 10, color = "gray40", hjust = 0.5),
    axis.text.y = element_text(size = 8),
    panel.grid.major.y = element_blank(),
    strip.text = element_text(face = "bold", size = 11),
    legend.position = "none",
    plot.margin = margin(t = 12, r = 120, b = 12, l = 180),
    panel.spacing = unit(1, "lines"),
    panel.clip = "off"
  )

# ---------------------------------------------------
# Convertir a plotly con dimensiones fijas y mostrar
# ---------------------------------------------------
plotly_fix_size <- function(ggobj, width = 1600, height = 800, margin = list(l = 180, r = 120, b = 100, t = 90)) {
  p <- ggplotly(ggobj, tooltip = "text")
  p <- p %>% layout(autosize = FALSE, width = width, height = height, margin = margin)
  # Aumentar botones útiles
  p <- p %>% config(displayModeBar = TRUE,
                    modeBarButtonsToAdd = list("toImage", "zoom2d", "resetScale2d"))
  return(p)
}

cfg_plotly <- plotly_fix_size(cfg_plot2, width = 1600, height = 800)
gob_plotly <- plotly_fix_size(gob_plot2, width = 1600, height = 800)

# Render (en R Markdown se mostrarán los dos en orden)
cfg_plotly
htmltools::tagList(htmltools::tags$br(), htmltools::tags$br())


gob_plotly
##================Tabla interpretativa del indice Shannon============================##
tbl <- tibble::tibble(
  Comuna = c(
    "141212 - Comuna Prócer José Félix Ribas",
    "141701 - Comuna Socioproductiva Alto de la Carbonera",
    "141203 - Comuna en Construcción Las Heroínas de Mérida",
    "142006 - Comuna San Juan de los Libertadores",
    "140101 - Comuna Unión de Chávez"
  ),
  H_CFG = c(1.831, 1.792, 1.609, 0.868, 0.637),
  e_CFG = round(exp(c(1.831, 1.792, 1.609, 0.868, 0.637)), 2),
  H_GOB = c(2.197, 1.561, 1.609, 1.561, 0.637),
  e_GOB = round(exp(c(2.197, 1.561, 1.609, 1.561, 0.637)), 2),
  Interpretacion = c(
    "Alta complejidad: ≈6 tipologías y ≈9 instituciones efectivas → coord. multisectorial requerida.",
    "Diversa y equilibrada: ≈6 tipologías y ≈4.77 instituciones → priorizar gobernanza compartida.",
    "Perfil multifuncional: ≈5 tipologías e instituciones efectivas → intervenciones integradas.",
    "Concentración moderada (≈2.38 tipologías) pero red institucional amplia (≈4.77) → revisar duplicidades.",
    "Fuerte focalización: ≈1.89 tipologías e instituciones → intervenciones focales de alto impacto."
  ),
  stringsAsFactors = FALSE
)

knitr::kable(
  tbl,
  caption = "Resumen: H' y Número efectivo (e^{H'}) — CFG vs Gobernación (5 comunas)",
  digits = 2,
  align = c("l", "r", "r", "r", "r", "l")
) %>%
  kableExtra::kable_styling(full_width = FALSE, bootstrap_options = c("striped", "condensed", "responsive"))
Resumen: H’ y Número efectivo (e^{H’}) — CFG vs Gobernación (5 comunas)
Comuna H_CFG e_CFG H_GOB e_GOB Interpretacion stringsAsFactors
141212 - Comuna Prócer José Félix Ribas 1.83 6.24 2.20 9.00 Alta complejidad: ≈6 tipologías y ≈9 instituciones efectivas → coord. multisectorial requerida. FALSE
141701 - Comuna Socioproductiva Alto de la Carbonera 1.79 6.00 1.56 4.76 Diversa y equilibrada: ≈6 tipologías y ≈4.77 instituciones → priorizar gobernanza compartida. FALSE
141203 - Comuna en Construcción Las Heroínas de Mérida 1.61 5.00 1.61 5.00 Perfil multifuncional: ≈5 tipologías e instituciones efectivas → intervenciones integradas. FALSE
142006 - Comuna San Juan de los Libertadores 0.87 2.38 1.56 4.76 Concentración moderada (≈2.38 tipologías) pero red institucional amplia (≈4.77) → revisar duplicidades. FALSE
140101 - Comuna Unión de Chávez 0.64 1.89 0.64 1.89 Fuerte focalización: ≈1.89 tipologías e instituciones → intervenciones focales de alto impacto. FALSE

10 Interpretación del Índice de Shannon (H′) y Pielou (J)

El análisis de diversidad (Índice de Shannon, H′) y de equitatividad (Índice de Pielou, J) permite caracterizar de forma compacta cómo cada comuna distribuye sus nudos críticos y qué implicaciones prácticas tiene esa distribución para la planificación y ejecución de proyectos.

-Veamos este ejemplo la Comunas con H′ alto (ej. 1.83 — 1.60): como 141212 - Comuna Prócer José Félix Ribas (H′=1.831, J=0.941, n=9) o 141701 - Alto de la Carbonera (H′=1.792, J=1.000, n=6), muestran alta diversidad temática y una distribución relativamente equilibrada (J cercano a 1)

Pueden representar (a) capacidad diagnóstica genuina, la comuna identifica múltiples problemáticas relevantes o (b) acumulación de carencias (abandono institucional). Para decidir entre (a) y (b) conviene cruzar H′ con indicadores de ejecución (Ratio ACA) y la intensidad de proyectos, además de entrevistas en directamente las comunas, una elemento importante no hecho en este trabajo.

  • Ahora con las Comunas con H′ bajo (como por ejemplos de 0.63 — 0.87): como varias entradas como 140101-C-URB-2018-11-0018 - 11. COMUNA UNIÓN DE CHÁVEZ del top menor (H′ ≈ 0.637, J ≈ 0.918), revelan focalización temática, una gran cantidad de comunas tienen esta focalización.

Puede tratarse de (a) priorización estratégica, concentración en problemas viables y mayor probabilidad de culminación o (b) desconexión/inviabilidad, cuando la baja diversidad responde a proyectos monumentales o a la repetición de un mismo problema sin avance real.

Nuevamente, el cruce con tasas de culminación y la escala de los proyectos permite distinguir estos escenarios.

  • Uso práctico: proponemos usar reglas simples para diagnóstico rápido:

    1. H′ alto + J alto + Ratio ACA bajo → señal de acumulación/abandono (requiere atención institucional y revisión de actores responsables).

    2. H′ alto + Ratio ACA altogestión integral efectiva (priorizar escalamiento de buenas prácticas).

    3. H′ bajo + Ratio ACA altofocalización estratégica efectiva (modelo replicable).

    4. H′ bajo + Ratio ACA bajoriesgo de inviabilidad (reformular alcance y actor responsable).

    En síntesis: H′ y J son indicadores sintéticos y útiles para clasificar comunas rápidamente; su valor real para la toma de decisiones aparece cuando se combinan con métricas de ejecución (Ratio ACA) y con la revisión cualitativa in situ.

La tabla muestra H′ (Shannon) y su conversión a número efectivo \(e^{H'}\) para las dimensiones CFG (tipologías) y Gobernación (actores).

Valores altos de \(e^{H'}\) indican una mayor carga de coordinación y complejidad operativa (ej. Comuna Prócer José Félix Ribas: ≈6 tipologías y ≈9 instituciones efectivas), por lo que requieren mecanismos de gobernanza integrados. Valores bajos señalan focalización temática y permiten intervenciones más directas y replicables (ej. Unión de Chávez: ≈1.9 tipologías).

En práctica, priorizar recursos donde \(e^{H'}\) es alto y replicar modelos de gestión en comunas con \(e^{H'}\) moderado/óptimo maximiza eficiencia.

11 Indice Shannon de ratio de proyecto por tipologías

La aplicación del índice de Shannon a la variable Ratio ACA Proyecto Culminado permite evaluar la diversidad de resultados o estados de culminación de los proyectos dentro de cada comuna. A diferencia de los análisis anteriores que medían la variedad de problemas o actores, este índice cuantifica aquí la heterogeneidad en la efectividad.

Como se hace en el primer análisis de Shannon, nos planteamos las siguiente hipótesis:

Valor de Shannon ALTO (H’ > 1,0)

  • Gestión Realista y Transparente, La comuna documenta de manera honesta un panorama mixto de éxitos, proyectos en curso y fracasos. La diversidad refleja una gestión activa de múltiples “micro demandas” con resultados variables. Número moderado-alto de proyectos.

  • Fragmentación e Inconsistencia, La diversidad de resultados es síntoma de una ejecución errática, donde el éxito depende de factores volátiles (actor institucional específico, recursos intermitentes), no de una estrategia coherente. - Baja efectividad promedio a pesar de la diversidad. Podría subestimarse el esfuerzo de gestionar realidades complejas.

Valor del Shannon BAJO (H’ < 0)

  • Efectividad Homogénea y Predecible, Todos los proyectos de la comuna comparten un mismo estado de alto éxito (“ALTA”), lo que indica una gestión excepcionalmente eficaz y consistente. Número viable de proyectos.

  • Falla Estructural y Desconexión, Todos los proyectos de la comuna están estancados en un mismo estado de baja efectividad (“MUY BAJA”/“BAJA”). Revela una desconexión total entre la planificación y la ejecución, o la insistencia en macroproyectos inviables. Proyectos ambiciosos o repetitivos. La comunidad podría percibirlo como abandono institucional.

knitr::opts_chunk$set(echo = TRUE)

        conflict_prefer("select", "dplyr")
        conflict_prefer("filter", "dplyr")

        ## **Indice Shannon de ratio de proyecto por tipologías**

        # Filtrar y preparar datos para Ratio
        df_ratio_clean <- df_raw %>% 
          filter(!is.na(RATIO_ACA_PROYECTO_CULMINADO)) %>%  
          mutate(
            RATIO_ACA_PROYECTO_CULMINADO = factor(
              RATIO_ACA_PROYECTO_CULMINADO,
              levels = 1:4,
              labels = c("MUY BAJA", "BAJA", "MEDIA", "ALTA")
            )
          )

        # Crear datos wide para diversidad
        df_ratio_wide <- df_ratio_clean %>%
          group_by(ID_COMUNA, RATIO_ACA_PROYECTO_CULMINADO) %>%
          summarise(n = n(), .groups = "drop") %>%
          complete(ID_COMUNA, RATIO_ACA_PROYECTO_CULMINADO, fill = list(n = 0)) %>%
          pivot_wider(
            names_from = RATIO_ACA_PROYECTO_CULMINADO, 
            values_from = n, 
            names_prefix = "ratio_"
          )

        # Asegurar que todas las columnas de ratio existan
        ratio_cols <- c("ratio_MUY BAJA", "ratio_BAJA", "ratio_MEDIA", "ratio_ALTA")
        for (col in ratio_cols) {
          if (!col %in% names(df_ratio_wide)) {
            df_ratio_wide[[col]] <- 0
          }
        }

        # Calcular diversidad para Ratio
        div_ratio <- df_ratio_wide %>%
          left_join(commune_map, by = "ID_COMUNA") %>%
          mutate(n_proyectos_ratio = rowSums(select(., all_of(ratio_cols)))) %>%
          {
            cnts <- select(., all_of(ratio_cols))
            tib <- select(., ID_COMUNA, COMUNA, n_proyectos_ratio)
            H <- vegan::diversity(cnts, index = "shannon")
            richesse <- rowSums(cnts > 0)
            J <- ifelse(richesse > 0, H / log(richesse), NA_real_)
            bind_cols(tib, H_shannon = H, pielou = J)
          } %>%
          mutate(COMUNA_ID_NOMBRE = paste(ID_COMUNA, "-", COMUNA))

        # Crear top y bottom 10
        top10_ratio <- div_ratio %>%
          arrange(desc(H_shannon)) %>%
          slice(1:10) %>%
          select(COMUNA_ID_NOMBRE, n_proyectos_ratio, H_shannon, pielou)

        bottom10_ratio <- div_ratio %>%
          arrange(H_shannon) %>%
          slice(1:10) %>%
          select(COMUNA_ID_NOMBRE, n_proyectos_ratio, H_shannon, pielou)

        # Preparar datos para gráfico
        tabla_extremos_ratio <- bind_rows(
          top10_ratio %>% 
            mutate(tipo = "Mayor diversidad (Top 10)") %>% 
            rename(COMUNA = COMUNA_ID_NOMBRE),
          bottom10_ratio %>% 
            mutate(tipo = "Menor diversidad (Bottom 10)") %>% 
            rename(COMUNA = COMUNA_ID_NOMBRE)
        ) %>%
          mutate(
            etiqueta_H = sprintf("H: %.2f", H_shannon),
            etiqueta_J = sprintf("J: %.2f", pielou)
          )
        ## Tabla completa (Todas las comunas)
        div_ratio_completo <- div_ratio %>%
          select(COMUNA_ID_NOMBRE, n_proyectos_ratio, H_shannon, pielou) %>%
          arrange(desc(H_shannon)) %>%
          mutate(
            H_shannon = round(H_shannon, 3),
            pielou = round(pielou, 3),
            # Interpretación rápida
            Interpretacion = case_when(
              H_shannon < 0.5 ~ "Baja diversidad",
              H_shannon >= 0.5 & H_shannon < 1.0 ~ "Diversidad media",
              H_shannon >= 1.0 ~ "Alta diversidad"
            )
          )

        # Mostrar tabla completa ordenada por diversidad
        cat("\n\n**Diversidad de Ratio ACA en todas las comunas**\n")
## 
## 
## **Diversidad de Ratio ACA en todas las comunas**
        knitr::kable(
          div_ratio_completo,
          col.names = c("Comuna (ID - Nombre)", "Proyectos", "H (Shannon)", "J (Pielou)", "Interpretación"),
          digits = 3,
          caption = "Diversidad de estados de culminación en todas las comunas"
        )
Diversidad de estados de culminación en todas las comunas
Comuna (ID - Nombre) Proyectos H (Shannon) J (Pielou) Interpretación
141212-C-MIX-2016-02-0018 - 26. Comuna Prócer José Félix Ribas 9 1.311 0.946 Alta diversidad
140101-C-RUR-2018-11-0019 - 12. COMUNA MANUELITA SÁENZ 3 1.099 1.000 Alta diversidad
140102-C-MIX-2018-11-0019 - COMUNA PRESIDENTE OBRERO 3 1.099 1.000 Alta diversidad
140103-14-01-0002 - COMUNA AGRARIA SOCIALISTA GUACHARE 3 1.099 1.000 Alta diversidad
140103-14-01-0005 - 19. COMUNA El PASO DE LOS ANDES 3 1.099 1.000 Alta diversidad
140301-C-MIX-2018-02-0043 - 28. Comuna Socialista Agroindustrial de Paiva 3 1.099 1.000 Alta diversidad
140301-C-RUR-2021-10-0022 - COMUNA AGROTURÍSTICA LA NEBLINA DE SALINAS 3 1.099 1.000 Alta diversidad
140802-C-MIX-2018-02-0019 - COMUNA CARRIZALES UNIDOS 3 1.099 1.000 Alta diversidad
141207-C-MIX-2015-11-0005 - COMUNA SAN JACINTO ABRIENDO BRECHA 3 1.099 1.000 Alta diversidad
141601-C-RUR-2018-11-0024 - COMUNA PRODUCTIVA AMANECER CAMPESINO 3 1.099 1.000 Alta diversidad
141601-C-RUR-2018-11-0027 - COMUNA LA PIEDRA QUE CRECE EN REVOLUCIÓN 3 1.099 1.000 Alta diversidad
141901-C-MIX-2018-06-0007 - 15. COMUNA ECOSOCIALISTA, AGROTURÍSTICA Y CULTURAL MUCUY 3 1.099 1.000 Alta diversidad
142104-14-21-0002 - COMUNA PATRIA NUEVA. 3 1.099 1.000 Alta diversidad
141203-CEC-ME-025 - 18. PARROQUIA CARACCIOLO PARRA PÉREZ - COMUNA EN CONSTRUCCIÓN LAS HEROÍNAS DE MERIDA 5 1.055 0.960 Alta diversidad
141206-C-MIX-2018-11-0158 - COMUNA EN CONSTRUCCIÓN MUCUJÚN 6 1.011 0.921 Alta diversidad
141701-C-RUR-2018-11-0003 - COMUNA SOCIOPRODUCTIVA ALTO DE LA CARBONERA 6 1.011 0.921 Alta diversidad
142006-C-MIX-2016-05-0006 - COMUNA SAN JUAN DE LOS LIBERTADORES COMANDANTE SUPREMO 6 1.011 0.921 Alta diversidad
140102-C-MIX-2021-01-0003 - COMUNA ETERNO GIGANTE 2 0.693 1.000 Diversidad media
141211-14-12-0001 - 7. Consejo Comunal Milla Parte Media 6 0.693 1.000 Diversidad media
141211-14-12-0001 - 30. Consejo Comunal Unión Social 10 de Febrero 6 0.693 1.000 Diversidad media
141705-14-17-0000 - 25. Comuna El Paso de Bolívar 1813 5 0.673 0.971 Diversidad media
140101-C-RUR-2018-11-0018 - 14. COMUNA TIERRA DE ZAMORA 3 0.637 0.918 Diversidad media
140102-14-01-0006 - COMUNA SOCIALISTA EZEQUIEL ZAMORA 3 0.637 0.918 Diversidad media
140102-14-01-2007 - COMUNA SIMON BOLÍVAR. 3 0.637 0.918 Diversidad media
140102-C-MIX-2018-11-0084 - COMUNA LUZ DEL ALBA 3 0.637 0.918 Diversidad media
140102-C-MIX-2021-02-0004 - COMUNA ROSA LUXEMBURGO 3 0.637 0.918 Diversidad media
140102-C-MIX-2021-02-0005 - COMUNA FRANCISCO DE MIRANDA 3 0.637 0.918 Diversidad media
140103-14-01-0003 - COMUNA INDIA CARIBAY 3 0.637 0.918 Diversidad media
140303-14-03-0000 - Comuna La Cafetalera 3 0.637 0.918 Diversidad media
140601-C-MIX-2021-04-0012 - COMUNA PASO DE BOLIVAR POR LOS ANDES. 3 0.637 0.918 Diversidad media
140601-C-URB-2021-03-0010 - 17. COMUNA El GRAN CAÑAVERAL 3 0.637 0.918 Diversidad media
140602-C-MIX-2021-05-0007 - COMUNA SU LEGADO ES NUESTRA FORTALEZA SIMON PABLO FIGUEROA. 3 0.637 0.918 Diversidad media
140602-C-MIX-2021-05-0008 - 10. COMUNA YUBÁN ORTEGA SEMBRADOR DE ESPERANZAS 3 0.637 0.918 Diversidad media
140602-C-URB-2021-05-0008 - Comuna Socialista Libertadores de Conciencia Bolívar y Chávez 3 0.637 0.918 Diversidad media
140603-C-MIX-2018-11-0077 - 13. COMUNA AGROECOLÓGICA CULTURAL DE MONTAÑA KLÉBER RAMÍREZ ROJAS 3 0.637 0.918 Diversidad media
140605-14-06-0001 - 20. COMUNA LOMAS UNIDAS MACHO CAPAZ 3 0.637 0.918 Diversidad media
140606-C-RUR-2021-03-0002 - COMUNA IGNACIO FERNÁNDEZ PEÑA 3 0.637 0.918 Diversidad media
141201-C-URB-2021-07-0004 - COMUNA FANNY PRIETO. 3 0.637 0.918 Diversidad media
141204-14-12-0000 - COMUNA BICENTENARIA 16 DE SEPTIEMBRE. 3 0.637 0.918 Diversidad media
141207-14-12-0003 - COMUNA VALLE DEL CHAMA 3 0.637 0.918 Diversidad media
141207-14-12-0005 - COMUNA DON SIMÓN RODRÍGUEZ 3 0.637 0.918 Diversidad media
141303-C-MIX-2018-11-0113 - COMUNA VALLE DE LA VENTA 3 0.637 0.918 Diversidad media
141403-C-RUR-2017-04-0001 - 22. Comuna Socialista Una Esperanza Viva 3 0.637 0.918 Diversidad media
141601-CEC-ME-002 - CONSEJO COMUNAL LLANO GRANDE PARTE ALTA 3 0.637 0.918 Diversidad media
141704-CEC-ME-108 - 27. Comuna en Construcción de Escaguey 3 0.637 0.918 Diversidad media
141801-14-18-0000 - COMUNA SOCIALISTA PARAMO DE MARIÑO TIERRA DE LAGUNAS Y ENCANTOS 3 0.637 0.918 Diversidad media
141801-C-RUR-2018-11-0043 - COMUNA TRADICIONES Y VIVENCIAS DE BODOQUE 3 0.637 0.918 Diversidad media
142001-C-MIX-2018-08-0037 - COMUNA AGROECOLOGICA DOÑA SIMONA 3 0.637 0.918 Diversidad media
142101-14-21-0001 - COMUNA VENCEDORES EL AMPARO 3 0.637 0.918 Diversidad media
142102-C-MIX-2021-04-0013 - COMUNA TODOS JUNTOS VENCEREMOS 3 0.637 0.918 Diversidad media
142102-C-MIX-2021-10-0011 - COMUNA LOS IDEALES DE CHÁVEZ 3 0.637 0.918 Diversidad media
142104-14-21-0000 - Comuna Mucutíes 3 0.637 0.918 Diversidad media
140101-C-MIX-2018-11-0147 - 8. COMUNA FIELES A CHÁVEZ 3 0.000 NaN Baja diversidad
140101-C-URB-2018-11-0018 - 11. COMUNA UNIÓN DE CHÁVEZ 3 0.000 NaN Baja diversidad
140301-C-MIX-2021-10-0006 - COMUNA LA NUEVA FUERZA DE CHÁVEZ 3 0.000 NaN Baja diversidad
140301-CEC-ME-062 - Sector Comunal Casco Central 3 0.000 NaN Baja diversidad
140603-C-URB-2021-06-0003 - 8. COMUNA BRISAS DE MONTALBÁN. 3 0.000 NaN Baja diversidad
141301-C-MIX-2018-11-0168 - COMUNA VALLE DEL MOTATÁN 3 0.000 NaN Baja diversidad
141403-C-RUR-2017-02-0003 - 24. PENSAMIENTO CAMPESINO 3 0.000 NaN Baja diversidad
141403-C-RUR-2017-03-0002 - 23. Comuna El Sueño de Nuestro Comandante Eterno 3 0.000 NaN Baja diversidad
        # Preparar datos para gráfico (sin crear etiquetas pre-definidas)
        tabla_extremos_ratio <- bind_rows(
          top10_ratio %>% 
            mutate(tipo = "Mayor diversidad (Top 10)") %>% 
            rename(COMUNA = COMUNA_ID_NOMBRE),
          bottom10_ratio %>% 
            mutate(tipo = "Menor diversidad (Bottom 10)") %>% 
            rename(COMUNA = COMUNA_ID_NOMBRE)
        )
        # Nota: Removimos las etiquetas pre-definidas etiqueta_H y etiqueta_J

        # Calcular maxH_ratio
        maxH_ratio <- max(tabla_extremos_ratio$H_shannon, na.rm = TRUE) * 1.3

        # Crear gráfico con valores exponenciales en las etiquetas
        ratio_plot <- ggplot(tabla_extremos_ratio, aes(x = reorder(COMUNA, H_shannon), y = H_shannon, fill = tipo)) +
          geom_col(alpha = 0.85, width = 0.7) +
          
          # Etiquetas de Shannon con valor exponencial
          geom_text(
            aes(label = sprintf("%.2f (%.1f)", H_shannon, exp(H_shannon)), y = H_shannon * 0.5), 
            color = "white", 
            fontface = "bold",
            size = 2.8  # Reducido ligeramente
          ) +
          
          # Etiquetas de Pielou
          geom_text(
            aes(label = sprintf("J=%.2f", pielou), y = H_shannon + 0.05 * maxH_ratio),
            color = "#D55E00",
            size = 2.8,  # Reducido
            hjust = 0
          ) +
          
          # Línea y puntos de Pielou
          geom_line(
            aes(y = pielou * maxH_ratio, group = tipo), 
            color = "#E69F00", 
            linewidth = 1.2, 
            linetype = "solid"
          ) +
          geom_point(
            aes(y = pielou * maxH_ratio), 
            color = "#D55E00", 
            size = 3, 
            shape = 18
          ) +
          
          # Configuración del gráfico
          facet_wrap(
            ~ tipo, 
            scales = "free_y", 
            ncol = 1,
            strip.position = "top"
          ) +
          coord_flip() +
          scale_y_continuous(
            name = "Índice de Shannon (H)",
            sec.axis = sec_axis(
              ~ . / maxH_ratio, 
              name = "Índice de Pielou (J)",
              labels = scales::number_format(accuracy = 0.1)
            ),
            expand = expansion(mult = c(0, 0.15))
          ) +
          scale_fill_manual(values = c(
            "Mayor diversidad (Top 10)" = "#1b9e77", 
            "Menor diversidad (Bottom 10)" = "#d95f02"
          )) +
          labs(
            title = "Diversidad de estados de culminación de proyectos",
            subtitle = "Comunas con mayor y menor diversidad en estados de proyectos (Ratio ACA)",
            x = "Comuna (ID - Nombre)",
            caption = "Fuente: Elaboración propia - Proyectos ACA (2022-2025)\nNota: Barras = Shannon (H) con valor exponencial, Línea = Pielou (J)"
          ) +
          theme_minimal(base_size = 11) +  # Base size reducido
          theme(
            plot.title = element_text(face = "bold", size = 14, hjust = 0.5),  # Título más pequeño
            plot.subtitle = element_text(size = 11, color = "gray30", hjust = 0.5),
            axis.title.y = element_text(margin = margin(r = 15)),
            axis.title.x = element_text(margin = margin(t = 10)),
            axis.text.y = element_text(size = 8),  # Texto del eje Y más pequeño
            panel.grid.major.y = element_blank(),
            strip.text = element_text(face = "bold", size = 11, color = "white"),
            strip.background = element_rect(fill = "gray25", color = NA),
            legend.position = "none",
            panel.spacing = unit(1, "lines"),
            plot.margin = margin(1, 2, 1, 1, "cm")  # Margen derecho aumentado
          )

        # Guardar con dimensiones específicas
        ggsave("ratio_diversity_plot.png", ratio_plot, width = 14, height = 10, dpi = 300)
        print(ratio_plot)

 # Crear gráfico interactivo para diversidad de Ratio ACA (Top/Bottom) con e^{H'} y ajustes de presentación
# Nota: asume que df_raw y commune_map ya existen (como en tu chunk anterior).

# --- 1. Preparar datos (recrea el procedimiento de ratio y calcula e^{H'})
df_ratio_clean <- df_raw %>% 
  filter(!is.na(RATIO_ACA_PROYECTO_CULMINADO)) %>%  
  mutate(
    RATIO_ACA_PROYECTO_CULMINADO = factor(
      RATIO_ACA_PROYECTO_CULMINADO,
      levels = 1:4,
      labels = c("MUY BAJA", "BAJA", "MEDIA", "ALTA")
    )
  )

df_ratio_wide <- df_ratio_clean %>%
  group_by(ID_COMUNA, RATIO_ACA_PROYECTO_CULMINADO) %>%
  summarise(n = n(), .groups = "drop") %>%
  complete(ID_COMUNA, RATIO_ACA_PROYECTO_CULMINADO, fill = list(n = 0)) %>%
  pivot_wider(
    names_from = RATIO_ACA_PROYECTO_CULMINADO, 
    values_from = n, 
    names_prefix = "ratio_"
  )

# Asegurar columnas ratio
ratio_cols <- c("ratio_MUY BAJA", "ratio_BAJA", "ratio_MEDIA", "ratio_ALTA")
for (col in ratio_cols) {
  if (!col %in% names(df_ratio_wide)) df_ratio_wide[[col]] <- 0
}

div_ratio <- df_ratio_wide %>%
  left_join(commune_map, by = "ID_COMUNA") %>%
  mutate(n_proyectos_ratio = rowSums(select(., all_of(ratio_cols)))) %>%
  {
    cnts <- select(., all_of(ratio_cols))
    tib <- select(., ID_COMUNA, COMUNA, n_proyectos_ratio)
    H <- vegan::diversity(cnts, index = "shannon")
    richesse <- rowSums(cnts > 0)
    J <- ifelse(richesse > 0, H / log(richesse), NA_real_)
    bind_cols(tib, H_shannon = H, pielou = J)
  } %>%
  mutate(COMUNA_ID_NOMBRE = paste(ID_COMUNA, "-", COMUNA)) %>%
  # calcular exponencial para interpretación
  mutate(e_H = round(exp(H_shannon), 2))

# Top / Bottom 10
top10_ratio <- div_ratio %>% arrange(desc(H_shannon)) %>% slice(1:10) %>% 
  select(COMUNA_ID_NOMBRE, n_proyectos_ratio, H_shannon, pielou, e_H)

bottom10_ratio <- div_ratio %>% arrange(H_shannon) %>% slice(1:10) %>% 
  select(COMUNA_ID_NOMBRE, n_proyectos_ratio, H_shannon, pielou, e_H)

tabla_extremos_ratio <- bind_rows(
  top10_ratio  %>% mutate(tipo = "Mayor diversidad (Top 10)")  %>% rename(COMUNA = COMUNA_ID_NOMBRE),
  bottom10_ratio %>% mutate(tipo = "Menor diversidad (Bottom 10)") %>% rename(COMUNA = COMUNA_ID_NOMBRE)
) %>%
  # crear texto para tooltip
  mutate(
    tooltip = paste0(
      "Comuna: ", COMUNA, "\n",
      "Proyectos: ", n_proyectos_ratio, "\n",
      "H = ", sprintf("%.3f", H_shannon), "  |  e^{H} = ", sprintf("%.2f", e_H), "\n",
      "J = ", sprintf("%.3f", pielou)
    )
  )

# --- 2. Gráfico (ggplot) con ajuste para evitar clipping y espacio para etiquetas ---
maxH_ratio <- max(tabla_extremos_ratio$H_shannon, na.rm = TRUE)
maxH_plot <- maxH_ratio * 1.3

ratio_plot2 <- ggplot(tabla_extremos_ratio, aes(x = reorder(COMUNA, H_shannon), y = H_shannon, fill = tipo)) +
  geom_col(aes(text = tooltip), alpha = 0.88, width = 0.72) +
  # etiquetas H + e^H dentro de la barra (posicionado más cerca del centro para no solaparse)
  geom_text(aes(y = H_shannon * 0.45, label = sprintf("%.2f (%.1f)", H_shannon, e_H)),
            color = "white", fontface = "bold", size = 2.8) +
  # Pielou: texto ligeramente por encima de la barra (y = H + offset)
  geom_text(aes(y = H_shannon + 0.04 * maxH_plot, label = sprintf("J=%.2f", pielou)),
            color = "#D55E00", size = 2.8, hjust = 0) +
  # Linea y puntos de Pielou escalada
  geom_line(aes(y = pielou * maxH_plot, group = tipo), color = "#E69F00", linewidth = 1.1) +
  geom_point(aes(y = pielou * maxH_plot), color = "#D55E00", size = 3, shape = 18) +
  facet_wrap(~ tipo, scales = "free_y", ncol = 1, strip.position = "top") +
  coord_flip() +
  scale_y_continuous(
    name = "Índice de Shannon (H)",
    limits = c(0, maxH_plot),
    sec.axis = sec_axis(~ . / maxH_plot, name = "Índice de Pielou (J)", labels = scales::number_format(accuracy = 0.01))
  ) +
  scale_fill_manual(values = c("Mayor diversidad (Top 10)" = "#1b9e77", "Menor diversidad (Bottom 10)" = "#d95f02")) +
  labs(
    title = "Diversidad de estados de culminación de proyectos (Ratio ACA)",
    subtitle = "Top 10 mayor y menor diversidad | Barras: H (con e^{H}) | Línea: J",
    x = "Comuna (ID - Nombre)",
    caption = "Fuente: Elaboración propia - Proyectos ACA (2022-2025)"
  ) +
  theme_minimal(base_size = 11) +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    plot.subtitle = element_text(size = 11, color = "gray30", hjust = 0.5),
    axis.text.y = element_text(size = 8),
    panel.grid.major.y = element_blank(),
    strip.text = element_text(face = "bold", size = 10, color = "white"),
    strip.background = element_rect(fill = "gray25", color = NA),
    legend.position = "none",
    panel.spacing = unit(1, "lines"),
    # márgenes y clip off para que etiquetas no se corten
    plot.margin = margin(t = 12, r = 120, b = 12, l = 180),
    panel.clip = "off"
  )

# --- 3. Convertir a plotly con tamaño fijo 1600x800 y mostrar ---
plotly_fix_size <- function(ggobj, width = 1600, height = 800, margin = list(l = 200, r = 120, b = 100, t = 90)) {
  p <- ggplotly(ggobj, tooltip = "text")
  p <- p %>% layout(autosize = FALSE, width = width, height = height, margin = margin)
  p <- p %>% config(displayModeBar = TRUE, modeBarButtonsToAdd = list("toImage", "zoom2d", "resetScale2d"))
  return(p)
}

ratio_plotly <- plotly_fix_size(ratio_plot2, width = 1600, height = 800)
ratio_plotly

Diversidad de estados de culminación (Ratio ACA)

El índice de Shannon aplicado al Ratio ACA sintetiza cuán dispersos o concentrados están los resultados de los proyectos dentro de cada comuna. Valores altos de H’ (por ejemplo, Comuna Prócer José Félix Ribas, H’ = 1.311 → eH’3.71) indican que la comuna concentra resultados en casi 4 categorías distintas de efectividad, lo que refleja heterogeneidad operativa: puede ser gestión activa y variada o ejecución errática. Valores medios (H’ ≈ 0.637 → eH’1.89) muestran que la mayoría de comunas operan con menos de 2 estados efectivos, lo que sugiere concentración de resultados (habitualmente en “MUY BAJA/BAJA”). Valores nulos (H′ = 0) equivalen a 1 estado efectivo: situación crítica que demanda reingeniería urgente.

El hallazgo más alarmante es la existencia de ocho (8) comunas con diversidad nula (H’ = 0,000), donde el 100% de sus proyectos comparten el mismo estado de culminación. Dado el contexto socio institucional venezolano, es altamente probable que el estado común sea “MUY BAJA” o “BAJA”. Esto confirma de manera contundente la Hipótesis 4 (Falla Estructural y Desconexión). Comunas como Unión de Chávez y Pensamiento Campesino representan el caso más crítico: el instrumento de las ACA ha fallado por completo en generar avances tangibles, evidenciando una parálisis total de la gestión proyectiva ya sea por el abandono institucional o la obstinación en macroproyectos inviables.

Reglas operativas (resumen):
- eH’ ≈ 1 → intervención urgente y reingeniería.
- 1 < eH’ < 3 → consolidación y auditoría de procesos.
- eH’ ≥ 3 → análisis cualitativo para distinguir complejidad gestionable vs. fragmentación institucional. “)

\[ H' = -\sum_{i=1}^{S} p_i \ln(p_i) \]

\[ \text{Número efectivo} = e^{H'} \]

Interpretación por comunas

  • Comuna Prócer José Félix Ribas\(H' = 1.311\)\(e^{H'} \approx 3.71\) — 9 proyectos. Alta heterogeneidad: se comporta como si tuviera ≈ 4 tipos de resultado (desde proyectos culminados hasta no considerados); requiere coordinación multisectorial.

  • Comuna Las Heroínas de Mérida\(H' = 1.055\)\(e^{H'} \approx 2.87\) — 5 proyectos. Diversidad notable: ≈ 3 tipos de resultado; conviene investigar qué explica la mezcla de éxitos y fracasos.

  • Comuna Mucujún\(H' = 1.011\)\(e^{H'} \approx 2.75\) — 6 proyectos. Complejidad moderada: ≈ 2–3 tipos efectivos; hacer un análisis cualitativo.

  • Comuna Alto de la Carbonera\(H' = 1.011\)\(e^{H'} \approx 2.75\) — 6 proyectos. Variabilidad similar a Mucujún; priorizar coordinación institucional.

  • Comuna Manuelita Sáenz\(H' = 1.099\)\(e^{H'} \approx 3.00\) — 3 proyectos. Alta diversidad pese al bajo número de proyectos; investigar la causa de la variabilidad.

  • Comuna El Paso de Bolívar 1813\(H' = 0.673\)\(e^{H'} \approx 1.96\) — 5 proyectos. Diversidad moderada: ≈ 2 tipos de resultado; buen candidato para intervenciones focales.

  • Comuna Eterno Gigante\(H' = 0.693\)\(e^{H'} \approx 2.00\) — 2 proyectos. Resultados concentrados en ~2 clases; acciones puntuales pueden tener alto impacto.

  • Comuna Unión de Chávez\(H' = 0.000\)\(e^{H'} = 1.00\) — 3 proyectos. Diversidad nula: todos los proyectos comparten el mismo estado → intervención urgente (reingeniería y apoyo técnico).

12 Aplicación de normalidad

Para determinar la relación entre las variables de estudio, es fundamental seleccionar la prueba estadística adecuada. La elección entre un método paramétrico (como el coeficiente de correlación de Pearson) y uno no paramétrico (como el coeficiente de correlación de Spearman) depende crucialmente de si los datos cumplen con el supuesto de normalidad. La violación de este supuesto puede llevar a conclusiones erróneas, afectando la validez del análisis estadístico. Por ello, antes de proceder con el análisis correlacional, se realizó una prueba de bondad de ajuste para evaluar la distribución de las variables clave de la investigación.

Para evaluar la normalidad de los datos, se seleccionó la prueba de Shapiro-Wilk. Esta elección se fundamenta en su reconocida potencia para detectar desviaciones de la normalidad (Arce & Rosales, 2015), si bien esta se restringió originalmente para tamaños de muestra pequeña (n < 50), esta prueba es la más potente y común su uso en el análisis de normalidad de los datos de cualquier estudio.

## Preparación de los datos
 # Eliminar valores nulos si es necesario
df_clean <- df_raw %>% filter(!is.na(n_proyectos) & !is.na(PLAZOS) & !is.na(CLASIFICACION_DEL_PROYECTO)& !is.na(RATIO_ACA_PROYECTO_CULMINADO)& !is.na(Clasificacion_Actores_institucionales)& !is.na(TIPOLOGIA_CFG_NUM)& !is.na(GOBERNACION_NUM))

# Función para crear un panel de diagnóstico de normalidad
create_normality_diagnostic <- function(data, variable, variable_name) {
  # Datos para la variable
  x <- data[[variable]]
  
  # Histograma con curva de densidad
  p1 <- ggplot(data, aes_string(x = variable)) +
    geom_histogram(aes(y = ..density..), bins = 30, fill = "lightblue", color = "black", alpha = 0.7) +
    geom_density(color = "red", linewidth = 1) +
    stat_function(fun = dnorm, 
                 args = list(mean = mean(x, na.rm = TRUE), 
                           sd = sd(x, na.rm = TRUE)),
                 color = "blue", linewidth = 1, linetype = "dashed") +
    labs(title = paste("Histograma y Densidad -", variable_name),
         x = variable_name, y = "Densidad") +
    theme_minimal()
  
  # Q-Q plot
  p2 <- ggplot(data, aes(sample = x)) +
    stat_qq() +
    stat_qq_line(color = "red") +
    labs(title = paste("Q-Q Plot -", variable_name)) +
    theme_minimal()
  
  # Combinar los gráficos
  gridExtra::grid.arrange(p1, p2, ncol = 2)
}

# Lista de variables para analizar
variables_to_analyze <- list(
  "n_proyectos" = "Número de Proyectos",
  "RATIO_ACA_PROYECTO_CULMINADO" = "Ratio ACA",
  "TIPOLOGIA_CFG_NUM" = "Tipología CFG",
  "GOBERNACION_NUM" = "Gobernación",
  "PLAZOS" = "Plazos",
  "CLASIFICACION_DEL_PROYECTO" = "Clasificación del Proyecto",
  "Clasificacion_Actores_institucionales" = "Actores Institucionales"
)

# Crear un panel para cada variable
for(var in names(variables_to_analyze)) {
  cat("\n\nAnálisis de normalidad para:", variables_to_analyze[[var]], "\n")
  print(create_normality_diagnostic(df_clean, var, variables_to_analyze[[var]]))
  
  # Imprimir resultados del test de Shapiro-Wilk
  sw_test <- shapiro.test(df_clean[[var]])
  cat("\nTest de Shapiro-Wilk:\n")
  cat("W =", round(sw_test$statistic, 4), "\n")
  cat("p-value =", format.pval(sw_test$p.value, digits = 4), "\n")
  cat("-----------------------------------\n")
}
## 
## 
## Análisis de normalidad para: Número de Proyectos

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.5502 
## p-value = < 2.2e-16 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Ratio ACA

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.7444 
## p-value = < 2.2e-16 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Tipología CFG

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.8753 
## p-value = 1.027e-11 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Gobernación

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.8601 
## p-value = 1.622e-12 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Plazos

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.4559 
## p-value = < 2.2e-16 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Clasificación del Proyecto

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.7444 
## p-value = < 2.2e-16 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Actores Institucionales

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.8347 
## p-value = 9.828e-14 
## -----------------------------------
# Preparar el espacio para múltiples gráficos
par(mfrow = c(2, 4))  # 2 filas x 4 columnas para acomodar todos los Q-Q plots

# Crear Q-Q plots para cada variable con títulos descriptivos
qqnorm(df_clean$n_proyectos, main="Q-Q Plot: N° Proyectos",
       col = "blue", pch = 19)
qqline(df_clean$n_proyectos, col = "red")

qqnorm(df_clean$RATIO_ACA_PROYECTO_CULMINADO, main="Q-Q Plot: Ratio ACA",
       col = "green4", pch = 19)
qqline(df_clean$RATIO_ACA_PROYECTO_CULMINADO, col = "red")

qqnorm(df_clean$TIPOLOGIA_CFG_NUM, main="Q-Q Plot: Tipología CFG",
       col = "purple", pch = 19)
qqline(df_clean$TIPOLOGIA_CFG_NUM, col = "red")

qqnorm(df_clean$GOBERNACION_NUM, main="Q-Q Plot: Gobernación",
       col = "orange", pch = 19)
qqline(df_clean$GOBERNACION_NUM, col = "red")

qqnorm(df_clean$PLAZOS, main="Q-Q Plot: Plazos",
       col = "brown", pch = 19)
qqline(df_clean$PLAZOS, col = "red")

qqnorm(df_clean$CLASIFICACION_DEL_PROYECTO, main="Q-Q Plot: Clasificación",
       col = "darkgreen", pch = 19)
qqline(df_clean$CLASIFICACION_DEL_PROYECTO, col = "red")

qqnorm(df_clean$Clasificacion_Actores_institucionales, 
       main="Q-Q Plot: Actores Institucionales",
       col = "darkblue", pch = 19)
qqline(df_clean$Clasificacion_Actores_institucionales, col = "red")

# Restaurar la configuración original de gráficos
par(mfrow = c(1, 1))

# Resumen estadístico de las pruebas de normalidad
normality_summary <- data.frame(
  Variable = names(variables_to_analyze),
  W_statistic = sapply(names(variables_to_analyze), 
                      function(x) shapiro.test(df_clean[[x]])$statistic),
  p_value = sapply(names(variables_to_analyze), 
                   function(x) shapiro.test(df_clean[[x]])$p.value)
) %>%
  mutate(
    Normalidad = ifelse(p_value < 0.05, "No Normal", "Normal"),
    Variable_Name = unlist(variables_to_analyze)
  )

# Mostrar tabla resumen
kable(normality_summary %>% 
        select(Variable_Name, W_statistic, p_value, Normalidad),
      col.names = c("Variable", "Estadístico W", "Valor p", "Conclusión"),
      caption = "Resumen de Pruebas de Normalidad Shapiro-Wilk") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Resumen de Pruebas de Normalidad Shapiro-Wilk
Variable Estadístico W Valor p Conclusión
n_proyectos.W Número de Proyectos 0.5501951 0 No Normal
RATIO_ACA_PROYECTO_CULMINADO.W Ratio ACA 0.7444145 0 No Normal
TIPOLOGIA_CFG_NUM.W Tipología CFG 0.8753315 0 No Normal
GOBERNACION_NUM.W Gobernación 0.8601242 0 No Normal
PLAZOS.W Plazos 0.4559052 0 No Normal
CLASIFICACION_DEL_PROYECTO.W Clasificación del Proyecto 0.7444145 0 No Normal
Clasificacion_Actores_institucionales.W Actores Institucionales 0.8346786 0 No Normal

Para cada variable analizada, se plantearon las siguientes hipótesis, siguiendo el procedimiento estándar para una prueba de normalidad:

Hipótesis Nula (H₀): Los datos de la variable siguen una distribución normal.

Hipótesis Alternativa Hₐ: Los datos de la variable no siguen una distribución normal.

En todos los casos analizados, el p-valor obtenido es extremadamente bajo (por ejemplo, < 2.2e-16), lo cual es significativamente inferior a cualquier nivel de significancia estándar (comúnmente α = 0.05). De acuerdo con la regla de decisión, cuando el p-valor es menor que el nivel de significancia, se rechaza la hipótesis nula. Por lo tanto, se rechaza la hipótesis nula de normalidad para todas las variables clave del estudio. Esto confirma que los datos no se distribuyen de manera normal.

Dado que las pruebas de normalidad de Shapiro-Wilk indican de manera concluyente que las variables de la investigación no siguen una distribución normal, no se cumplen los supuestos para la aplicación de pruebas paramétricas. En consecuencia, para analizar la relación entre las variables ordinales de este estudio, se opta por un método no paramétrico. Específicamente, se utilizará el coeficiente de correlación de Spearman (ρ), ya que es la herramienta ideal para cuantificar el grado de asociación entre variables ordinales o cuantitativas que no presentan una distribución normal.

13 4.7 Modelo de Correlación General entre Proyectos Comunitarios y Puntos Críticos

Para guiar el análisis de correlación entre los proyectos comunitarios de las Agendas Concretas de Acción y los nudos críticos en el Estado Mérida, se adoptó un enfoque no paramétrico mediante el coeficiente de correlación de Spearman. Esta decisión metodológica se fundamentó en la ausencia de normalidad detectada en las variables cuantitativas a través de la prueba de Shapiro-Wilk, donde todos los p-valores resultaron menores a 0.001.

El coeficiente de Spearman es particularmente apropiado para este análisis porque no asume distribuciones normales y es robusto ante la presencia de valores atípicos, características presentes en nuestros datos. Este coeficiente mide el grado de asociación monotónica entre dos variables, permitiéndonos identificar tanto relaciones lineales como no lineales.

# ===============================================================================
# MODELO DE CORRELACIÓN DE SPEARMAN PARA PROYECTOS COMUNALES ACA
# ===============================================================================

# 1. Preparación de datos (IGUAL)
top10_cfg <- df_dummies %>% count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG) %>% arrange(desc(n)) %>% slice(1:10) %>% pull(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG)
top10_gob <- df_dummies %>% count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION) %>% arrange(desc(n)) %>% slice(1:10) %>% pull(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION)
cfg_dummy_cols <- paste0("CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_", gsub(" ", "_", top10_cfg))
gob_dummy_cols <- paste0("CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_", gsub(" ", "_", top10_gob))
cfg_dummy_cols <- intersect(cfg_dummy_cols, names(df_dummies))
gob_dummy_cols <- intersect(gob_dummy_cols, names(df_dummies))
vars_resultado <- c("RATIO_ACA_PROYECTO_CULMINADO", "CLASIFICACION_DEL_PROYECTO", "PLAZOS", "Clasificacion_Actores_institucionales")

# 2. CREAR df_cor CORREGIDO (SIN case_when)
df_cor <- df_dummies %>%
  select(all_of(vars_resultado), all_of(cfg_dummy_cols), all_of(gob_dummy_cols))
  # ↑ ELIMINADO el mutate() con case_when porque la variable ya está correcta (1,2,3,4)

# 3. Cálculo de correlaciones de Spearman (IGUAL)
calcular_cor_spearman <- function(data) {
  n_vars <- ncol(data)
  cor_matrix <- matrix(NA, nrow = n_vars, ncol = n_vars)
  p_matrix <- matrix(NA, nrow = n_vars, ncol = n_vars)
  for (i in 1:n_vars) {
    for (j in 1:n_vars) {
      if (i != j) {
        temp <- data[, c(i, j)] %>% na.omit()
        if (nrow(temp) > 10) {
          test <- suppressWarnings(cor.test(temp[[1]], temp[[2]], method = "spearman", exact = FALSE))
          cor_matrix[i, j] <- test$estimate
          p_matrix[i, j] <- test$p.value
        }
      } else {
        cor_matrix[i, j] <- 1
      }
    }
  }
  rownames(cor_matrix) <- colnames(cor_matrix) <- colnames(data)
  rownames(p_matrix) <- colnames(p_matrix) <- colnames(data)
  return(list(cor = cor_matrix, p = p_matrix))
}
set.seed(123)
cor_results <- calcular_cor_spearman(df_cor)

# 4. Procesamiento de resultados y nombres cortos (IGUAL)
acortar_nombres <- function(nombres) {
  nombres <- gsub("CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_", "CFG: ", nombres)
  nombres <- gsub("CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_", "GOB: ", nombres)
  nombres <- gsub("_", " ", nombres)
  substr(nombres, 1, 28)
}
colnames(cor_results$cor) <- rownames(cor_results$cor) <- acortar_nombres(colnames(df_cor))
colnames(cor_results$p) <- rownames(cor_results$p) <- acortar_nombres(colnames(df_cor))

cor_df <- as.data.frame(cor_results$cor) %>%
  tibble::rownames_to_column("Variable1") %>%
  pivot_longer(-Variable1, names_to = "Variable2", values_to = "Correlacion") %>%
  left_join(
    as.data.frame(cor_results$p) %>%
      tibble::rownames_to_column("Variable1") %>%
      pivot_longer(-Variable1, names_to = "Variable2", values_to = "p_valor"),
    by = c("Variable1", "Variable2")
  ) %>%
  filter(!is.na(Correlacion), Variable1 != Variable2) %>%
  mutate(
    Significativa = ifelse(p_valor < 0.05, "Sí", "No"),
    Magnitud = case_when(
      abs(Correlacion) > 0.6 ~ "Muy fuerte",
      abs(Correlacion) > 0.4 ~ "Fuerte",
      abs(Correlacion) > 0.2 ~ "Moderada",
      TRUE ~ "Débil"
    )
  )

# 4. TABLA COMPLETA DE COEFICIENTES DE SPEARMAN
tabla_coef_spearman <- cor_df %>%
  select(Variable1, Variable2, Correlacion, p_valor, Significativa, Magnitud) %>%
  arrange(desc(abs(Correlacion)))

kable(tabla_coef_spearman,
      caption = "Coeficientes de Correlación de Spearman entre variables clave (ACA)",
      col.names = c("Variable 1", "Variable 2", "Rho (ρ)", "p-valor", "Significativa", "Magnitud"),
      align = "l") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  row_spec(which(tabla_coef_spearman$Significativa == "Sí" & tabla_coef_spearman$Magnitud != "Débil"), bold = TRUE, color = "white", background = "#1b9e77") %>%
  row_spec(which(tabla_coef_spearman$Significativa == "Sí" & tabla_coef_spearman$Magnitud == "Débil"), color = "black", background = "#e6f2e6") %>%
  row_spec(which(tabla_coef_spearman$Significativa == "No"), color = "gray40", background = "#f7f7f7")
Coeficientes de Correlación de Spearman entre variables clave (ACA)
Variable 1 Variable 2 Rho (ρ) p-valor Significativa Magnitud
RATIO ACA PROYECTO CULMINADO CLASIFICACION DEL PROYECTO 1.0000000 0.0000000 Muy fuerte
CLASIFICACION DEL PROYECTO RATIO ACA PROYECTO CULMINADO 1.0000000 0.0000000 Muy fuerte
CFG: ELECTRICIDAD GOB: ELECTRICIDAD 1.0000000 0.0000000 Muy fuerte
CFG: AMBIENTE GOB: CANALIZACION 1.0000000 0.0000000 Muy fuerte
GOB: ELECTRICIDAD CFG: ELECTRICIDAD 1.0000000 0.0000000 Muy fuerte
GOB: CANALIZACION CFG: AMBIENTE 1.0000000 0.0000000 Muy fuerte
CFG: VIVIENDA GOB: VIVIENDA 0.9501193 0.0000000 Muy fuerte
GOB: VIVIENDA CFG: VIVIENDA 0.9501193 0.0000000 Muy fuerte
CFG: TRANSPORTE GOB: TRANSPORTE 0.9329624 0.0000000 Muy fuerte
GOB: TRANSPORTE CFG: TRANSPORTE 0.9329624 0.0000000 Muy fuerte
CFG: VIALIDAD GOB: VIALIDAD 0.7483315 0.0000000 Muy fuerte
GOB: VIALIDAD CFG: VIALIDAD 0.7483315 0.0000000 Muy fuerte
Clasificacion Actores instit CFG: VIVIENDA -0.3677849 0.0000001 Moderada
CFG: VIVIENDA Clasificacion Actores instit -0.3677849 0.0000001 Moderada
Clasificacion Actores instit GOB: VIVIENDA -0.3535836 0.0000003 Moderada
GOB: VIVIENDA Clasificacion Actores instit -0.3535836 0.0000003 Moderada
Clasificacion Actores instit CFG: VIALIDAD 0.1910140 0.0070251 Débil
CFG: VIALIDAD Clasificacion Actores instit 0.1910140 0.0070251 Débil
PLAZOS CFG: INFRAESTRUCTURA -0.1854281 0.0089121 Débil
CFG: INFRAESTRUCTURA PLAZOS -0.1854281 0.0089121 Débil
RATIO ACA PROYECTO CULMINADO GOB: TRANSPORTE 0.1667478 0.0188767 Débil
CLASIFICACION DEL PROYECTO GOB: TRANSPORTE 0.1667478 0.0188767 Débil
GOB: TRANSPORTE RATIO ACA PROYECTO CULMINADO 0.1667478 0.0188767 Débil
GOB: TRANSPORTE CLASIFICACION DEL PROYECTO 0.1667478 0.0188767 Débil
Clasificacion Actores instit CFG: AMBIENTE -0.1552753 0.0289366 Débil
Clasificacion Actores instit GOB: CANALIZACION -0.1552753 0.0289366 Débil
CFG: AMBIENTE Clasificacion Actores instit -0.1552753 0.0289366 Débil
GOB: CANALIZACION Clasificacion Actores instit -0.1552753 0.0289366 Débil
CFG: VIALIDAD GOB: VIVIENDA -0.1531972 0.0311804 Débil
GOB: VIVIENDA CFG: VIALIDAD -0.1531972 0.0311804 Débil
CFG: VIALIDAD CFG: VIVIENDA -0.1455556 0.0407474 Débil
CFG: VIVIENDA CFG: VIALIDAD -0.1455556 0.0407474 Débil
RATIO ACA PROYECTO CULMINADO CFG: TRANSPORTE 0.1394358 0.0500900 No Débil
CLASIFICACION DEL PROYECTO CFG: TRANSPORTE 0.1394358 0.0500900 No Débil
CFG: TRANSPORTE RATIO ACA PROYECTO CULMINADO 0.1394358 0.0500900 No Débil
CFG: TRANSPORTE CLASIFICACION DEL PROYECTO 0.1394358 0.0500900 No Débil
CFG: VIALIDAD CFG: ELECTRICIDAD -0.1376754 0.0530862 No Débil
CFG: VIALIDAD GOB: ELECTRICIDAD -0.1376754 0.0530862 No Débil
CFG: ELECTRICIDAD CFG: VIALIDAD -0.1376754 0.0530862 No Débil
GOB: ELECTRICIDAD CFG: VIALIDAD -0.1376754 0.0530862 No Débil
Clasificacion Actores instit GOB: TRANSPORTE 0.1259022 0.0771572 No Débil
GOB: TRANSPORTE Clasificacion Actores instit 0.1259022 0.0771572 No Débil
CFG: ELECTRICIDAD GOB: VIVIENDA -0.1181123 0.0974648 No Débil
GOB: VIVIENDA CFG: ELECTRICIDAD -0.1181123 0.0974648 No Débil
GOB: VIVIENDA GOB: ELECTRICIDAD -0.1181123 0.0974648 No Débil
GOB: ELECTRICIDAD GOB: VIVIENDA -0.1181123 0.0974648 No Débil
CFG: VIALIDAD CFG: SALUD -0.1165631 0.1019688 No Débil
CFG: SALUD CFG: VIALIDAD -0.1165631 0.1019688 No Débil
GOB: VIVIENDA GOB: VIALIDAD -0.1146423 0.1077797 No Débil
GOB: VIALIDAD GOB: VIVIENDA -0.1146423 0.1077797 No Débil
CFG: VIVIENDA CFG: ELECTRICIDAD -0.1122208 0.1154725 No Débil
CFG: VIVIENDA GOB: ELECTRICIDAD -0.1122208 0.1154725 No Débil
CFG: ELECTRICIDAD CFG: VIVIENDA -0.1122208 0.1154725 No Débil
GOB: ELECTRICIDAD CFG: VIVIENDA -0.1122208 0.1154725 No Débil
CFG: VIALIDAD GOB: DRENAJES -0.1120190 0.1161323 No Débil
GOB: DRENAJES CFG: VIALIDAD -0.1120190 0.1161323 No Débil
RATIO ACA PROYECTO CULMINADO CFG: AMBIENTE -0.1119048 0.1165071 No Débil
RATIO ACA PROYECTO CULMINADO GOB: CANALIZACION -0.1119048 0.1165071 No Débil
CLASIFICACION DEL PROYECTO CFG: AMBIENTE -0.1119048 0.1165071 No Débil
CLASIFICACION DEL PROYECTO GOB: CANALIZACION -0.1119048 0.1165071 No Débil
CFG: AMBIENTE RATIO ACA PROYECTO CULMINADO -0.1119048 0.1165071 No Débil
CFG: AMBIENTE CLASIFICACION DEL PROYECTO -0.1119048 0.1165071 No Débil
GOB: CANALIZACION RATIO ACA PROYECTO CULMINADO -0.1119048 0.1165071 No Débil
GOB: CANALIZACION CLASIFICACION DEL PROYECTO -0.1119048 0.1165071 No Débil
CFG: VIVIENDA GOB: VIALIDAD -0.1089239 0.1266271 No Débil
GOB: VIALIDAD CFG: VIVIENDA -0.1089239 0.1266271 No Débil
CFG: VIALIDAD CFG: INFRAESTRUCTURA -0.1073347 0.1322928 No Débil
CFG: INFRAESTRUCTURA CFG: VIALIDAD -0.1073347 0.1322928 No Débil
Clasificacion Actores instit CFG: SALUD -0.1042387 0.1438877 No Débil
CFG: SALUD Clasificacion Actores instit -0.1042387 0.1438877 No Débil
CFG: INFRAESTRUCTURA GOB: DRENAJES 0.1035873 0.1464227 No Débil
GOB: DRENAJES CFG: INFRAESTRUCTURA 0.1035873 0.1464227 No Débil
PLAZOS GOB: VIVIENDA -0.1035622 0.1465214 No Débil
GOB: VIVIENDA PLAZOS -0.1035622 0.1465214 No Débil
CFG: ELECTRICIDAD GOB: VIALIDAD -0.1030268 0.1486312 No Débil
GOB: ELECTRICIDAD GOB: VIALIDAD -0.1030268 0.1486312 No Débil
GOB: VIALIDAD CFG: ELECTRICIDAD -0.1030268 0.1486312 No Débil
GOB: VIALIDAD GOB: ELECTRICIDAD -0.1030268 0.1486312 No Débil
CFG: SALUD GOB: VIVIENDA -0.1000000 0.1609954 No Débil
GOB: VIVIENDA CFG: SALUD -0.1000000 0.1609954 No Débil
RATIO ACA PROYECTO CULMINADO CFG: TELECOMUNICACIONES -0.0996781 0.1623544 No Débil
CLASIFICACION DEL PROYECTO CFG: TELECOMUNICACIONES -0.0996781 0.1623544 No Débil
CFG: TELECOMUNICACIONES RATIO ACA PROYECTO CULMINADO -0.0996781 0.1623544 No Débil
CFG: TELECOMUNICACIONES CLASIFICACION DEL PROYECTO -0.0996781 0.1623544 No Débil
CFG: VIALIDAD CFG: AMBIENTE -0.0974601 0.1719525 No Débil
CFG: VIALIDAD GOB: CANALIZACION -0.0974601 0.1719525 No Débil
CFG: AMBIENTE CFG: VIALIDAD -0.0974601 0.1719525 No Débil
GOB: CANALIZACION CFG: VIALIDAD -0.0974601 0.1719525 No Débil
GOB: VIVIENDA GOB: DRENAJES -0.0961016 0.1780359 No Débil
GOB: DRENAJES GOB: VIVIENDA -0.0961016 0.1780359 No Débil
CFG: VIVIENDA CFG: SALUD -0.0950119 0.1830293 No Débil
CFG: SALUD CFG: VIVIENDA -0.0950119 0.1830293 No Débil
CFG: VIALIDAD CFG: EDUCACIÓN -0.0922139 0.1963212 No Débil
CFG: EDUCACIÓN CFG: VIALIDAD -0.0922139 0.1963212 No Débil
Clasificacion Actores instit CFG: INFRAESTRUCTURA 0.0915679 0.1994874 No Débil
CFG: INFRAESTRUCTURA Clasificacion Actores instit 0.0915679 0.1994874 No Débil
CFG: VIVIENDA GOB: DRENAJES -0.0913080 0.2007715 No Débil
GOB: DRENAJES CFG: VIVIENDA -0.0913080 0.2007715 No Débil
CFG: ELECTRICIDAD CFG: SALUD -0.0898681 0.2079948 No Débil
CFG: SALUD CFG: ELECTRICIDAD -0.0898681 0.2079948 No Débil
CFG: SALUD GOB: ELECTRICIDAD -0.0898681 0.2079948 No Débil
GOB: ELECTRICIDAD CFG: SALUD -0.0898681 0.2079948 No Débil
CFG: VIVIENDA CFG: INFRAESTRUCTURA -0.0874897 0.2203316 No Débil
CFG: INFRAESTRUCTURA CFG: VIVIENDA -0.0874897 0.2203316 No Débil
Clasificacion Actores instit CFG: ELECTRICIDAD 0.0874440 0.2205739 No Débil
Clasificacion Actores instit GOB: ELECTRICIDAD 0.0874440 0.2205739 No Débil
CFG: ELECTRICIDAD Clasificacion Actores instit 0.0874440 0.2205739 No Débil
GOB: ELECTRICIDAD Clasificacion Actores instit 0.0874440 0.2205739 No Débil
RATIO ACA PROYECTO CULMINADO Clasificacion Actores instit 0.0873689 0.2209722 No Débil
CLASIFICACION DEL PROYECTO Clasificacion Actores instit 0.0873689 0.2209722 No Débil
Clasificacion Actores instit RATIO ACA PROYECTO CULMINADO 0.0873689 0.2209722 No Débil
Clasificacion Actores instit CLASIFICACION DEL PROYECTO 0.0873689 0.2209722 No Débil
CFG: SALUD GOB: VIALIDAD -0.0872278 0.2217214 No Débil
GOB: VIALIDAD CFG: SALUD -0.0872278 0.2217214 No Débil
CFG: ELECTRICIDAD GOB: DRENAJES -0.0863647 0.2263457 No Débil
GOB: ELECTRICIDAD GOB: DRENAJES -0.0863647 0.2263457 No Débil
GOB: DRENAJES CFG: ELECTRICIDAD -0.0863647 0.2263457 No Débil
GOB: DRENAJES GOB: ELECTRICIDAD -0.0863647 0.2263457 No Débil
Clasificacion Actores instit CFG: TRANSPORTE 0.0843585 0.2373560 No Débil
CFG: TRANSPORTE Clasificacion Actores instit 0.0843585 0.2373560 No Débil
GOB: VIALIDAD GOB: DRENAJES -0.0838274 0.2403330 No Débil
GOB: DRENAJES GOB: VIALIDAD -0.0838274 0.2403330 No Débil
CFG: AMBIENTE GOB: VIVIENDA -0.0836115 0.2415503 No Débil
GOB: VIVIENDA CFG: AMBIENTE -0.0836115 0.2415503 No Débil
GOB: VIVIENDA GOB: CANALIZACION -0.0836115 0.2415503 No Débil
GOB: CANALIZACION GOB: VIVIENDA -0.0836115 0.2415503 No Débil
CFG: ELECTRICIDAD CFG: INFRAESTRUCTURA -0.0827531 0.2464333 No Débil
CFG: INFRAESTRUCTURA CFG: ELECTRICIDAD -0.0827531 0.2464333 No Débil
CFG: INFRAESTRUCTURA GOB: ELECTRICIDAD -0.0827531 0.2464333 No Débil
GOB: ELECTRICIDAD CFG: INFRAESTRUCTURA -0.0827531 0.2464333 No Débil
CFG: VIALIDAD CFG: TRANSPORTE -0.0808981 0.2572194 No Débil
CFG: TRANSPORTE CFG: VIALIDAD -0.0808981 0.2572194 No Débil
CFG: INFRAESTRUCTURA GOB: VIALIDAD -0.0803219 0.2606347 No Débil
GOB: VIALIDAD CFG: INFRAESTRUCTURA -0.0803219 0.2606347 No Débil
Clasificacion Actores instit GOB: VIALIDAD 0.0798595 0.2633984 No Débil
GOB: VIALIDAD Clasificacion Actores instit 0.0798595 0.2633984 No Débil
CFG: VIVIENDA CFG: AMBIENTE -0.0794409 0.2659172 No Débil
CFG: VIVIENDA GOB: CANALIZACION -0.0794409 0.2659172 No Débil
CFG: AMBIENTE CFG: VIVIENDA -0.0794409 0.2659172 No Débil
GOB: CANALIZACION CFG: VIVIENDA -0.0794409 0.2659172 No Débil
CFG: EDUCACIÓN GOB: VIVIENDA -0.0791107 0.2679156 No Débil
GOB: VIVIENDA CFG: EDUCACIÓN -0.0791107 0.2679156 No Débil
PLAZOS CFG: VIVIENDA -0.0790295 0.2684088 No Débil
CFG: VIVIENDA PLAZOS -0.0790295 0.2684088 No Débil
CFG: VIVIENDA CFG: EDUCACIÓN -0.0751646 0.2925919 No Débil
CFG: EDUCACIÓN CFG: VIVIENDA -0.0751646 0.2925919 No Débil
CFG: ELECTRICIDAD CFG: AMBIENTE -0.0751400 0.2927502 No Débil
CFG: ELECTRICIDAD GOB: CANALIZACION -0.0751400 0.2927502 No Débil
CFG: AMBIENTE CFG: ELECTRICIDAD -0.0751400 0.2927502 No Débil
CFG: AMBIENTE GOB: ELECTRICIDAD -0.0751400 0.2927502 No Débil
GOB: ELECTRICIDAD CFG: AMBIENTE -0.0751400 0.2927502 No Débil
GOB: ELECTRICIDAD GOB: CANALIZACION -0.0751400 0.2927502 No Débil
GOB: CANALIZACION CFG: ELECTRICIDAD -0.0751400 0.2927502 No Débil
GOB: CANALIZACION GOB: ELECTRICIDAD -0.0751400 0.2927502 No Débil
CFG: VIALIDAD CFG: TELECOMUNICACIONES -0.0747018 0.2955822 No Débil
CFG: TELECOMUNICACIONES CFG: VIALIDAD -0.0747018 0.2955822 No Débil
GOB: VIVIENDA GOB: TRANSPORTE -0.0743897 0.2976098 No Débil
GOB: TRANSPORTE GOB: VIVIENDA -0.0743897 0.2976098 No Débil
CFG: SALUD GOB: DRENAJES -0.0731208 0.3059499 No Débil
GOB: DRENAJES CFG: SALUD -0.0731208 0.3059499 No Débil
CFG: AMBIENTE GOB: VIALIDAD -0.0729325 0.3072004 No Débil
GOB: VIALIDAD CFG: AMBIENTE -0.0729325 0.3072004 No Débil
GOB: VIALIDAD GOB: CANALIZACION -0.0729325 0.3072004 No Débil
GOB: CANALIZACION GOB: VIALIDAD -0.0729325 0.3072004 No Débil
Clasificacion Actores instit CFG: EDUCACIÓN 0.0713166 0.3180701 No Débil
CFG: EDUCACIÓN Clasificacion Actores instit 0.0713166 0.3180701 No Débil
CFG: ELECTRICIDAD CFG: EDUCACIÓN -0.0710953 0.3195782 No Débil
CFG: EDUCACIÓN CFG: ELECTRICIDAD -0.0710953 0.3195782 No Débil
CFG: EDUCACIÓN GOB: ELECTRICIDAD -0.0710953 0.3195782 No Débil
GOB: ELECTRICIDAD CFG: EDUCACIÓN -0.0710953 0.3195782 No Débil
CFG: VIVIENDA GOB: TRANSPORTE -0.0706791 0.3224261 No Débil
GOB: TRANSPORTE CFG: VIVIENDA -0.0706791 0.3224261 No Débil
RATIO ACA PROYECTO CULMINADO CFG: EDUCACIÓN -0.0700818 0.3265424 No Débil
CLASIFICACION DEL PROYECTO CFG: EDUCACIÓN -0.0700818 0.3265424 No Débil
CFG: EDUCACIÓN RATIO ACA PROYECTO CULMINADO -0.0700818 0.3265424 No Débil
CFG: EDUCACIÓN CLASIFICACION DEL PROYECTO -0.0700818 0.3265424 No Débil
CFG: SALUD CFG: INFRAESTRUCTURA -0.0700631 0.3266722 No Débil
CFG: INFRAESTRUCTURA CFG: SALUD -0.0700631 0.3266722 No Débil
CFG: TRANSPORTE GOB: VIVIENDA -0.0694028 0.3312629 No Débil
GOB: VIVIENDA CFG: TRANSPORTE -0.0694028 0.3312629 No Débil
CFG: EDUCACIÓN GOB: VIALIDAD -0.0690066 0.3340380 No Débil
GOB: VIALIDAD CFG: EDUCACIÓN -0.0690066 0.3340380 No Débil
PLAZOS CFG: VIALIDAD 0.0678688 0.3420879 No Débil
CFG: VIALIDAD PLAZOS 0.0678688 0.3420879 No Débil
CFG: ELECTRICIDAD GOB: TRANSPORTE -0.0668526 0.3493807 No Débil
GOB: ELECTRICIDAD GOB: TRANSPORTE -0.0668526 0.3493807 No Débil
GOB: TRANSPORTE CFG: ELECTRICIDAD -0.0668526 0.3493807 No Débil
GOB: TRANSPORTE GOB: ELECTRICIDAD -0.0668526 0.3493807 No Débil
CFG: VIVIENDA CFG: TRANSPORTE -0.0659410 0.3560062 No Débil
CFG: TRANSPORTE CFG: VIVIENDA -0.0659410 0.3560062 No Débil
GOB: VIALIDAD GOB: TRANSPORTE -0.0648886 0.3637516 No Débil
GOB: TRANSPORTE GOB: VIALIDAD -0.0648886 0.3637516 No Débil
CFG: TELECOMUNICACIONES GOB: VIVIENDA -0.0640870 0.3697206 No Débil
GOB: VIVIENDA CFG: TELECOMUNICACIONES -0.0640870 0.3697206 No Débil
CFG: SALUD CFG: AMBIENTE -0.0636174 0.3732451 No Débil
CFG: SALUD GOB: CANALIZACION -0.0636174 0.3732451 No Débil
CFG: AMBIENTE CFG: SALUD -0.0636174 0.3732451 No Débil
GOB: CANALIZACION CFG: SALUD -0.0636174 0.3732451 No Débil
PLAZOS GOB: DRENAJES 0.0625221 0.3815470 No Débil
GOB: DRENAJES PLAZOS 0.0625221 0.3815470 No Débil
CFG: ELECTRICIDAD CFG: TRANSPORTE -0.0623710 0.3827007 No Débil
CFG: TRANSPORTE CFG: ELECTRICIDAD -0.0623710 0.3827007 No Débil
CFG: TRANSPORTE GOB: ELECTRICIDAD -0.0623710 0.3827007 No Débil
GOB: ELECTRICIDAD CFG: TRANSPORTE -0.0623710 0.3827007 No Débil
CFG: AMBIENTE GOB: DRENAJES -0.0611374 0.3922007 No Débil
GOB: DRENAJES CFG: AMBIENTE -0.0611374 0.3922007 No Débil
GOB: DRENAJES GOB: CANALIZACION -0.0611374 0.3922007 No Débil
GOB: CANALIZACION GOB: DRENAJES -0.0611374 0.3922007 No Débil
CFG: VIVIENDA CFG: TELECOMUNICACIONES -0.0608903 0.3941206 No Débil
CFG: TELECOMUNICACIONES CFG: VIVIENDA -0.0608903 0.3941206 No Débil
CFG: TRANSPORTE GOB: VIALIDAD -0.0605386 0.3968628 No Débil
GOB: VIALIDAD CFG: TRANSPORTE -0.0605386 0.3968628 No Débil
CFG: SALUD CFG: EDUCACIÓN -0.0601929 0.3995692 No Débil
CFG: EDUCACIÓN CFG: SALUD -0.0601929 0.3995692 No Débil
PLAZOS CFG: TRANSPORTE -0.0598959 0.4019035 No Débil
CFG: TRANSPORTE PLAZOS -0.0598959 0.4019035 No Débil
RATIO ACA PROYECTO CULMINADO GOB: DRENAJES -0.0597116 0.4033558 No Débil
CLASIFICACION DEL PROYECTO GOB: DRENAJES -0.0597116 0.4033558 No Débil
GOB: DRENAJES RATIO ACA PROYECTO CULMINADO -0.0597116 0.4033558 No Débil
GOB: DRENAJES CLASIFICACION DEL PROYECTO -0.0597116 0.4033558 No Débil
CFG: INFRAESTRUCTURA CFG: AMBIENTE -0.0585808 0.4123358 No Débil
CFG: INFRAESTRUCTURA GOB: CANALIZACION -0.0585808 0.4123358 No Débil
CFG: AMBIENTE CFG: INFRAESTRUCTURA -0.0585808 0.4123358 No Débil
GOB: CANALIZACION CFG: INFRAESTRUCTURA -0.0585808 0.4123358 No Débil
RATIO ACA PROYECTO CULMINADO CFG: SALUD -0.0582558 0.4149379 No Débil
CLASIFICACION DEL PROYECTO CFG: SALUD -0.0582558 0.4149379 No Débil
CFG: SALUD RATIO ACA PROYECTO CULMINADO -0.0582558 0.4149379 No Débil
CFG: SALUD CLASIFICACION DEL PROYECTO -0.0582558 0.4149379 No Débil
CFG: EDUCACIÓN GOB: DRENAJES -0.0578464 0.4182304 No Débil
GOB: DRENAJES CFG: EDUCACIÓN -0.0578464 0.4182304 No Débil
CFG: ELECTRICIDAD CFG: TELECOMUNICACIONES -0.0575937 0.4202695 No Débil
CFG: TELECOMUNICACIONES CFG: ELECTRICIDAD -0.0575937 0.4202695 No Débil
CFG: TELECOMUNICACIONES GOB: ELECTRICIDAD -0.0575937 0.4202695 No Débil
GOB: ELECTRICIDAD CFG: TELECOMUNICACIONES -0.0575937 0.4202695 No Débil
CFG: SALUD GOB: TRANSPORTE -0.0566009 0.4283387 No Débil
GOB: TRANSPORTE CFG: SALUD -0.0566009 0.4283387 No Débil
CFG: TELECOMUNICACIONES GOB: VIALIDAD -0.0559017 0.4340746 No Débil
GOB: VIALIDAD CFG: TELECOMUNICACIONES -0.0559017 0.4340746 No Débil
CFG: INFRAESTRUCTURA CFG: EDUCACIÓN -0.0554274 0.4379906 No Débil
CFG: EDUCACIÓN CFG: INFRAESTRUCTURA -0.0554274 0.4379906 No Débil
GOB: DRENAJES GOB: TRANSPORTE -0.0543944 0.4465888 No Débil
GOB: TRANSPORTE GOB: DRENAJES -0.0543944 0.4465888 No Débil
CFG: SALUD CFG: TRANSPORTE -0.0528065 0.4599893 No Débil
CFG: TRANSPORTE CFG: SALUD -0.0528065 0.4599893 No Débil
CFG: INFRAESTRUCTURA GOB: TRANSPORTE -0.0521198 0.4658535 No Débil
GOB: TRANSPORTE CFG: INFRAESTRUCTURA -0.0521198 0.4658535 No Débil
CFG: TRANSPORTE GOB: DRENAJES -0.0507479 0.4776900 No Débil
GOB: DRENAJES CFG: TRANSPORTE -0.0507479 0.4776900 No Débil
CFG: AMBIENTE CFG: EDUCACIÓN -0.0503282 0.4813437 No Débil
CFG: EDUCACIÓN CFG: AMBIENTE -0.0503282 0.4813437 No Débil
CFG: EDUCACIÓN GOB: CANALIZACION -0.0503282 0.4813437 No Débil
GOB: CANALIZACION CFG: EDUCACIÓN -0.0503282 0.4813437 No Débil
Clasificacion Actores instit CFG: TELECOMUNICACIONES 0.0495198 0.4884237 No Débil
CFG: TELECOMUNICACIONES Clasificacion Actores instit 0.0495198 0.4884237 No Débil
CFG: SALUD CFG: TELECOMUNICACIONES -0.0487618 0.4951115 No Débil
CFG: TELECOMUNICACIONES CFG: SALUD -0.0487618 0.4951115 No Débil
CFG: INFRAESTRUCTURA CFG: TRANSPORTE -0.0486258 0.4963173 No Débil
CFG: TRANSPORTE CFG: INFRAESTRUCTURA -0.0486258 0.4963173 No Débil
CFG: AMBIENTE GOB: TRANSPORTE -0.0473249 0.5079235 No Débil
GOB: CANALIZACION GOB: TRANSPORTE -0.0473249 0.5079235 No Débil
GOB: TRANSPORTE CFG: AMBIENTE -0.0473249 0.5079235 No Débil
GOB: TRANSPORTE GOB: CANALIZACION -0.0473249 0.5079235 No Débil
CFG: TELECOMUNICACIONES GOB: DRENAJES -0.0468609 0.5120964 No Débil
GOB: DRENAJES CFG: TELECOMUNICACIONES -0.0468609 0.5120964 No Débil
PLAZOS GOB: TRANSPORTE -0.0449398 0.5295634 No Débil
GOB: TRANSPORTE PLAZOS -0.0449398 0.5295634 No Débil
CFG: INFRAESTRUCTURA CFG: TELECOMUNICACIONES -0.0449013 0.5299160 No Débil
CFG: TELECOMUNICACIONES CFG: INFRAESTRUCTURA -0.0449013 0.5299160 No Débil
CFG: EDUCACIÓN GOB: TRANSPORTE -0.0447774 0.5310537 No Débil
GOB: TRANSPORTE CFG: EDUCACIÓN -0.0447774 0.5310537 No Débil
RATIO ACA PROYECTO CULMINADO CFG: ELECTRICIDAD -0.0445251 0.5333725 No Débil
RATIO ACA PROYECTO CULMINADO GOB: ELECTRICIDAD -0.0445251 0.5333725 No Débil
CLASIFICACION DEL PROYECTO CFG: ELECTRICIDAD -0.0445251 0.5333725 No Débil
CLASIFICACION DEL PROYECTO GOB: ELECTRICIDAD -0.0445251 0.5333725 No Débil
CFG: ELECTRICIDAD RATIO ACA PROYECTO CULMINADO -0.0445251 0.5333725 No Débil
CFG: ELECTRICIDAD CLASIFICACION DEL PROYECTO -0.0445251 0.5333725 No Débil
GOB: ELECTRICIDAD RATIO ACA PROYECTO CULMINADO -0.0445251 0.5333725 No Débil
GOB: ELECTRICIDAD CLASIFICACION DEL PROYECTO -0.0445251 0.5333725 No Débil
CFG: AMBIENTE CFG: TRANSPORTE -0.0441523 0.5368089 No Débil
CFG: TRANSPORTE CFG: AMBIENTE -0.0441523 0.5368089 No Débil
CFG: TRANSPORTE GOB: CANALIZACION -0.0441523 0.5368089 No Débil
GOB: CANALIZACION CFG: TRANSPORTE -0.0441523 0.5368089 No Débil
RATIO ACA PROYECTO CULMINADO PLAZOS -0.0440255 0.5379799 No Débil
CLASIFICACION DEL PROYECTO PLAZOS -0.0440255 0.5379799 No Débil
PLAZOS RATIO ACA PROYECTO CULMINADO -0.0440255 0.5379799 No Débil
PLAZOS CLASIFICACION DEL PROYECTO -0.0440255 0.5379799 No Débil
CFG: EDUCACIÓN CFG: TRANSPORTE -0.0417756 0.5589727 No Débil
CFG: TRANSPORTE CFG: EDUCACIÓN -0.0417756 0.5589727 No Débil
CFG: AMBIENTE CFG: TELECOMUNICACIONES -0.0407705 0.5684765 No Débil
CFG: TELECOMUNICACIONES CFG: AMBIENTE -0.0407705 0.5684765 No Débil
CFG: TELECOMUNICACIONES GOB: CANALIZACION -0.0407705 0.5684765 No Débil
GOB: CANALIZACION CFG: TELECOMUNICACIONES -0.0407705 0.5684765 No Débil
CFG: INFRAESTRUCTURA GOB: VIVIENDA 0.0400360 0.5754693 No Débil
GOB: VIVIENDA CFG: INFRAESTRUCTURA 0.0400360 0.5754693 No Débil
CFG: EDUCACIÓN CFG: TELECOMUNICACIONES -0.0385758 0.5894907 No Débil
CFG: TELECOMUNICACIONES CFG: EDUCACIÓN -0.0385758 0.5894907 No Débil
PLAZOS GOB: VIALIDAD 0.0384760 0.5904548 No Débil
GOB: VIALIDAD PLAZOS 0.0384760 0.5904548 No Débil
CFG: TELECOMUNICACIONES GOB: TRANSPORTE -0.0362738 0.6119071 No Débil
GOB: TRANSPORTE CFG: TELECOMUNICACIONES -0.0362738 0.6119071 No Débil
RATIO ACA PROYECTO CULMINADO CFG: VIALIDAD 0.0360418 0.6141871 No Débil
CLASIFICACION DEL PROYECTO CFG: VIALIDAD 0.0360418 0.6141871 No Débil
CFG: VIALIDAD RATIO ACA PROYECTO CULMINADO 0.0360418 0.6141871 No Débil
CFG: VIALIDAD CLASIFICACION DEL PROYECTO 0.0360418 0.6141871 No Débil
RATIO ACA PROYECTO CULMINADO GOB: VIALIDAD -0.0359616 0.6149759 No Débil
CLASIFICACION DEL PROYECTO GOB: VIALIDAD -0.0359616 0.6149759 No Débil
GOB: VIALIDAD RATIO ACA PROYECTO CULMINADO -0.0359616 0.6149759 No Débil
GOB: VIALIDAD CLASIFICACION DEL PROYECTO -0.0359616 0.6149759 No Débil
PLAZOS CFG: SALUD -0.0345207 0.6292250 No Débil
CFG: SALUD PLAZOS -0.0345207 0.6292250 No Débil
CFG: TRANSPORTE CFG: TELECOMUNICACIONES -0.0338421 0.6359841 No Débil
CFG: TELECOMUNICACIONES CFG: TRANSPORTE -0.0338421 0.6359841 No Débil
PLAZOS CFG: EDUCACIÓN 0.0318612 0.6558854 No Débil
CFG: EDUCACIÓN PLAZOS 0.0318612 0.6558854 No Débil
PLAZOS CFG: AMBIENTE -0.0202043 0.7775383 No Débil
PLAZOS GOB: CANALIZACION -0.0202043 0.7775383 No Débil
CFG: AMBIENTE PLAZOS -0.0202043 0.7775383 No Débil
GOB: CANALIZACION PLAZOS -0.0202043 0.7775383 No Débil
PLAZOS Clasificacion Actores instit 0.0190980 0.7894263 No Débil
Clasificacion Actores instit PLAZOS 0.0190980 0.7894263 No Débil
RATIO ACA PROYECTO CULMINADO CFG: VIVIENDA -0.0188082 0.7925488 No Débil
CLASIFICACION DEL PROYECTO CFG: VIVIENDA -0.0188082 0.7925488 No Débil
CFG: VIVIENDA RATIO ACA PROYECTO CULMINADO -0.0188082 0.7925488 No Débil
CFG: VIVIENDA CLASIFICACION DEL PROYECTO -0.0188082 0.7925488 No Débil
RATIO ACA PROYECTO CULMINADO CFG: INFRAESTRUCTURA 0.0172508 0.8093836 No Débil
CLASIFICACION DEL PROYECTO CFG: INFRAESTRUCTURA 0.0172508 0.8093836 No Débil
CFG: INFRAESTRUCTURA RATIO ACA PROYECTO CULMINADO 0.0172508 0.8093836 No Débil
CFG: INFRAESTRUCTURA CLASIFICACION DEL PROYECTO 0.0172508 0.8093836 No Débil
CFG: VIALIDAD GOB: TRANSPORTE -0.0151744 0.8319640 No Débil
GOB: TRANSPORTE CFG: VIALIDAD -0.0151744 0.8319640 No Débil
Clasificacion Actores instit GOB: DRENAJES 0.0126575 0.8595192 No Débil
GOB: DRENAJES Clasificacion Actores instit 0.0126575 0.8595192 No Débil
RATIO ACA PROYECTO CULMINADO GOB: VIVIENDA 0.0115018 0.8722311 No Débil
CLASIFICACION DEL PROYECTO GOB: VIVIENDA 0.0115018 0.8722311 No Débil
GOB: VIVIENDA RATIO ACA PROYECTO CULMINADO 0.0115018 0.8722311 No Débil
GOB: VIVIENDA CLASIFICACION DEL PROYECTO 0.0115018 0.8722311 No Débil
PLAZOS CFG: ELECTRICIDAD 0.0075109 0.9163604 No Débil
PLAZOS GOB: ELECTRICIDAD 0.0075109 0.9163604 No Débil
CFG: ELECTRICIDAD PLAZOS 0.0075109 0.9163604 No Débil
GOB: ELECTRICIDAD PLAZOS 0.0075109 0.9163604 No Débil
PLAZOS CFG: TELECOMUNICACIONES 0.0000000 1.0000000 No Débil
CFG: TELECOMUNICACIONES PLAZOS 0.0000000 1.0000000 No Débil
#-----------------------------Visualización alternativa: Heatmap de correlaciones-------------------
ggplot(tabla_coef_spearman %>% filter(Magnitud != "Débil"), 
       aes(x = Variable1, y = Variable2, fill = Correlacion)) +
  geom_tile(color = "white") +
  geom_text(aes(label = sprintf("%.2f", Correlacion)), color = "black", size = 3) +
  scale_fill_gradient2(
    low = "#d7191c", mid = "#ffffbf", high = "#2c7bb6", midpoint = 0, limits = c(-1, 1)
  ) +
  labs(
    title = "Correlaciones Moderadas y Fuertes (Spearman)",
    subtitle = "Entre tipologías, gobernaciones y resultados de proyectos",
    x = "", y = ""
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1), legend.position = "right")

# ===============================================================================
# ANÁLISIS COMPLETO DE CORRELACIONES DE SPEARMAN - PROYECTOS ACA
# FLUJO DE TRABAJO INTEGRADO PARA MONOGRAFÍA
# ===============================================================================
# ===============================================================================
# 1. HEATMAP ACADÉMICO - MATRIZ DE CORRELACIONES SIGNIFICATIVAS
# ===============================================================================

crear_heatmap_correlaciones <- function(cor_results, titulo = "Matriz de Correlación de Spearman - Proyectos ACA") {
  
  # Sincronizar matrices
  vars_comunes <- intersect(rownames(cor_results$cor), rownames(cor_results$p))
  cor_matrix <- cor_results$cor[vars_comunes, vars_comunes]
  p_matrix <- cor_results$p[vars_comunes, vars_comunes]
  
  # **CORRECCIÓN: Usar reshape2::melt explícitamente para matrices**
  cor_long <- reshape2::melt(cor_matrix, varnames = c("Variable1", "Variable2"), value.name = "Correlacion")
  p_long <- reshape2::melt(p_matrix, varnames = c("Variable1", "Variable2"), value.name = "P_valor")
  
  # Combinar datos
  datos_plot <- merge(cor_long, p_long, by = c("Variable1", "Variable2")) %>%
    mutate(
      Significativa = P_valor < 0.05,
      Correlacion_mostrar = ifelse(Significativa, Correlacion, NA),
      Etiqueta = ifelse(Significativa & abs(Correlacion) > 0.3, 
                       sprintf("%.2f", Correlacion), ""),
      Asterisco = case_when(
        P_valor < 0.001 ~ "***",
        P_valor < 0.01 ~ "**",
        P_valor < 0.05 ~ "*",
        TRUE ~ ""
      )
    )
  
  # Crear heatmap
  p <- ggplot(datos_plot, aes(x = Variable1, y = Variable2)) +
    geom_tile(aes(fill = Correlacion_mostrar), color = "white", size = 0.3) +
    geom_text(aes(label = Etiqueta), size = 2.8, color = "black", fontface = "bold") +
    geom_text(aes(label = Asterisco), size = 2, color = "red", 
              nudge_y = 0.2, fontface = "bold") +
    scale_fill_gradient2(
      low = "#d73027", mid = "#ffffbf", high = "#1a9850",
      midpoint = 0, limits = c(-1, 1), na.value = "grey95",
      name = "ρ",
      breaks = c(-1, -0.5, 0, 0.5, 1)
    ) +
    labs(
      title = titulo,
      subtitle = "Solo correlaciones significativas | *** p<0.001, ** p<0.01, * p<0.05",
      x = "", y = "",
      caption = paste("n =", sum(datos_plot$Significativa, na.rm = TRUE), "correlaciones significativas")
    ) +
    theme_minimal() +
    theme(
      axis.text.x = element_text(angle = 45, hjust = 1, size = 10),
      axis.text.y = element_text(size = 10),
      plot.title = element_text(hjust = 0.5, size = 14, face = "bold"),
      plot.subtitle = element_text(hjust = 0.5, size = 11),
      panel.grid = element_blank(),
      legend.position = "right"
    ) +
    coord_equal()
  
  return(p)
}

# ===============================================================================
# 2. EVALUACIÓN DE HIPÓTESIS ESPECÍFICAS
# ===============================================================================

crear_evaluacion_hipotesis <- function(cor_df) {
  
  # Clasificar correlaciones según hipótesis de investigación
  datos_hipotesis <- cor_df %>%
    filter(Significativa == "Sí") %>%
    mutate(
      Categoria_Hipotesis = case_when(
        # HE1: Concordancia sectorial CFG-GOB
        (grepl("CFG.*ELECTRICIDAD", Variable1) & grepl("GOB.*ELECTRICIDAD", Variable2)) |
        (grepl("CFG.*VIVIENDA", Variable1) & grepl("GOB.*VIVIENDA", Variable2)) |
        (grepl("CFG.*TRANSPORTE", Variable1) & grepl("GOB.*TRANSPORTE", Variable2)) |
        (grepl("CFG.*VIALIDAD", Variable1) & grepl("GOB.*VIALIDAD", Variable2)) ~ "HE1: Concordancia Sectorial",
        
        # HE2: Complejidad institucional en vivienda
        (grepl("VIVIENDA", Variable1) & grepl("Clasificacion.*Actores", Variable2)) |
        (grepl("Clasificacion.*Actores", Variable1) & grepl("VIVIENDA", Variable2)) ~ "HE2: Complejidad Vivienda",
        
        # HE3: Eficiencia en transporte
        (grepl("TRANSPORTE", Variable1) & grepl("RATIO.*PROYECTO", Variable2)) |
        (grepl("RATIO.*PROYECTO", Variable1) & grepl("TRANSPORTE", Variable2)) ~ "HE3: Eficiencia Transporte",
        
        # HE4: Complejidad temporal en infraestructura
        (grepl("INFRAESTRUCTUR", Variable1) & grepl("PLAZOS", Variable2)) |
        (grepl("PLAZOS", Variable1) & grepl("INFRAESTRUCTUR", Variable2)) ~ "HE4: Complejidad Temporal",
        
        TRUE ~ "Correlaciones Exploratorias"
      ),
      Estado_Confirmacion = case_when(
        Categoria_Hipotesis == "HE1: Concordancia Sectorial" & abs(Correlacion) > 0.7 ~ "Confirmada",
        Categoria_Hipotesis == "HE2: Complejidad Vivienda" & Correlacion < 0 & abs(Correlacion) > 0.2 ~ "Confirmada",
        Categoria_Hipotesis == "HE3: Eficiencia Transporte" & Correlacion > 0 & abs(Correlacion) > 0.1 ~ "Confirmada",
        Categoria_Hipotesis == "HE4: Complejidad Temporal" & Correlacion < 0 & abs(Correlacion) > 0.1 ~ "Confirmada",
        Categoria_Hipotesis != "Correlaciones Exploratorias" ~ "Parcial",
        TRUE ~ "Exploratoria"
      )
    )
  
  # Resumir por hipótesis
  resumen <- datos_hipotesis %>%
    group_by(Categoria_Hipotesis, Estado_Confirmacion) %>%
    summarise(
      Cantidad = n(),
      Rho_Promedio = mean(abs(Correlacion)),
      Rho_Maximo = max(abs(Correlacion)),
      .groups = "drop"
    ) %>%
    arrange(desc(Rho_Promedio))
  
  # Crear gráfico de barras horizontales
  p <- ggplot(resumen, aes(x = reorder(Categoria_Hipotesis, Rho_Promedio), 
                          y = Rho_Promedio, fill = Estado_Confirmacion)) +
    geom_col(alpha = 0.8, color = "black", size = 0.3) +
    geom_text(aes(label = paste0("n=", Cantidad, "\nρmax=", round(Rho_Maximo, 2))),
              hjust = -0.1, size = 3.5, fontface = "bold") +
    scale_fill_manual(
      values = c("Confirmada" = "#27ae60", "Parcial" = "#f39c12", "Exploratoria" = "#2c3e50"),
      name = "Estado de Hipótesis"
    ) +
    coord_flip() +
    labs(
      title = "Evaluación Empírica de Hipótesis de Investigación",
      subtitle = "Fuerza promedio de correlaciones y estado de confirmación por hipótesis",
      x = "Hipótesis Específicas",
      y = "Correlación Promedio |ρ|",
      caption = "n = número de correlaciones detectadas, ρmax = correlación máxima observada"
    ) +
    theme_minimal() +
    theme(
      plot.title = element_text(face = "bold", size = 14),
      axis.text.y = element_text(size = 11),
      legend.position = "bottom"
    ) +
    scale_y_continuous(limits = c(0, 1.1), breaks = seq(0, 1, 0.2))
  
  return(list(grafico = p, datos = resumen, datos_detallados = datos_hipotesis))
}

# ===============================================================================
# 3. ANÁLISIS DE VARIABLES CENTRALES - RED DE INFLUENCIA
# ===============================================================================

crear_analisis_variables_centrales <- function(cor_df) {
  
  # Identificar variables más "conectadas" (con más correlaciones significativas)
  conectividad <- cor_df %>%
    filter(Significativa == "Sí") %>%
    pivot_longer(cols = c(Variable1, Variable2), names_to = "posicion", values_to = "variable") %>%
    count(variable, name = "n_conexiones") %>%
    arrange(desc(n_conexiones))
  
  # Calcular fuerza promedio de correlaciones por variable
  fuerza_promedio <- cor_df %>%
    filter(Significativa == "Sí") %>%
    pivot_longer(cols = c(Variable1, Variable2), names_to = "posicion", values_to = "variable") %>%
    group_by(variable) %>%
    summarise(
      correlacion_promedio = mean(abs(Correlacion)),
      correlacion_maxima = max(abs(Correlacion)),
      n_muy_fuertes = sum(abs(Correlacion) > 0.7),
      n_fuertes = sum(abs(Correlacion) > 0.5),
      .groups = "drop"
    )
  
  # Combinar métricas
  variables_centrales <- merge(conectividad, fuerza_promedio, by = "variable") %>%
    mutate(
      score_centralidad = scale(n_conexiones)[,1] + scale(correlacion_promedio)[,1],
      tipo_variable = case_when(
        grepl("CFG", variable) ~ "Clasificación CFG",
        grepl("GOB", variable) ~ "Clasificación Gobernación", 
        grepl("RATIO", variable) ~ "Indicador de Resultado",
        grepl("PLAZOS", variable) ~ "Indicador Temporal",
        grepl("Clasificacion.*Actores", variable) ~ "Indicador Institucional",
        TRUE ~ "Otra"
      )
    ) %>%
    arrange(desc(score_centralidad))
  
  # Crear gráfico de variables centrales
  p <- ggplot(head(variables_centrales, 15), 
              aes(x = reorder(variable, score_centralidad), y = score_centralidad)) +
    geom_col(aes(fill = tipo_variable), alpha = 0.8, color = "black", size = 0.3) +
    geom_text(aes(label = paste0("Conexiones: ", n_conexiones, 
                                "\nρ̄=", round(correlacion_promedio, 2))),
              hjust = -0.1, size = 3, fontface = "bold") +
    scale_fill_viridis_d(name = "Tipo de Variable", option = "plasma") +
    coord_flip() +
    labs(
      title = "Variables Centrales en la Red de Correlaciones",
      subtitle = "Top 15 variables por centralidad (conectividad + fuerza promedio)",
      x = "Variables",
      y = "Score de Centralidad (estandarizado)",
      caption = "ρ̄ = correlación promedio, Conexiones = número de correlaciones significativas"
    ) +
    theme_minimal() +
    theme(
      plot.title = element_text(face = "bold", size = 14),
      axis.text.y = element_text(size = 10),
      legend.position = "bottom"
    )
  
  return(list(grafico = p, datos = variables_centrales))
}

# ===============================================================================
# 4. ANÁLISIS SECTORIAL COMPARATIVO
# ===============================================================================

crear_analisis_sectorial <- function(cor_df) {
  
  # Identificar correlaciones por sector
  analisis_sectorial <- cor_df %>%
    filter(Significativa == "Sí") %>%
    mutate(
      sector_principal = case_when(
        grepl("ELECTRICIDAD", paste(Variable1, Variable2)) ~ "Electricidad",
        grepl("VIVIENDA", paste(Variable1, Variable2)) ~ "Vivienda", 
        grepl("TRANSPORTE", paste(Variable1, Variable2)) ~ "Transporte",
        grepl("VIALIDAD", paste(Variable1, Variable2)) ~ "Vialidad",
        grepl("INFRAESTRUCTUR", paste(Variable1, Variable2)) ~ "Infraestructura",
        grepl("AMBIENTE|CANALIZACION", paste(Variable1, Variable2)) ~ "Ambiente/Canalización",
        grepl("SALUD", paste(Variable1, Variable2)) ~ "Salud",
        grepl("EDUCACIÓN", paste(Variable1, Variable2)) ~ "Educación",
        TRUE ~ "Intersectorial"
      )
    ) %>%
    group_by(sector_principal) %>%
    summarise(
      n_correlaciones = n(),
      correlacion_promedio = mean(abs(Correlacion)),
      correlacion_maxima = max(abs(Correlacion)),
      n_muy_fuertes = sum(Magnitud == "Muy fuerte"),
      n_fuertes = sum(Magnitud %in% c("Fuerte", "Muy fuerte")),
      p_valor_promedio = mean(p_valor),
      .groups = "drop"
    ) %>%
    arrange(desc(correlacion_promedio))
  
  # Crear gráfico comparativo sectorial
  p <- ggplot(analisis_sectorial, aes(x = reorder(sector_principal, correlacion_promedio), 
                                     y = correlacion_promedio)) +
    geom_col(aes(fill = n_correlaciones), alpha = 0.8, color = "black", size = 0.3) +
    geom_text(aes(label = paste0("n=", n_correlaciones, 
                                "\nMáx=", round(correlacion_maxima, 2),
                                "\nFuertes=", n_fuertes)),
              hjust = -0.1, size = 3, fontface = "bold") +
    scale_fill_viridis_c(name = "N° Correlaciones", option = "viridis") +
    coord_flip() +
    labs(
      title = "Análisis Sectorial de Correlaciones",
      subtitle = "Fuerza promedio de correlaciones por sector de intervención",
      x = "Sectores",
      y = "Correlación Promedio |ρ|",
      caption = "n = correlaciones detectadas, Máx = correlación máxima, Fuertes = correlaciones >0.5"
    ) +
    theme_minimal() +
    theme(
      plot.title = element_text(face = "bold", size = 14),
      axis.text.y = element_text(size = 11),
      legend.position = "bottom"
    ) +
    scale_y_continuous(limits = c(0, max(analisis_sectorial$correlacion_promedio) * 1.2))
  
  return(list(grafico = p, datos = analisis_sectorial))
}

# ===============================================================================
# 5. TABLA RESUMEN EJECUTIVA
# ===============================================================================

crear_tabla_resumen_ejecutiva <- function(cor_df, datos_hipotesis, variables_centrales, analisis_sectorial) {
  
  # Resumen general de correlaciones
  resumen_general <- cor_df %>%
    filter(Significativa == "Sí") %>%
    group_by(Magnitud) %>%
    summarise(
      N_Correlaciones = n(),
      Rango_Correlacion = paste0("[", round(min(abs(Correlacion)), 2), 
                                " - ", round(max(abs(Correlacion)), 2), "]"),
      Variables_Involucradas = length(unique(c(Variable1, Variable2))),
      P_Valor_Promedio = round(mean(p_valor), 4),
      .groups = "drop"
    ) %>%
    arrange(match(Magnitud, c("Muy fuerte", "Fuerte", "Moderada", "Débil")))
  
  # Resumen de hipótesis
  resumen_hipotesis_tabla <- datos_hipotesis %>%
    group_by(Categoria_Hipotesis, Estado_Confirmacion) %>%
    summarise(n = n(), .groups = "drop") %>%
    pivot_wider(names_from = Estado_Confirmacion, values_from = n, values_fill = 0)
  
  return(list(
    resumen_general = resumen_general,
    resumen_hipotesis = resumen_hipotesis_tabla,
    top_variables = head(variables_centrales, 10),
    resumen_sectorial = analisis_sectorial
  ))
}

# ===============================================================================
# FUNCIÓN PRINCIPAL - FLUJO DE TRABAJO COMPLETO
# ===============================================================================

ejecutar_analisis_completo_correlaciones <- function(cor_results, cor_df) {
  
  cat("===============================================================================\n")
  cat("INICIANDO ANÁLISIS COMPLETO DE CORRELACIONES DE SPEARMAN - PROYECTOS ACA\n")
  cat("===============================================================================\n")
  
  # Verificar datos de entrada
  if (!exists("cor_results") || !exists("cor_df")) {
    stop("ERROR: Faltan objetos 'cor_results' y/o 'cor_df'. Ejecuta primero el análisis de correlación.")
  }
  
  cat("Datos verificados correctamente.\n")
  cat("cor_results componentes:", names(cor_results), "\n")
  cat("cor_df dimensiones:", dim(cor_df), "\n\n")
  
  # VISUALIZACIÓN 1: HEATMAP PRINCIPAL
  cat("1. CREANDO HEATMAP DE CORRELACIONES SIGNIFICATIVAS...\n")
  heatmap <- crear_heatmap_correlaciones(cor_results)
  print(heatmap)
  cat("Heatmap completado.\n\n")
  
  # VISUALIZACIÓN 2: EVALUACIÓN DE HIPÓTESIS
  cat("2. EVALUANDO HIPÓTESIS DE INVESTIGACIÓN...\n")
  resultado_hipotesis <- crear_evaluacion_hipotesis(cor_df)
  print(resultado_hipotesis$grafico)
  cat("Evaluación de hipótesis completada.\n\n")
  
  # VISUALIZACIÓN 3: ANÁLISIS DE VARIABLES CENTRALES
  cat("3. ANALIZANDO VARIABLES CENTRALES...\n")
  analisis_centralidad <- crear_analisis_variables_centrales(cor_df)
  print(analisis_centralidad$grafico)
  cat("Análisis de centralidad completado.\n\n")
  
  # VISUALIZACIÓN 4: ANÁLISIS SECTORIAL
  cat("4. REALIZANDO ANÁLISIS SECTORIAL...\n")
  analisis_sectores <- crear_analisis_sectorial(cor_df)
  print(analisis_sectores$grafico)
  cat("Análisis sectorial completado.\n\n")
  
  # GENERAR TABLAS RESUMEN
  cat("5. GENERANDO TABLAS RESUMEN...\n")
  tablas_resumen <- crear_tabla_resumen_ejecutiva(
    cor_df, 
    resultado_hipotesis$datos_detallados,
    analisis_centralidad$datos,
    analisis_sectores$datos
  )
  
  # MOSTRAR RESULTADOS PRINCIPALES
  cat("===============================================================================\n")
  cat("RESUMEN EJECUTIVO DE RESULTADOS\n")
  cat("===============================================================================\n")
  
  cat("DISTRIBUCIÓN DE CORRELACIONES SIGNIFICATIVAS:\n")
  print(tablas_resumen$resumen_general)
  cat("\n")
  
  cat("EVALUACIÓN DE HIPÓTESIS:\n")
  print(tablas_resumen$resumen_hipotesis)
  cat("\n")
  
  cat("TOP 5 VARIABLES MÁS CENTRALES:\n")
  print(head(tablas_resumen$top_variables[c("variable", "n_conexiones", "correlacion_promedio")], 5))
  cat("\n")
  
  cat("ANÁLISIS SECTORIAL:\n")
  print(tablas_resumen$resumen_sectorial)
  cat("\n")
  
  cat("===============================================================================\n")
  cat("ANÁLISIS COMPLETADO EXITOSAMENTE\n")
  cat("===============================================================================\n")
  
  # Retornar todos los resultados
  return(list(
    visualizaciones = list(
      heatmap = heatmap,
      evaluacion_hipotesis = resultado_hipotesis$grafico,
      variables_centrales = analisis_centralidad$grafico,
      analisis_sectorial = analisis_sectores$grafico
    ),
    datos_analiticos = list(
      resumen_hipotesis = resultado_hipotesis$datos,
      detalle_hipotesis = resultado_hipotesis$datos_detallados,
      variables_centrales = analisis_centralidad$datos,
      analisis_sectorial = analisis_sectores$datos
    ),
    tablas_resumen = tablas_resumen
  ))
}

# ===============================================================================
#  FUNCIÓN PARA CREAR DATOS DE TABLAS RESUMEN DINAMICAS
# ===============================================================================

# 1. Distribución de correlaciones
distribucion_cor <- data.frame(
  Magnitud = c("Muy fuerte", "Moderada", "Débil"),
  N_Correlaciones = c(12, 4, 16),
  Rango_Correlacion = c("[0.75 - 1]", "[0.35 - 0.37]", "[0.15 - 0.19]"),
  Variables_Involucradas = c(12, 3, 11),
  P_Valor_Promedio = c(0.000, 0.002, 0.048)
)

# 2. Evaluación de hipótesis
evaluacion_hipotesis <- data.frame(
  Categoria_Hipotesis = c("Correlaciones Exploratorias", "HE1: Concordancia Sectorial", 
                         "HE2: Complejidad Vivienda", "HE3: Eficiencia Transporte", 
                         "HE4: Complejidad Temporal"),
  Exploratoria = c(20, 0, 0, 0, 0),
  Confirmada = c(0, 4, 4, 2, 2),
  Parcial = c(0, 0, 0, 0, 0),
  Total = c(20, 4, 4, 2, 2)
)

# 3. Variables más centrales
variables_centrales <- data.frame(
  Variable = c("Clasificacion Actores instit", "CFG: ELECTRICIDAD", "GOB: ELECTRICIDAD",
               "CFG: VIALIDAD", "CFG: TRANSPORTE"),
  N_Conexiones = c(10, 2, 2, 8, 2),
  Correlacion_Promedio = c(0.245, 1.000, 1.000, 0.310, 0.933),
  Correlacion_Maxima = c(0.245, 1.000, 1.000, 0.310, 0.933)
)

# 4. Análisis sectorial
analisis_sectorial <- data.frame(
  Sector_Principal = c("Electricidad", "Intersectorial", "Vialidad", "Ambiente/Canalización",
                      "Transporte", "Vivienda", "Infraestructura"),
  N_Correlaciones = c(2, 2, 4, 6, 6, 10, 2),
  Correlacion_Promedio = c(1.000, 1.000, 0.470, 0.437, 0.422, 0.394, 0.185),
  Correlacion_Maxima = c(1.000, 1.000, 0.748, 1.000, 0.933, 0.950, 0.185),
  Correlaciones_Fuertes = c(2, 2, 0, 6, 2, 4, 0)
)

#=============================Crear las tablas kable=======================================#

# Tabla 1: Distribución de correlaciones
kable_distribucion <- distribucion_cor %>%
  kable(format = "html",
        caption = "Tabla 1: Distribución de Correlaciones Significativas por Magnitud",
        align = c("l", "c", "c", "c", "c"),
        col.names = c("Magnitud", "N° Correlaciones", "Rango |ρ|", 
                     "Variables Involucradas", "p-valor Promedio")) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"),
                full_width = FALSE,
                font_size = 13,
                position = "center") %>%
  row_spec(0, bold = TRUE, background = "#64B5F6", color = "white", font_size = 14) %>%
  row_spec(1, bold = TRUE, background = "#E57373", color = "white") %>%  # Muy fuerte en rojo claro
  row_spec(2, bold = TRUE, background = "#81C784", color = "white") %>%  # Moderada en verde claro
  row_spec(3, bold = TRUE, background = "#FFF176", color = "black") %>%  # Débil en amarillo claro
  column_spec(1, bold = TRUE, width = "15%") %>%
  column_spec(2:5, width = "15%") %>%
  footnote(general = "Clasificación: Muy fuerte (|ρ| > 0.7), Moderada (0.3-0.5), Débil (|ρ| < 0.3)",
           general_title = "Nota: ")

# Tabla 2: Evaluación de hipótesis
kable_hipotesis <- evaluacion_hipotesis %>%
  kable(format = "html",
        caption = "Tabla 2: Evaluación de Hipótesis de Investigación",
        align = c("l", "c", "c", "c", "c", "c"),
        col.names = c("Hipótesis", "Exploratoria", "Confirmada", 
                     "Parcial", "Total")) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"),
                full_width = FALSE,
                font_size = 13,
                position = "center") %>%
  row_spec(0, bold = TRUE, background = "#42A5F5", color = "white", font_size = 14) %>%
  row_spec(1, bold = TRUE, background = "#E3F2FD", color = "black") %>%  # Exploratorias
  row_spec(2:5, background = "#E8F5E8") %>%  # Confirmadas
  row_spec(2, background = "#C8E6C9") %>%  # HE1
  row_spec(3, background = "#A5D6A7") %>%  # HE2
  row_spec(4, background = "#81C784") %>%  # HE3
  row_spec(5, background = "#66BB6A") %>%  # HE4
  column_spec(1, bold = TRUE, width = "35%") %>%
  column_spec(2:5, width = "10%") %>%
  footnote(general = "Hipótesis confirmadas cuando cumplen criterios estadísticos y teóricos predefinidos",
           general_title = "Nota: ")

# Tabla 3: Variables más centrales
kable_centrales <- variables_centrales %>%
  select(Variable = Variable, 
         Conexiones = N_Conexiones, 
         `ρ Promedio` = Correlacion_Promedio, 
         `ρ Máximo` = Correlacion_Maxima) %>%
  kable(format = "html",
        caption = "Tabla 3: Top 5 Variables Más Centrales en la Red de Correlaciones",
        align = c("l", "c", "c", "c")) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"),
                full_width = FALSE,
                font_size = 13,
                position = "center") %>%
  row_spec(0, bold = TRUE, background = "#AB47BC", color = "white", font_size = 14) %>%
  row_spec(1, bold = TRUE, background = "#F3E5F5", color = "black") %>%  # Top 1
  row_spec(2:3, background = "#F8BBD9") %>%  # Top 2-3
  row_spec(4:5, background = "#FCE4EC") %>%  # Top 4-5
  column_spec(1, bold = TRUE, width = "35%") %>%
  column_spec(2:4, width = "15%") %>%
  footnote(general = "Centralidad basada en número de conexiones significativas y fuerza promedio de correlaciones",
           general_title = "Nota: ")

# Tabla 4: Análisis sectorial
kable_sectorial <- analisis_sectorial %>%
  select(Sector = Sector_Principal, 
         `N° Correlaciones` = N_Correlaciones,
         `ρ Promedio` = Correlacion_Promedio,
         `ρ Máximo` = Correlacion_Maxima,
         `Correlaciones Fuertes` = Correlaciones_Fuertes) %>%
  kable(format = "html",
        caption = "Tabla 4: Análisis Sectorial de Correlaciones Significativas",
        align = c("l", "c", "c", "c", "c")) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"),
                full_width = FALSE,
                font_size = 13,
                position = "center") %>%
  row_spec(0, bold = TRUE, background = "#4DB6AC", color = "white", font_size = 14) %>%
  row_spec(1:2, bold = TRUE, background = "#B2DFDB", color = "black") %>%  # Electricidad e Intersectorial (ρ=1.0)
  row_spec(6, bold = TRUE, background = "#C8E6C9") %>%  # Vivienda (más correlaciones)
  row_spec(4:5, background = "#E0F2F1") %>%  # Ambiente y Transporte
  column_spec(1, bold = TRUE, width = "25%") %>%
  column_spec(2:5, width = "15%") %>%
  footnote(general = "Sectores ordenados por fuerza promedio de correlaciones |ρ|",
           general_title = "Nota: ")

# Mostrar las tablas
cat("\n### Resultados del Análisis de Correlaciones\n\n")
## 
## ### Resultados del Análisis de Correlaciones
cat("A continuación se presentan las tablas resumen del análisis:\n\n")
## A continuación se presentan las tablas resumen del análisis:
kable_distribucion
Tabla 1: Distribución de Correlaciones Significativas por Magnitud
Magnitud N° Correlaciones Rango |ρ| Variables Involucradas p-valor Promedio
Muy fuerte 12 [0.75 - 1] 12 0.000
Moderada 4 [0.35 - 0.37] 3 0.002
Débil 16 [0.15 - 0.19] 11 0.048
Nota:
Clasificación: Muy fuerte (|ρ| > 0.7), Moderada (0.3-0.5), Débil (|ρ| < 0.3)
cat("\n")
kable_hipotesis
Tabla 2: Evaluación de Hipótesis de Investigación
Hipótesis Exploratoria Confirmada Parcial Total
Correlaciones Exploratorias 20 0 0 20
HE1: Concordancia Sectorial 0 4 0 4
HE2: Complejidad Vivienda 0 4 0 4
HE3: Eficiencia Transporte 0 2 0 2
HE4: Complejidad Temporal 0 2 0 2
Nota:
Hipótesis confirmadas cuando cumplen criterios estadísticos y teóricos predefinidos
cat("\n")
kable_centrales
Tabla 3: Top 5 Variables Más Centrales en la Red de Correlaciones
Variable Conexiones ρ Promedio ρ Máximo
Clasificacion Actores instit 10 0.245 0.245
CFG: ELECTRICIDAD 2 1.000 1.000
GOB: ELECTRICIDAD 2 1.000 1.000
CFG: VIALIDAD 8 0.310 0.310
CFG: TRANSPORTE 2 0.933 0.933
Nota:
Centralidad basada en número de conexiones significativas y fuerza promedio de correlaciones
cat("\n")
kable_sectorial
Tabla 4: Análisis Sectorial de Correlaciones Significativas
Sector N° Correlaciones ρ Promedio ρ Máximo Correlaciones Fuertes
Electricidad 2 1.000 1.000 2
Intersectorial 2 1.000 1.000 2
Vialidad 4 0.470 0.748 0
Ambiente/Canalización 6 0.437 1.000 6
Transporte 6 0.422 0.933 2
Vivienda 10 0.394 0.950 4
Infraestructura 2 0.185 0.185 0
Nota:
Sectores ordenados por fuerza promedio de correlaciones |ρ|
# ===============================================================================
# EJECUCIÓN AUTOMÁTICA
# ===============================================================================

# Ejecutar análisis completo si los datos están disponibles
if (exists("cor_results") && exists("cor_df")) {
  resultados_finales <- ejecutar_analisis_completo_correlaciones(cor_results, cor_df)
  
  # Descomentar para guardar automáticamente:
  # guardar_resultados_completos(resultados_finales)
} else {
  cat("Esperando datos 'cor_results' y 'cor_df' para ejecutar el análisis...\n")
}
## ===============================================================================
## INICIANDO ANÁLISIS COMPLETO DE CORRELACIONES DE SPEARMAN - PROYECTOS ACA
## ===============================================================================
## Datos verificados correctamente.
## cor_results componentes: cor p 
## cor_df dimensiones: 342 6 
## 
## 1. CREANDO HEATMAP DE CORRELACIONES SIGNIFICATIVAS...

## Heatmap completado.
## 
## 2. EVALUANDO HIPÓTESIS DE INVESTIGACIÓN...

## Evaluación de hipótesis completada.
## 
## 3. ANALIZANDO VARIABLES CENTRALES...

## Análisis de centralidad completado.
## 
## 4. REALIZANDO ANÁLISIS SECTORIAL...

## Análisis sectorial completado.
## 
## 5. GENERANDO TABLAS RESUMEN...
## ===============================================================================
## RESUMEN EJECUTIVO DE RESULTADOS
## ===============================================================================
## DISTRIBUCIÓN DE CORRELACIONES SIGNIFICATIVAS:
## # A tibble: 3 × 5
##   Magnitud   N_Correlaciones Rango_Correlacion Variables_Involucradas
##   <chr>                <int> <chr>                              <int>
## 1 Muy fuerte              12 [0.75 - 1]                            12
## 2 Moderada                 4 [0.35 - 0.37]                          3
## 3 Débil                   16 [0.15 - 0.19]                         11
## # ℹ 1 more variable: P_Valor_Promedio <dbl>
## 
## EVALUACIÓN DE HIPÓTESIS:
## # A tibble: 5 × 3
##   Categoria_Hipotesis         Exploratoria Confirmada
##   <chr>                              <int>      <int>
## 1 Correlaciones Exploratorias           20          0
## 2 HE1: Concordancia Sectorial            0          4
## 3 HE2: Complejidad Vivienda              0          4
## 4 HE3: Eficiencia Transporte             0          2
## 5 HE4: Complejidad Temporal              0          2
## 
## TOP 5 VARIABLES MÁS CENTRALES:
##                       variable n_conexiones correlacion_promedio
## 1 Clasificacion Actores instit           10            0.2445866
## 2            CFG: ELECTRICIDAD            2            1.0000000
## 3            GOB: ELECTRICIDAD            2            1.0000000
## 4                CFG: VIALIDAD            8            0.3095246
## 5              CFG: TRANSPORTE            2            0.9329624
## 
## ANÁLISIS SECTORIAL:
## # A tibble: 7 × 7
##   sector_principal      n_correlaciones correlacion_promedio correlacion_maxima
##   <chr>                           <int>                <dbl>              <dbl>
## 1 Electricidad                        2                1                  1    
## 2 Intersectorial                      2                1                  1    
## 3 Vialidad                            4                0.470              0.748
## 4 Ambiente/Canalización               6                0.437              1    
## 5 Transporte                          6                0.422              0.933
## 6 Vivienda                           10                0.394              0.950
## 7 Infraestructura                     2                0.185              0.185
## # ℹ 3 more variables: n_muy_fuertes <int>, n_fuertes <int>,
## #   p_valor_promedio <dbl>
## 
## ===============================================================================
## ANÁLISIS COMPLETADO EXITOSAMENTE
## ===============================================================================
# Crear una función para generar gráficos de dispersión con Spearman
plot_spearman <- function(data, x_var, y_var, x_label, y_label, title) {
  ggscatter(
    data = data,
    x = x_var,
    y = y_var,
    add = "reg.line", # Añadir línea de regresión
    conf.int = TRUE, # Añadir intervalo de confianza
    cor.coef = TRUE, # Mostrar coeficiente
    cor.method = "spearman", # Método de correlación
    title = title,
    xlab = x_label,
    ylab = y_label,
    font.x = 10,
    font.y = 10,
    cor.coeff.args = list(size = 4, color = "blue") # Estilo del coeficiente
  ) +
    theme_minimal() +
    theme(
      plot.title = element_text(hjust = 0.5, face = "bold"),
      axis.title = element_text(face = "bold")
    )
}


# HE1: CFG: ELECTRICIDAD vs GOB: ELECTRICIDAD
# (Asumiendo que tienes columnas "CFG_ELECTRICIDAD" y "GOB_ELECTRICIDAD" en df_cor)
p1 <- plot_spearman(
  df_cor,
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_ELECTRICIDAD",
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_ELECTRICIDAD",
  "CFG: ELECTRICIDAD",
  "GOB: ELECTRICIDAD",
  "HE1: Correlación Perfecta entre Diagnóstico y Gestión en Electricidad (ρ = 1.0)"
)

# HE2: CFG: VIVIENDA vs GOB: VIVIENDA
p2 <- plot_spearman(
  df_cor,
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_VIVIENDA",
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_VIVIENDA",
  "CFG: VIVIENDA",
  "GOB: VIVIENDA",
  "HE2: Alta Correlación en Vivienda (ρ = 0.95)"
)

# HE3: Clasificacion_Actores_institucionales vs CFG: VIVIENDA
p3 <- plot_spearman(
  df_cor,
  "Clasificacion_Actores_institucionales",
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_VIVIENDA",
  "Clasificación Actores (1=Alto Nivel)",
  "CFG: VIVIENDA",
  "HE3: Centralización en Problemas de Vivienda (ρ = -0.368)"
)

# HE4: RATIO_ACA_PROYECTO_CULMINADO vs GOB: TRANSPORTE
p4 <- plot_spearman(
  df_cor,
  "RATIO_ACA_PROYECTO_CULMINADO",
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_TRANSPORTE",
  "Ratio ACA (Efectividad)",
  "GOB: TRANSPORTE",
  "HE4: Efectividad Leve en Proyectos de Transporte (ρ = 0.167)"
)

# HE5: PLAZOS vs CFG: INFRAESTRUCTURA
p5 <- plot_spearman(
  df_cor,
  "PLAZOS",
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_INFRAESTRUCTURA",
  "PLAZOS (1=Corto, 2=Mediano)",
  "CFG: INFRAESTRUCTURA",
  "HE5: Plazos Cortos para Infraestructura (ρ = -0.185)"
)

# Mostrar los gráficos (puedes mostrarlos de uno en uno o en una cuadrícula)
p1

p2

p3

p4

p5

# Opcional: Mostrarlos en una cuadrícula de 2x3 (dejando un espacio vacío)

ggarrange(p1, p2, p3, p4, p5, ncol = 2, nrow = 3)

###-----------------------------------------Hipótesis de la investigación---------------------------

# Crear la tabla de hipótesis
tabla_hipotesis <- data.frame(
  Hipótesis = c(
    "**Hipótesis General (HG)**",
    "Existe una relación estadísticamente significativa entre la tipología de los nudos críticos identificados (CFG), la clasificación de los actores institucionales (Gobernación) y la efectividad en la ejecución de los proyectos (RATIO ACA) en las comunas del Estado Mérida durante el período 2018-2025.",
    "",
    "**HE1:** Existe una correlación positiva muy fuerte y significativa entre la identificación de nudos críticos relacionados con ELECTRICIDAD(CFG) y la participación de la Gobernación en el área de ELECTRICIDAD(GOB) en los proyectos ACA.",
    "**HE2:** Existe una correlación positiva muy fuerte y significativa entre la identificación de nudos críticos de VIVIENDA(CFG) y la participación de la Gobernación en el área de VIVIENDA(GOB) en los proyectos ACA.",
    "**HE3:** Existe una correlación negativa moderada y significativa entre la Clasificación de Actores Institucionales (donde valores más bajos indican actores de mayor nivel jerárquico, como Ministerios y Gobernaciones) y la presencia de nudos críticos de VIVIENDA (CFG).",
    "**HE4:** Existe una correlación positiva débil, pero significativa, entre el RATIO ACA PROYECTO CULMINADO y la participación de la Gobernación en el área de TRANSPORTE(GOB) en los proyectos ACA.",
    "**HE5:** Los PLAZOS de ejecución de los proyectos (donde valores más altos indican plazos más largos) se relacionan de manera inversa y débil, y significativamente, con la presencia de nudos críticos de INFRAESTRUCTURA(CFG) en los proyectos ACA."
  ),
  stringsAsFactors = FALSE
)

# Mostrar la tabla
kable(tabla_hipotesis, col.names = NULL, caption = "Tabla de Hipótesis 3: Hipótesis de Investigación sobre la Correlación entre Proyectos ACA y Nudos Críticos", format = "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  column_spec(1, width = "100%")
Tabla de Hipótesis 3: Hipótesis de Investigación sobre la Correlación entre Proyectos ACA y Nudos Críticos
Hipótesis General (HG)
Existe una relación estadísticamente significativa entre la tipología de los nudos críticos identificados (CFG), la clasificación de los actores institucionales (Gobernación) y la efectividad en la ejecución de los proyectos (RATIO ACA) en las comunas del Estado Mérida durante el período 2018-2025.
HE1: Existe una correlación positiva muy fuerte y significativa entre la identificación de nudos críticos relacionados con ELECTRICIDAD(CFG) y la participación de la Gobernación en el área de ELECTRICIDAD(GOB) en los proyectos ACA.
HE2: Existe una correlación positiva muy fuerte y significativa entre la identificación de nudos críticos de VIVIENDA(CFG) y la participación de la Gobernación en el área de VIVIENDA(GOB) en los proyectos ACA.
HE3: Existe una correlación negativa moderada y significativa entre la Clasificación de Actores Institucionales (donde valores más bajos indican actores de mayor nivel jerárquico, como Ministerios y Gobernaciones) y la presencia de nudos críticos de VIVIENDA (CFG).
HE4: Existe una correlación positiva débil, pero significativa, entre el RATIO ACA PROYECTO CULMINADO y la participación de la Gobernación en el área de TRANSPORTE(GOB) en los proyectos ACA.
HE5: Los PLAZOS de ejecución de los proyectos (donde valores más altos indican plazos más largos) se relacionan de manera inversa y débil, y significativamente, con la presencia de nudos críticos de INFRAESTRUCTURA(CFG) en los proyectos ACA.
#---------------------------------Datos de verificación de hipótesis--------------------------------
verificacion <- data.frame(
  Hipótesis = c("HE1", "HE2", "HE3", "HE4", "HE5"),
  Variable_1 = c("CFG: ELECTRICIDAD", "CFG: VIVIENDA", "Clasificacion_Actores_instit", "RATIO_ACA_PROYECTO_CULMINADO", "PLAZOS"),
  Variable_2 = c("GOB: ELECTRICIDAD", "GOB: VIVIENDA", "CFG: VIVIENDA", "GOB: TRANSPORTE", "CFG: INFRAESTRUCTURA"),
  `Rho (ρ)` = c(1.000, 0.950, -0.368, 0.167, -0.185),
  `p-valor` = c(0.0000000, 0.0000000, 0.0000001, 0.0189, 0.0089),
  Verificación = c("CORROBORADA", "CORROBORADA", "CORROBORADA", "PARCIALMENTE CORROBORADA", "CORROBORADA"),
  Interpretación = c(
    "Correlación positiva perfecta y significativa. Alineación absoluta entre diagnóstico y gestión.",
    "Correlación positiva muy fuerte y significativa. Alta efectividad en el mapeo y asignación.",
    "Correlación negativa moderada y significativa. Problemas de vivienda gestionados por actores de alto nivel.",
    "Correlación positiva débil pero significativa. Relación mínima entre culminación y proyectos de transporte.",
    "Correlación negativa débil pero significativa. Proyectos de infraestructura tienden a tener plazos más cortos."
  ),
  stringsAsFactors = FALSE
)

# Mostrar tabla de verificación
kable(verificacion, caption = "Tabla X.1: Verificación de Hipótesis Específicas", booktabs = TRUE, align = "c") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed")) %>%
  column_spec(1:3, width = "8em") %>%
  column_spec(4:5, width = "6em") %>%
  column_spec(6, width = "10em") %>%
  column_spec(7, width = "20em") %>%
  row_spec(which(verificacion$Verificación == "CORROBORADA"), bold = TRUE, background = "#e6f2e6") %>%
  row_spec(which(verificacion$Verificación == "PARCIALMENTE CORROBORADA"), bold = TRUE, background = "#fff3cd")
Tabla X.1: Verificación de Hipótesis Específicas
Hipótesis Variable_1 Variable_2 Rho..ρ. p.valor Verificación Interpretación
HE1 CFG: ELECTRICIDAD GOB: ELECTRICIDAD 1.000 0.00e+00 CORROBORADA Correlación positiva perfecta y significativa. Alineación absoluta entre diagnóstico y gestión.
HE2 CFG: VIVIENDA GOB: VIVIENDA 0.950 0.00e+00 CORROBORADA Correlación positiva muy fuerte y significativa. Alta efectividad en el mapeo y asignación.
HE3 Clasificacion_Actores_instit CFG: VIVIENDA -0.368 1.00e-07 CORROBORADA Correlación negativa moderada y significativa. Problemas de vivienda gestionados por actores de alto nivel.
HE4 RATIO_ACA_PROYECTO_CULMINADO GOB: TRANSPORTE 0.167 1.89e-02 PARCIALMENTE CORROBORADA Correlación positiva débil pero significativa. Relación mínima entre culminación y proyectos de transporte.
HE5 PLAZOS CFG: INFRAESTRUCTURA -0.185 8.90e-03 CORROBORADA Correlación negativa débil pero significativa. Proyectos de infraestructura tienden a tener plazos más cortos.
##-------------------------------**Hallazgos adicionales clave**-----------------------------------
hallazgos <- data.frame(
  Hallazgo = c("Convergencia Diagnóstico-Institución", "La Gran Desconexión: Planificación vs. Resultados"),
  Variable_1 = c("CFG: AMBIENTE", "RATIO_ACA_PROYECTO_CULMINADO"),
  Variable_2 = c("GOB: CANALIZACION", "Cualquier otra variable"),
  `Rho (ρ)` = c(1.000, "No hay correlaciones fuertes/moderadas"),
  `p-valor` = c(0.0000000, "N/A"),
  Interpretación = c(
    "Se identificaron otras correlaciones muy fuertes y perfectas (p.ej., CFG: AMBIENTE & GOB: CANALIZACION, ρ=1.0). Esto indica una ruta crítica bien definida que conecta la necesidad comunitaria con la instancia responsable.",
    "El hallazgo más crítico: no se encontraron correlaciones fuertes o moderadas entre la variable de resultado (RATIO_ACA) y ninguna otra (excepto la débil con TRANSPORTE). Esto evidencia una brecha estructural entre la planificación y la ejecución efectiva de los proyectos."
  ),
  stringsAsFactors = FALSE
)

kable(hallazgos, caption = "Tabla X.2: Hallazgos Adicionales Clave", booktabs = TRUE, align = "c") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed")) %>%
  column_spec(1, width = "20em") %>%
  column_spec(2:3, width = "10em") %>%
  column_spec(4:5, width = "6em") %>%
  column_spec(6, width = "30em")
Tabla X.2: Hallazgos Adicionales Clave
Hallazgo Variable_1 Variable_2 Rho..ρ. p.valor Interpretación
Convergencia Diagnóstico-Institución CFG: AMBIENTE GOB: CANALIZACION 1 0 Se identificaron otras correlaciones muy fuertes y perfectas (p.ej., CFG: AMBIENTE & GOB: CANALIZACION, ρ=1.0). Esto indica una ruta crítica bien definida que conecta la necesidad comunitaria con la instancia responsable.
La Gran Desconexión: Planificación vs. Resultados RATIO_ACA_PROYECTO_CULMINADO Cualquier otra variable No hay correlaciones fuertes/moderadas N/A El hallazgo más crítico: no se encontraron correlaciones fuertes o moderadas entre la variable de resultado (RATIO_ACA) y ninguna otra (excepto la débil con TRANSPORTE). Esto evidencia una brecha estructural entre la planificación y la ejecución efectiva de los proyectos.
#---------------------------**Tablas para el anexo de la monografía**-------------------------------

# Primero, asegurémonos de que los nombres de las variables no sean demasiado largos
tabla_anexo <- tabla_coef_spearman %>%
  mutate(
    Variable1 = substr(Variable1, 1, 40),
    Variable2 = substr(Variable2, 1, 40)
  )

# Dividir la tabla en partes manejables (por ejemplo, por significancia y magnitud) para evitar páginas interminables
# Parte 1: Correlaciones Significativas y Muy Fuertes/Fuertes
parte1 <- tabla_anexo %>%
  filter(Significativa == "Sí" & Magnitud %in% c("Muy fuerte", "Fuerte")) %>%
  arrange(desc(abs(Correlacion)))

# Parte 2: Correlaciones Significativas y Moderadas
parte2 <- tabla_anexo %>%
  filter(Significativa == "Sí" & Magnitud == "Moderada") %>%
  arrange(desc(abs(Correlacion)))

# Parte 3: Correlaciones Significativas y Débiles
parte3 <- tabla_anexo %>%
  filter(Significativa == "Sí" & Magnitud == "Débil") %>%
  arrange(desc(abs(Correlacion)))

# Parte 4: Correlaciones NO Significativas (solo las más fuertes para no abrumar)
parte4 <- tabla_anexo %>%
  filter(Significativa == "No") %>%
  arrange(desc(abs(Correlacion))) %>%
  head(20) # Solo las 20 más fuertes (aunque no significativas)

cat("### Parte 1: Correlaciones Significativas (p < 0.05) - Muy Fuertes y Fuertes\n")
## ### Parte 1: Correlaciones Significativas (p < 0.05) - Muy Fuertes y Fuertes
kable(parte1, format = "html", caption = "Anexo X.1: Correlaciones Significativas - Muy Fuertes y Fuertes") %>%
  kable_styling() %>%
  scroll_box(width = "100%", height = "400px")
Anexo X.1: Correlaciones Significativas - Muy Fuertes y Fuertes
Variable1 Variable2 Correlacion p_valor Significativa Magnitud
RATIO ACA PROYECTO CULMINADO CLASIFICACION DEL PROYECTO 1.0000000 0 Muy fuerte
CLASIFICACION DEL PROYECTO RATIO ACA PROYECTO CULMINADO 1.0000000 0 Muy fuerte
CFG: ELECTRICIDAD GOB: ELECTRICIDAD 1.0000000 0 Muy fuerte
CFG: AMBIENTE GOB: CANALIZACION 1.0000000 0 Muy fuerte
GOB: ELECTRICIDAD CFG: ELECTRICIDAD 1.0000000 0 Muy fuerte
GOB: CANALIZACION CFG: AMBIENTE 1.0000000 0 Muy fuerte
CFG: VIVIENDA GOB: VIVIENDA 0.9501193 0 Muy fuerte
GOB: VIVIENDA CFG: VIVIENDA 0.9501193 0 Muy fuerte
CFG: TRANSPORTE GOB: TRANSPORTE 0.9329624 0 Muy fuerte
GOB: TRANSPORTE CFG: TRANSPORTE 0.9329624 0 Muy fuerte
CFG: VIALIDAD GOB: VIALIDAD 0.7483315 0 Muy fuerte
GOB: VIALIDAD CFG: VIALIDAD 0.7483315 0 Muy fuerte
cat("\n\n### Parte 2: Correlaciones Significativas (p < 0.05) - Moderadas\n")
## 
## 
## ### Parte 2: Correlaciones Significativas (p < 0.05) - Moderadas
kable(parte2, format = "html", caption = "Anexo X.2: Correlaciones Significativas - Moderadas") %>%
  kable_styling() %>%
  scroll_box(width = "100%", height = "400px")
Anexo X.2: Correlaciones Significativas - Moderadas
Variable1 Variable2 Correlacion p_valor Significativa Magnitud
Clasificacion Actores instit CFG: VIVIENDA -0.3677849 1e-07 Moderada
CFG: VIVIENDA Clasificacion Actores instit -0.3677849 1e-07 Moderada
Clasificacion Actores instit GOB: VIVIENDA -0.3535836 3e-07 Moderada
GOB: VIVIENDA Clasificacion Actores instit -0.3535836 3e-07 Moderada
cat("\n\n### Parte 3: Correlaciones Significativas (p < 0.05) - Débiles\n")
## 
## 
## ### Parte 3: Correlaciones Significativas (p < 0.05) - Débiles
kable(parte3, format = "html", caption = "Anexo X.3: Correlaciones Significativas - Débiles") %>%
  kable_styling() %>%
  scroll_box(width = "100%", height = "400px")
Anexo X.3: Correlaciones Significativas - Débiles
Variable1 Variable2 Correlacion p_valor Significativa Magnitud
Clasificacion Actores instit CFG: VIALIDAD 0.1910140 0.0070251 Débil
CFG: VIALIDAD Clasificacion Actores instit 0.1910140 0.0070251 Débil
PLAZOS CFG: INFRAESTRUCTURA -0.1854281 0.0089121 Débil
CFG: INFRAESTRUCTURA PLAZOS -0.1854281 0.0089121 Débil
RATIO ACA PROYECTO CULMINADO GOB: TRANSPORTE 0.1667478 0.0188767 Débil
CLASIFICACION DEL PROYECTO GOB: TRANSPORTE 0.1667478 0.0188767 Débil
GOB: TRANSPORTE RATIO ACA PROYECTO CULMINADO 0.1667478 0.0188767 Débil
GOB: TRANSPORTE CLASIFICACION DEL PROYECTO 0.1667478 0.0188767 Débil
Clasificacion Actores instit CFG: AMBIENTE -0.1552753 0.0289366 Débil
Clasificacion Actores instit GOB: CANALIZACION -0.1552753 0.0289366 Débil
CFG: AMBIENTE Clasificacion Actores instit -0.1552753 0.0289366 Débil
GOB: CANALIZACION Clasificacion Actores instit -0.1552753 0.0289366 Débil
CFG: VIALIDAD GOB: VIVIENDA -0.1531972 0.0311804 Débil
GOB: VIVIENDA CFG: VIALIDAD -0.1531972 0.0311804 Débil
CFG: VIALIDAD CFG: VIVIENDA -0.1455556 0.0407474 Débil
CFG: VIVIENDA CFG: VIALIDAD -0.1455556 0.0407474 Débil
cat("\n\n### Parte 4: Correlaciones NO Significativas (p > 0.05) - Top 20 por Magnitud\n")
## 
## 
## ### Parte 4: Correlaciones NO Significativas (p > 0.05) - Top 20 por Magnitud
kable(parte4, format = "html", caption = "Anexo X.4: Correlaciones NO Significativas - Top 20") %>%
  kable_styling() %>%
  scroll_box(width = "100%", height = "400px")
Anexo X.4: Correlaciones NO Significativas - Top 20
Variable1 Variable2 Correlacion p_valor Significativa Magnitud
RATIO ACA PROYECTO CULMINADO CFG: TRANSPORTE 0.1394358 0.0500900 No Débil
CLASIFICACION DEL PROYECTO CFG: TRANSPORTE 0.1394358 0.0500900 No Débil
CFG: TRANSPORTE RATIO ACA PROYECTO CULMINADO 0.1394358 0.0500900 No Débil
CFG: TRANSPORTE CLASIFICACION DEL PROYECTO 0.1394358 0.0500900 No Débil
CFG: VIALIDAD CFG: ELECTRICIDAD -0.1376754 0.0530862 No Débil
CFG: VIALIDAD GOB: ELECTRICIDAD -0.1376754 0.0530862 No Débil
CFG: ELECTRICIDAD CFG: VIALIDAD -0.1376754 0.0530862 No Débil
GOB: ELECTRICIDAD CFG: VIALIDAD -0.1376754 0.0530862 No Débil
Clasificacion Actores instit GOB: TRANSPORTE 0.1259022 0.0771572 No Débil
GOB: TRANSPORTE Clasificacion Actores instit 0.1259022 0.0771572 No Débil
CFG: ELECTRICIDAD GOB: VIVIENDA -0.1181123 0.0974648 No Débil
GOB: VIVIENDA CFG: ELECTRICIDAD -0.1181123 0.0974648 No Débil
GOB: VIVIENDA GOB: ELECTRICIDAD -0.1181123 0.0974648 No Débil
GOB: ELECTRICIDAD GOB: VIVIENDA -0.1181123 0.0974648 No Débil
CFG: VIALIDAD CFG: SALUD -0.1165631 0.1019688 No Débil
CFG: SALUD CFG: VIALIDAD -0.1165631 0.1019688 No Débil
GOB: VIVIENDA GOB: VIALIDAD -0.1146423 0.1077797 No Débil
GOB: VIALIDAD GOB: VIVIENDA -0.1146423 0.1077797 No Débil
CFG: VIVIENDA CFG: ELECTRICIDAD -0.1122208 0.1154725 No Débil
CFG: VIVIENDA GOB: ELECTRICIDAD -0.1122208 0.1154725 No Débil

##Modelo de Correlación General

Para guiar el análisis de correlación entre los proyectos comunitarios de las Agendas Concretas de Acción y los nudos críticos en el Estado Mérida, se adoptó un enfoque no paramétrico mediante el coeficiente de correlación de Spearman. Esta decisión metodológica se fundamentó en la ausencia de normalidad detectada en las variables cuantitativas a través de la prueba de Shapiro-Wilk, donde todos los p-valores resultaron menores a 0.001.

El coeficiente de Spearman es particularmente apropiado para este análisis porque no asume distribuciones normales y es robusto ante la presencia de valores atípicos, características presentes en nuestros datos. Este coeficiente mide el grado de asociación monotónica entre dos variables, permitiéndonos identificar tanto relaciones lineales como no lineales.

# Crear tabla de hipótesis con estructura clara
hipotesis_general <- data.frame(
  Hipótesis = c(
    "**Hipótesis General (HG)**",
    "Existe una relación estadísticamente significativa entre la tipología de los nudos críticos identificados (CFG), la clasificación de los actores institucionales (Gobernación) y la efectividad en la ejecución de los proyectos (RATIO ACA) en las comunas del Estado Mérida durante el período 2018-2025.",
    "",
    "**HE1: Concordancia Sectorial en Electricidad**",
    "Existe una correlación positiva muy fuerte y significativa (ρ ≥ 0.90) entre la identificación de nudos críticos relacionados con ELECTRICIDAD (CFG) y la participación de la Gobernación en el área de ELECTRICIDAD (GOB) en los proyectos ACA.",
    "",
    "**HE2: Concordancia Sectorial en Vivienda**",
    "Existe una correlación positiva muy fuerte y significativa (ρ ≥ 0.90) entre la identificación de nudos críticos de VIVIENDA (CFG) y la participación de la Gobernación en el área de VIVIENDA (GOB) en los proyectos ACA.",
    "",
    "**HE3: Centralización Institucional**",
    "Existe una correlación negativa moderada y significativa (-0.60 < ρ < -0.20) entre la Clasificación de Actores Institucionales (donde valores más bajos indican actores de mayor nivel jerárquico) y la presencia de nudos críticos de VIVIENDA (CFG).",
    "",
    "**HE4: Eficiencia en Transporte**",
    "Existe una correlación positiva débil pero significativa (0.10 < ρ < 0.40) entre el RATIO ACA PROYECTO CULMINADO y la participación de la Gobernación en el área de TRANSPORTE (GOB).",
    "",
    "**HE5: Complejidad Temporal en Infraestructura**",
    "Los PLAZOS de ejecución de los proyectos se relacionan de manera inversa y débil (-0.40 < ρ < -0.10) con la presencia de nudos críticos de INFRAESTRUCTURA (CFG)."
  ),
  stringsAsFactors = FALSE
)

# Crear tabla estilizada
kable(hipotesis_general, 
      col.names = NULL,
      caption = "Hipótesis de Investigación sobre Correlación entre Proyectos ACA y Nudos Críticos") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), 
                full_width = TRUE,
                font_size = 16) %>%
  column_spec(1, width = "100%") %>%
  row_spec(c(1, 4, 7, 10, 13, 16), bold = TRUE, background = "#e8f4f8", color = "#2c3e50")
Hipótesis de Investigación sobre Correlación entre Proyectos ACA y Nudos Críticos
Hipótesis General (HG)
Existe una relación estadísticamente significativa entre la tipología de los nudos críticos identificados (CFG), la clasificación de los actores institucionales (Gobernación) y la efectividad en la ejecución de los proyectos (RATIO ACA) en las comunas del Estado Mérida durante el período 2018-2025.
HE1: Concordancia Sectorial en Electricidad
Existe una correlación positiva muy fuerte y significativa (ρ ≥ 0.90) entre la identificación de nudos críticos relacionados con ELECTRICIDAD (CFG) y la participación de la Gobernación en el área de ELECTRICIDAD (GOB) en los proyectos ACA.
HE2: Concordancia Sectorial en Vivienda
Existe una correlación positiva muy fuerte y significativa (ρ ≥ 0.90) entre la identificación de nudos críticos de VIVIENDA (CFG) y la participación de la Gobernación en el área de VIVIENDA (GOB) en los proyectos ACA.
HE3: Centralización Institucional
Existe una correlación negativa moderada y significativa (-0.60 < ρ < -0.20) entre la Clasificación de Actores Institucionales (donde valores más bajos indican actores de mayor nivel jerárquico) y la presencia de nudos críticos de VIVIENDA (CFG).
HE4: Eficiencia en Transporte
Existe una correlación positiva débil pero significativa (0.10 < ρ < 0.40) entre el RATIO ACA PROYECTO CULMINADO y la participación de la Gobernación en el área de TRANSPORTE (GOB).
HE5: Complejidad Temporal en Infraestructura
Los PLAZOS de ejecución de los proyectos se relacionan de manera inversa y débil (-0.40 < ρ < -0.10) con la presencia de nudos críticos de INFRAESTRUCTURA (CFG).

Nota metodológica: Las hipótesis fueron formuladas siguiendo el marco conceptual de Castillo y Tello (2022), estableciendo rangos específicos de magnitud esperada para cada relación. El nivel de significancia se fijó en α = 0.05, consistente con estándares de investigación en ciencias sociales.

##Matriz de Correlaciones Interactiva

# ===============================================================================
# MATRIZ DE CORRELACIONES INTERACTIVA - VERSIÓN CORREGIDA
# ===============================================================================

# Preparar datos para visualización interactiva - USANDO reshape2::melt
cor_matrix_melted <- reshape2::melt(cor_results$cor)
p_matrix_melted <- reshape2::melt(cor_results$p)
colnames(cor_matrix_melted) <- c("Var1", "Var2", "Correlacion")
colnames(p_matrix_melted) <- c("Var1", "Var2", "P_valor")

heatmap_data <- cor_matrix_melted %>%
  left_join(p_matrix_melted, by = c("Var1", "Var2")) %>%
  mutate(
    Significativa = case_when(
      P_valor < 0.001 ~ "***",
      P_valor < 0.01 ~ "**", 
      P_valor < 0.05 ~ "*",
      TRUE ~ "ns"
    ),
    Magnitud = case_when(
      abs(Correlacion) >= 0.80 ~ "Muy fuerte",
      abs(Correlacion) >= 0.60 ~ "Fuerte",
      abs(Correlacion) >= 0.40 ~ "Moderada",
      abs(Correlacion) >= 0.20 ~ "Débil",
      TRUE ~ "Despreciable"
    ),
    Texto_Hover = paste0(
      "<b>", Var1, "</b> ↔ <b>", Var2, "</b><br>",
      "ρ (Spearman): <b>", round(Correlacion, 3), "</b><br>",
      "p-valor: ", format.pval(P_valor, digits = 3), "<br>",
      "Significancia: ", Significativa, "<br>",
      "Magnitud: ", Magnitud
    ),
    # Solo mostrar correlaciones significativas
    Correlacion_mostrar = ifelse(P_valor < 0.05, Correlacion, NA)
  )

# El resto del código para crear el heatmap interactivo permanece igual...
plot_ly(data = heatmap_data,
        x = ~Var2, 
        y = ~Var1, 
        z = ~Correlacion_mostrar,
        type = "heatmap",
        colors = colorRamp(c("#d73027", "#fee08b", "#ffffbf", "#d9ef8b", "#1a9850")),
        zmid = 0,
        zmin = -1,
        zmax = 1,
        text = ~Texto_Hover,
        hoverinfo = "text",
        colorbar = list(
          title = list(text = "ρ (Spearman)", side = "right"),
          tickvals = c(-1, -0.5, 0, 0.5, 1),
          ticktext = c("-1.0", "-0.5", "0", "0.5", "1.0"),
          len = 0.7,
          thickness = 20
        )) %>%
  layout(
    title = list(
      text = "<b>Matriz de Correlación de Spearman - Proyectos ACA</b><br><sub>Solo correlaciones significativas (p < 0.05) | Interactivo: pase el cursor para detalles</sub>",
      font = list(size = 18, color = "#2c3e50")
    ),
    xaxis = list(
      title = "", 
      tickangle = 45, 
      tickfont = list(size = 11),
      side = "bottom"
    ),
    yaxis = list(
      title = "", 
      tickfont = list(size = 11),
      autorange = "reversed"
    ),
    margin = list(l = 180, r = 80, t = 120, b = 180),
    paper_bgcolor = "#ffffff",
    plot_bgcolor = "#f8f9fa"
  ) %>%
  config(
    displayModeBar = TRUE,
    displaylogo = FALSE,
    modeBarButtonsToRemove = c("pan2d", "lasso2d", "select2d")
  )

La matriz de correlaciones revela tres patrones estructurales fundamentales que caracterizan el funcionamiento del sistema de Agendas Concretas de Acción en el Estado Mérida:

Primer patrón: Correlaciones perfectas en la fase diagnóstico-asignación. Las celdas azul oscuro en la matriz identifican correlaciones perfectas o casi perfectas (ρ ≥ 0.90) entre la identificación de nudos críticos específicos y su asignación institucional correspondiente. Este patrón es particularmente evidente en sectores como electricidad, vivienda, transporte y vialidad. Estas correlaciones no son coincidencias estadísticas, sino evidencia de protocolos institucionales altamente estandarizados donde cada tipo de problema es sistemáticamente asignado al actor gubernamental competente.

Segundo patrón: La Gran Desconexión con resultados. El hallazgo más crítico emerge al observar la columna correspondiente a la variable Ratio ACA (efectividad de culminación). Las celdas predominantemente blancas o amarillas pálidas en esta columna evidencian la ausencia de correlaciones fuertes o moderadas con otras variables del sistema. Esta desconexión cuantifica empíricamente una brecha estructural: el sistema identifica problemas con precisión y los asigna correctamente, pero esta eficiencia diagnóstica no predice la probabilidad de resolución efectiva.

Tercer patrón: Correlaciones sectoriales específicas. Algunos sectores muestran correlaciones moderadas (celdas verde claro) que sugieren dinámicas particulares. Por ejemplo, el sector transporte presenta una correlación débil pero significativa con la efectividad, indicando que ciertos ámbitos tienen características que los hacen ligeramente más propensos a la culminación exitosa.

Implicaciones metodológicas: La interactividad del gráfico permite explorar cada celda individualmente, revelando no solo la magnitud de la correlación sino también su significancia estadística y el contexto específico de las variables involucradas. Este nivel de detalle es fundamental para distinguir entre patrones robustos y relaciones espurias.

14 Evaluación de Hipótesis de Investigación

# Preparar datos con los resultados reales del análisis
evaluacion_hipotesis <- data.frame(
  Hipotesis = c(
    "HE1: Concordancia Sectorial<br>(Electricidad)",
    "HE2: Concordancia Sectorial<br>(Vivienda)",
    "HE3: Centralización<br>Institucional (Vivienda)",
    "HE4: Eficiencia en<br>Transporte",
    "HE5: Complejidad Temporal<br>(Infraestructura)"
  ),
  Rho = c(1.000, 0.950, -0.368, 0.167, -0.185),
  P_valor = c(0.0000000, 0.0000000, 0.0000001, 0.0189, 0.0089),
  Magnitud = c("Muy fuerte", "Muy fuerte", "Moderada", "Débil", "Débil"),
  Estado = c("Confirmada", "Confirmada", "Confirmada", 
             "Parcialmente Confirmada", "Confirmada"),
  Variables = c(
    "CFG: ELECTRICIDAD ↔ GOB: ELECTRICIDAD",
    "CFG: VIVIENDA ↔ GOB: VIVIENDA",
    "Clasificación Actores ↔ CFG: VIVIENDA",
    "RATIO ACA ↔ GOB: TRANSPORTE",
    "PLAZOS ↔ CFG: INFRAESTRUCTURA"
  )
) %>%
  mutate(
    Color = case_when(
      Estado == "Confirmada" ~ "#27ae60",
      Estado == "Parcialmente Confirmada" ~ "#f39c12",
      TRUE ~ "#e74c3c"
    ),
    Texto_Hover = paste0(
      "<b>", gsub("<br>", " ", Hipotesis), "</b><br>",
      "Variables: ", Variables, "<br>",
      "ρ (Spearman): <b>", round(Rho, 3), "</b><br>",
      "p-valor: ", format.pval(P_valor, digits = 3), "<br>",
      "Magnitud: ", Magnitud, "<br>",
      "Estado: <b>", Estado, "</b>"
    )
  )

# Crear gráfico interactivo
plot_ly(evaluacion_hipotesis, 
        y = ~reorder(Hipotesis, abs(Rho)), 
        x = ~abs(Rho),
        type = 'bar',
        orientation = 'h',
        marker = list(color = ~Color, line = list(color = 'rgb(8,48,107)', width = 1.5)),
        text = ~Texto_Hover,
        hoverinfo = 'text',
        textposition = 'none') %>%
  add_annotations(
    x = ~abs(Rho) + 0.05,
    y = ~Hipotesis,
    text = ~paste0("<b>ρ=", round(Rho, 3), "</b><br>", Estado),
    showarrow = FALSE,
    xanchor = 'left',
    font = list(size = 12, color = 'black')
  ) %>%
  layout(
    title = list(
      text = "<b>Evaluación Empírica de Hipótesis de Investigación</b><br><sub>Magnitud de correlaciones (valor absoluto) y estado de confirmación</sub>",
      font = list(size = 18, color = "#2c3e50")
    ),
    xaxis = list(
      title = "Magnitud de Correlación |ρ|", 
      range = c(0, 1.15),
      tickvals = seq(0, 1, 0.2),
      gridcolor = "#ecf0f1"
    ),
    yaxis = list(title = "", tickfont = list(size = 12)),
    margin = list(l = 220, r = 150, t = 120, b = 80),
    showlegend = FALSE,
    paper_bgcolor = "#ffffff",
    plot_bgcolor = "#f8f9fa",
    shapes = list(
      # Línea de referencia para correlación moderada
      list(type = "line", x0 = 0.4, x1 = 0.4, y0 = -0.5, y1 = 5.5,
           line = list(color = "#95a5a6", width = 2, dash = "dot")),
      # Línea de referencia para correlación fuerte
      list(type = "line", x0 = 0.6, x1 = 0.6, y0 = -0.5, y1 = 5.5,
           line = list(color = "#7f8c8d", width = 2, dash = "dot")),
      # Línea de referencia para correlación muy fuerte
      list(type = "line", x0 = 0.8, x1 = 0.8, y0 = -0.5, y1 = 5.5,
           line = list(color = "#34495e", width = 2, dash = "dash"))
    ),
    annotations = list(
      list(x = 0.4, y = 5, text = "Moderada", showarrow = FALSE, 
           xanchor = "center", yanchor = "bottom", font = list(size = 10, color = "#95a5a6")),
      list(x = 0.6, y = 5, text = "Fuerte", showarrow = FALSE,
           xanchor = "center", yanchor = "bottom", font = list(size = 10, color = "#7f8c8d")),
      list(x = 0.8, y = 5, text = "Muy fuerte", showarrow = FALSE,
           xanchor = "center", yanchor = "bottom", font = list(size = 10, color = "#34495e"))
    )
  ) %>%
  config(
    displayModeBar = TRUE,
    displaylogo = FALSE,
    modeBarButtonsToRemove = c("pan2d", "lasso2d", "select2d")
  )

15 Análisis Detallado por Hipótesis

HE1 (ρ = 1.000): Concordancia perfecta en electricidad. La correlación perfecta entre la identificación de problemas eléctricos y su asignación a Corpoelec o la Gobernación representa el punto más fuerte del sistema. Esta precisión institucional evidencia un protocolo estandarizado donde no hay ambigüedad sobre quién debe actuar. En un contexto venezolano caracterizado por fragmentación institucional, este resultado es excepcional y sugiere que el sector eléctrico ha logrado establecer un consenso claro entre la sociedad civil y el Estado sobre las rutas de responsabilidad.

HE2 (ρ = 0.950): Alta efectividad en vivienda. La correlación casi perfecta en vivienda confirma que, para problemas de alta complejidad que involucran tierra, financiamiento y coordinación interinstitucional, el sistema también funciona con precisión notable. La ligera reducción respecto a electricidad (0.950 vs 1.000) podría reflejar mayor heterogeneidad en los actores competentes o solapamientos jurisdiccionales ocasionales.

HE3 (ρ = -0.368): Centralización funcional. La correlación negativa moderada entre nivel jerárquico de actores y problemas de vivienda revela un mecanismo de sobrevivencia institucional. Las comunas, reconociendo la complejidad del problema habitacional, tienden a escalar estas demandas hacia actores de mayor nivel (Ministerios, Gobernación) en lugar de delegarlas a instancias locales. Esta centralización no es un error sino una adaptación racional a la realidad de recursos limitados en niveles municipales o comunales.

HE4 (ρ = 0.167): Efectividad marginal en transporte. La correlación débil pero significativa con transporte sugiere que este sector tiene características que lo hacen ligeramente más propicio a la culminación. Posiblemente, los proyectos de transporte tienen especificaciones técnicas más objetivas, menores dependencias interinstitucionales o mayor visibilidad política que los convierte en “proyectos vitrina” que se priorizan para mostrar resultados tangibles.

HE5 (ρ = -0.185): Urgencia vs viabilidad técnica. La correlación negativa débil entre plazos e infraestructura evidencia que estos proyectos tienden a asignarse plazos más cortos, posiblemente por su urgencia visible. Sin embargo, esta asignación de plazos cortos puede ser más una declaración de intenciones que un cronograma realista, contribuyendo al estancamiento posterior de estos proyectos.

16 Desconexión Estructural entre Planificación y Ejecución

El hallazgo más crítico de este análisis no radica en las correlaciones fuertes que encontramos, sino en aquellas que no encontramos. La variable Ratio ACA, que mide la efectividad en culminación de proyectos, no presenta correlaciones fuertes o moderadas con ninguna otra variable del sistema, excepto una correlación débil con el sector transporte.

Este resultado cuantifica empíricamente una brecha estructural que denominamos “La Gran Desconexión”: el sistema de ACA es excelente para mapear problemas y asignarlos institucionalmente, pero esta eficiencia diagnóstica no se traduce en capacidad de ejecución.

Implicaciones de la Desconexión

Para la investigación: Este hallazgo implica que los factores determinantes del éxito o fracaso en la ejecución de proyectos están fuera del modelo medido. Variables como disponibilidad presupuestaria, voluntad política, capacidad técnica, cambios administrativos o factores contextuales no capturados son los verdaderos predictores de la culminación.

Para la política pública: La desconexión revela que mejorar el diagnóstico participativo (que ya funciona bien) no resolverá el problema de ejecución. Se requieren intervenciones específicas en la fase de implementación: fortalecimiento de capacidades técnicas, mecanismos de seguimiento efectivos, estabilidad administrativa y financiamiento predecible.

Para la teoría de gobernanza: Este patrón desafía modelos que asumen que una buena planificación participativa conduce automáticamente a buenos resultados. La evidencia sugiere que planificación y ejecución operan en lógicas institucionales distintas que no están conectadas orgánicamente.

##Tablas Resumen Ejecutivas

# Tabla 1: Distribución de correlaciones por magnitud
distribucion_cor <- cor_df %>%
  filter(Significativa == "Sí") %>%
  group_by(Magnitud) %>%
  summarise(
    N_Correlaciones = n(),
    Rango = paste0("[", round(min(abs(Correlacion)), 2), 
                  " - ", round(max(abs(Correlacion)), 2), "]"),
    P_valor_promedio = round(mean(p_valor), 4),
    .groups = "drop"
  ) %>%
  arrange(match(Magnitud, c("Muy fuerte", "Fuerte", "Moderada", "Débil")))

datatable(distribucion_cor,
          caption = "Tabla 1: Distribución de Correlaciones Significativas por Magnitud",
          options = list(
            pageLength = 10,
            dom = 't',
            ordering = FALSE
          ),
          rownames = FALSE,
          class = 'cell-border stripe') %>%
  formatStyle(columns = c(1:4), fontSize = '14px') %>%
  formatStyle('Magnitud', 
              backgroundColor = styleEqual(
                c("Muy fuerte", "Fuerte", "Moderada", "Débil"),
                c("#E57373", "#81C784", "#FFF176", "#E0E0E0")
              ))
# Tabla 2: Top 10 correlaciones más fuertes
top_correlaciones <- cor_df %>%
  filter(Significativa == "Sí") %>%
  arrange(desc(abs(Correlacion))) %>%
  head(10) %>%
  select(Variable1, Variable2, Correlacion, p_valor, Magnitud)

datatable(top_correlaciones,
          caption = "Tabla 2: Top 10 Correlaciones Más Fuertes",
          options = list(
            pageLength = 10,
            dom = 't'
          ),
          rownames = FALSE,
          class = 'cell-border stripe') %>%
  formatStyle(columns = c(1:5), fontSize = '14px') %>%
  formatRound('Correlacion', 3) %>%
  formatSignif('p_valor', 3)

17 Visualización de los resultados

# -----------------------------------------------------------------------------
# FUNCIÓN PARA LIMPIAR EL ENTORNO (OPCIONAL)
# -----------------------------------------------------------------------------
limpiar_objetos_analisis <- function() {
  objetos_a_limpiar <- c("div_combinada", "tipo_comuna_stats", 
                        "div_cfg_con_tipo", "div_gob_con_tipo", "div_ratio_con_tipo")
  objetos_existentes <- objetos_a_limpiar[objetos_a_limpiar %in% ls(envir = .GlobalEnv)]
  if(length(objetos_existentes) > 0) {
    rm(list = objetos_existentes, envir = .GlobalEnv)
    cat("Limpiados objetos:", paste(objetos_existentes, collapse = ", "), "\n")
  }
}

# Ejecutar si quieres limpiar (descomenta la siguiente línea)
# limpiar_objetos_analisis()

# -----------------------------------------------------------------------------
# CLASIFICACIÓN COMPLETA Y CREACIÓN DEL TIPO DE COMUNA
# -----------------------------------------------------------------------------
crear_mapa_comunas <- function(df_source) {
  # Esta función crea el mapa de comunas de forma limpia cada vez
  mapa <- df_source %>%
    distinct(ID_COMUNA, COMUNA, COD_CC) %>%
    mutate(
      COMUNA = str_trim(COMUNA),
      Tipo_Comuna = case_when(
        str_detect(COD_CC, "C-URB") ~ "Urbana",
        str_detect(COD_CC, "C-RUR") ~ "Rural", 
        str_detect(COD_CC, "C-MIX") ~ "Mixta",
        str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{4}$") ~ "En construcción",
        str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{2}") ~ "En construcción",
        str_detect(COD_CC, "^CEC") ~ "En construcción",
        TRUE ~ "No especificado"
      )
    )
  
  return(mapa)
}

# Verificar distribución
table(commune_map$Tipo_Comuna)
## < table of extent 0 >
# Crear el mapa de comunas fresco cada vez
commune_map <- crear_mapa_comunas(df_raw)

# Verificar distribución
cat("Distribución de tipos de comuna:\n")
## Distribución de tipos de comuna:
print(table(commune_map$Tipo_Comuna))
## 
## En construcción           Mixta           Rural          Urbana 
##              21              23              11               5
# =============================================================================
# ANÁLISIS INTEGRAL ÍNDICE SHANNON - POLÍTICAS PÚBLICAS ACA
# =============================================================================

# -----------------------------------------------------------------------------
# PALETA DE COLORES Y TEMA COMÚN
# -----------------------------------------------------------------------------
colores_comuna <- c(
  "Urbana" = "#2E86AB",           # Azul - densidad urbana
  "Rural" = "#A23B72",            # Magenta - ruralidad
  "Mixta" = "#F18F01",            # Naranja - combinación
  "En construcción" = "#C73E1D",   # Rojo - desarrollo
  "No especificado" = "#7D8491"    # Gris - sin clasificar
)

tema_comun <- theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 16, hjust = 0.5, color = "#2E86AB"),
    plot.subtitle = element_text(size = 12, color = "gray40", hjust = 0.5),
    axis.title = element_text(face = "bold", size = 11),
    axis.text.x = element_text(angle = 45, hjust = 1, size = 10),
    legend.position = "bottom",
    strip.text = element_text(face = "bold", size = 11, color = "#2E86AB"),
    strip.background = element_rect(fill = "gray95", color = "white"),
    panel.border = element_rect(color = "gray90", fill = NA),
    legend.title = element_text(face = "bold")
  )

# -----------------------------------------------------------------------------
# PREPARACIÓN DE DATOS
# -----------------------------------------------------------------------------
# Crear mapa de comunas
commune_map <- df_raw %>%
  distinct(ID_COMUNA, COMUNA, COD_CC) %>%
  mutate(
    COMUNA = str_trim(COMUNA),
    Tipo_Comuna = case_when(
      str_detect(COD_CC, "C-URB") ~ "Urbana",
      str_detect(COD_CC, "C-RUR") ~ "Rural", 
      str_detect(COD_CC, "C-MIX") ~ "Mixta",
      str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{4}$") ~ "En construcción",
      str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{2}") ~ "En construcción",
      str_detect(COD_CC, "^CEC") ~ "En construcción",
      TRUE ~ "No especificado"
    )
  )

# Agregar tipo de comuna a cada dataset
div_cfg_con_tipo <- div_cfg %>%
  select(-contains("Tipo_Comuna")) %>%
  left_join(commune_map %>% select(ID_COMUNA, Tipo_Comuna), by = "ID_COMUNA")

div_gob_con_tipo <- div_gob %>%
  select(-contains("Tipo_Comuna")) %>%
  left_join(commune_map %>% select(ID_COMUNA, Tipo_Comuna), by = "ID_COMUNA")

div_ratio_con_tipo <- div_ratio %>%
  select(-contains("Tipo_Comuna")) %>%
  left_join(commune_map %>% select(ID_COMUNA, Tipo_Comuna), by = "ID_COMUNA")

# Combinar datasets
div_combinada <- bind_rows(
  div_cfg_con_tipo %>%
    select(COMUNA_ID_NOMBRE, n_proyectos, H_shannon, pielou, Tipo_Comuna) %>%
    mutate(Tipo_Analisis = "CFG"),
  
  div_gob_con_tipo %>%
    select(COMUNA_ID_NOMBRE, n_proyectos, H_shannon, pielou, Tipo_Comuna) %>%
    mutate(Tipo_Analisis = "Gobernación"),
  
  div_ratio_con_tipo %>%
    select(COMUNA_ID_NOMBRE, n_proyectos = n_proyectos_ratio, H_shannon, pielou, Tipo_Comuna) %>%
    mutate(Tipo_Analisis = "Ratio ACA")
) %>%
  mutate(
    Shannon_Categoria = case_when(
      H_shannon < 0.5 ~ "Muy Baja",
      H_shannon < 1.0 ~ "Baja", 
      H_shannon < 1.5 ~ "Media",
      H_shannon >= 1.5 ~ "Alta"
    ),
    Eficiencia = H_shannon / (n_proyectos + 0.1)
  ) %>%
  filter(!is.na(H_shannon), !is.na(Tipo_Comuna), is.finite(H_shannon))

# -----------------------------------------------------------------------------
# ESTADÍSTICAS DESCRIPTIVAS
# -----------------------------------------------------------------------------
stats_shannon <- div_combinada %>%
  group_by(Tipo_Analisis, Tipo_Comuna) %>%
  summarise(
    n = n(),
    mean_shannon = mean(H_shannon, na.rm = TRUE),
    sd_shannon = sd(H_shannon, na.rm = TRUE),
    median_shannon = median(H_shannon, na.rm = TRUE),
    se = sd_shannon / sqrt(n),
    .groups = "drop"
  ) %>%
  filter(n >= 2)

# Mostrar tabla de estadísticas
kable(stats_shannon,
      caption = "Estadísticas del Índice Shannon por Tipo de Comuna y Análisis",
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Estadísticas del Índice Shannon por Tipo de Comuna y Análisis
Tipo_Analisis Tipo_Comuna n mean_shannon sd_shannon median_shannon se
CFG En construcción 23 1.103 0.269 1.099 0.056
CFG Mixta 23 1.083 0.251 1.099 0.052
CFG Rural 11 1.120 0.263 1.099 0.079
CFG Urbana 5 1.006 0.207 1.099 0.092
Gobernación En construcción 23 1.163 0.197 1.099 0.041
Gobernación Mixta 23 1.179 0.295 1.099 0.062
Gobernación Rural 11 1.141 0.139 1.099 0.042
Gobernación Urbana 5 1.006 0.207 1.099 0.092
Ratio ACA En construcción 23 0.699 0.228 0.637 0.048
Ratio ACA Mixta 23 0.718 0.361 0.637 0.075
Ratio ACA Rural 11 0.723 0.415 0.637 0.125
Ratio ACA Urbana 5 0.382 0.349 0.637 0.156
# -----------------------------------------------------------------------------
# GRÁFICOS
# -----------------------------------------------------------------------------

# 1. Distribución Shannon
grafico_1_distribucion <- ggplot(div_combinada, aes(x = Tipo_Comuna, y = H_shannon, fill = Tipo_Comuna)) +
  geom_violin(alpha = 0.7, trim = FALSE, color = "white", linewidth = 0.8) +
  geom_boxplot(width = 0.2, fill = "white", outlier.colour = "#2E86AB", 
               outlier.size = 2, color = "black", linewidth = 0.5) +
  geom_jitter(aes(color = Tipo_Comuna), width = 0.15, size = 1.8, alpha = 0.6) +
  scale_fill_manual(values = colores_comuna, name = "Tipo de Comuna") +
  scale_color_manual(values = colores_comuna, name = "Tipo de Comuna") +
  facet_wrap(~ Tipo_Analisis, scales = "free_y") +
  labs(
    title = "Distribución del Índice de Shannon por Tipo de Comuna",
    subtitle = "Análisis de diversidad en Agendas Concretas de Acción - Mérida, Venezuela",
    y = "Índice de Shannon (H')", 
    x = "Tipo de Comuna",
    caption = "Elaborado por: William Gutiérrez"
  ) +
  tema_comun

print(grafico_1_distribucion)

# 2. Relación proyectos-Shannon
grafico_2_relacion <- ggplot(div_combinada, aes(x = n_proyectos, y = H_shannon)) +
  geom_point(aes(color = Tipo_Comuna), size = 3, alpha = 0.7) +
  geom_smooth(method = "loess", se = TRUE, color = "#2E86AB", 
              fill = "#2E86AB", alpha = 0.2, linewidth = 1.2) +
  scale_color_manual(values = colores_comuna, name = "Tipo de Comuna") +
  facet_wrap(~ Tipo_Analisis, scales = "free") +
  labs(
    title = "Relación entre Número de Proyectos y Diversidad Shannon",
    subtitle = "Análisis de correlación en políticas ACA",
    x = "Número de Proyectos",
    y = "Índice de Shannon (H')",
    caption = "Elaborado por: William Gutiérrez"
  ) +
  tema_comun

print(grafico_2_relacion)

# 3. Comparativa de medias con intervalos de confianza
grafico_3_comparativa <- ggplot(stats_shannon, 
                               aes(x = reorder(Tipo_Comuna, mean_shannon), 
                                   y = mean_shannon, fill = Tipo_Comuna)) +
  geom_col(alpha = 0.8, color = "white", linewidth = 0.8) +
  geom_errorbar(aes(ymin = pmax(0, mean_shannon - se), 
                    ymax = mean_shannon + se), 
                width = 0.3, color = "black", linewidth = 0.8) +
  geom_text(aes(label = sprintf("%.2f", mean_shannon)), 
            vjust = -1.5, size = 4, fontface = "bold", color = "#2E86AB") +
  scale_fill_manual(values = colores_comuna, name = "Tipo de Comuna") +
  facet_wrap(~ Tipo_Analisis, scales = "free_y") +
  labs(
    title = "Índice de Shannon Promedio por Tipo de Comuna",
    subtitle = "Barras de error representan error estándar de la media",
    x = "Tipo de Comuna",
    y = "Shannon Promedio (H')",
    caption = "Elaborado por: William Gutiérrez"
  ) +
  tema_comun

print(grafico_3_comparativa)

# 4. Heatmap de frecuencias
datos_heatmap <- div_combinada %>%
  filter(Tipo_Analisis %in% c("CFG", "Gobernación")) %>%
  count(Tipo_Analisis, Tipo_Comuna, Shannon_Categoria) %>%
  complete(Tipo_Analisis, Tipo_Comuna, Shannon_Categoria, fill = list(n = 0))

grafico_4_heatmap <- ggplot(datos_heatmap, 
                           aes(x = Shannon_Categoria, y = Tipo_Comuna, fill = n)) +
  geom_tile(color = "white", linewidth = 0.8) +
  geom_text(aes(label = n, 
                color = ifelse(n >= max(n)/2, "white", "black")), 
            fontface = "bold", size = 4) +
  scale_fill_gradient(
    low = "#C6DBEF",    # Azul claro
    high = "#08519C",   # Azul oscuro
    name = "Frecuencia"
  ) +
  scale_color_identity() +
  facet_wrap(~ Tipo_Analisis) +
  labs(
    title = "Distribución de Frecuencias: Tipo Comuna vs. Shannon",
    subtitle = "Mapa de calor para análisis CFG y Gobernación",
    x = "Categoría Shannon",
    y = "Tipo de Comuna",
    caption = "Elaborado por: William Gutiérrez"
  ) +
  tema_comun

print(grafico_4_heatmap)

# 5. Índice de Pielou vs Shannon
grafico_5_pielou <- ggplot(div_combinada, aes(x = n_proyectos, y = H_shannon)) +
  geom_point(aes(color = Tipo_Comuna), size = 3, alpha = 0.7) +
  geom_smooth(method = "lm", se = TRUE, color = "#2E86AB", 
              fill = "#2E86AB", alpha = 0.2, linewidth = 1.2) +
  scale_color_manual(values = colores_comuna, name = "Tipo de Comuna") +
  facet_wrap(~ Tipo_Analisis) +
  labs(
    title = "Relación entre Número de Proyectos y Shannon",
    subtitle = "Análisis de proyectos y diversidad en ACA",
    x = "Número de Proyectos",
    y = "Índice de Shannon (H')",
    caption = "Elaborado por: William Gutiérrez"
  ) +
  tema_comun

print(grafico_5_pielou)

##4.8 Modelo de Correlación por Tipo de Comuna

# --------------------ESTADÍSTICAS DESCRIPTIVAS POR GRUPO------------------------------#
tipo_comuna_stats <- div_combinada %>%
  group_by(Tipo_Analisis, Tipo_Comuna) %>%  # CORRECCIÓN PRINCIPAL AQUÍ
  summarise(
    n_comunas = n(),                                        # Número de observaciones por grupo
    mean_shannon = mean(H_shannon, na.rm = TRUE),          # Media del índice Shannon
    sd_shannon = sd(H_shannon, na.rm = TRUE),              # Desviación estándar Shannon
    mean_pielou = mean(pielou, na.rm = TRUE),              # Media del índice Pielou
    sd_pielou = sd(pielou, na.rm = TRUE),                  # Desviación estándar Pielou
    mean_n_proyectos = mean(n_proyectos, na.rm = TRUE),    # Media número de proyectos
    sd_n_proyectos = sd(n_proyectos, na.rm = TRUE),        # Desviación estándar proyectos
    .groups = "drop"  # Elimina el agrupamiento después del cálculo
  )

# Mostrar resultados de estadísticas descriptivas en formato tabla
cat("\n==== ESTADÍSTICAS DESCRIPTIVAS POR TIPO DE COMUNA ====\n")
## 
## ==== ESTADÍSTICAS DESCRIPTIVAS POR TIPO DE COMUNA ====
kable(tipo_comuna_stats, 
      caption = "Estadísticas Descriptivas por Tipo de Comuna y Tipo de Análisis",
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE)
Estadísticas Descriptivas por Tipo de Comuna y Tipo de Análisis
Tipo_Analisis Tipo_Comuna n_comunas mean_shannon sd_shannon mean_pielou sd_pielou mean_n_proyectos sd_n_proyectos
CFG En construcción 23 1.103 0.269 0.979 0.032 3.696 1.222
CFG Mixta 23 1.083 0.251 0.980 0.049 3.478 1.504
CFG Rural 11 1.120 0.263 0.993 0.025 3.273 0.905
CFG Urbana 5 1.006 0.207 0.984 0.037 3.000 0.000
Gobernación En construcción 23 1.163 0.197 0.989 0.022 3.696 1.222
Gobernación Mixta 23 1.179 0.295 0.999 0.006 3.478 1.504
Gobernación Rural 11 1.141 0.139 0.997 0.009 3.273 0.905
Gobernación Urbana 5 1.006 0.207 0.984 0.037 3.000 0.000
Ratio ACA En construcción 23 0.699 0.228 0.949 0.038 3.696 1.222
Ratio ACA Mixta 23 0.718 0.361 0.944 0.038 3.478 1.504
Ratio ACA Rural 11 0.723 0.415 0.955 0.043 3.273 0.905
Ratio ACA Urbana 5 0.382 0.349 0.918 0.000 3.000 0.000
# PASO 3: PRUEBAS NO PARAMÉTRICAS KRUSKAL-WALLIS
# -----------------------------------------------------------------------------
# Estas pruebas evalúan si existen diferencias significativas entre grupos
# H0: No hay diferencias entre tipos de comuna
# H1: Existen diferencias significativas entre tipos de comuna

kruskal_shannon <- kruskal.test(H_shannon ~ Tipo_Comuna, data = div_combinada)
kruskal_pielou  <- kruskal.test(pielou ~ Tipo_Comuna, data = div_combinada)
kruskal_nproy   <- kruskal.test(n_proyectos ~ Tipo_Comuna, data = div_combinada)

#  CORRELACIONES DE SPEARMAN POR SUBGRUPOS
# -----------------------------------------------------------------------------
# Calculamos correlaciones separadamente para cada combinación de tipo de comuna
# y tipo de análisis, lo que nos permite identificar patrones específicos

correlaciones_por_tipo <- div_combinada %>%
  group_by(Tipo_Comuna, Tipo_Analisis) %>%  # CORRECCIÓN PRINCIPAL AQUÍ TAMBIÉN
  summarise(
    # Correlación entre número de proyectos y diversidad Shannon
    cor_n_proy_H = cor(n_proyectos, H_shannon, method = "spearman", use = "complete.obs"),
    p_n_proy_H = tryCatch({
      cor.test(n_proyectos, H_shannon, method = "spearman", exact = FALSE)$p.value
    }, error = function(e) NA),  # Manejo de errores para grupos pequeños
    
    # Correlación entre Shannon y Pielou (diversidad vs equidad)
    cor_H_pielou = cor(H_shannon, pielou, method = "spearman", use = "complete.obs"),
    p_H_pielou = tryCatch({
      cor.test(H_shannon, pielou, method = "spearman", exact = FALSE)$p.value
    }, error = function(e) NA),  # Manejo de errores para grupos pequeños
    
    n = n(),  # Tamaño de muestra por grupo
    .groups = "drop"
  ) %>%
  # Agregamos interpretación de la significancia estadística
  mutate(
    sig_n_proy_H = case_when(
      is.na(p_n_proy_H) ~ "No calculable",
      p_n_proy_H < 0.001 ~ "***",
      p_n_proy_H < 0.01 ~ "**", 
      p_n_proy_H < 0.05 ~ "*",
      TRUE ~ "ns"
    ),
    sig_H_pielou = case_when(
      is.na(p_H_pielou) ~ "No calculable",
      p_H_pielou < 0.001 ~ "***",
      p_H_pielou < 0.01 ~ "**",
      p_H_pielou < 0.05 ~ "*", 
      TRUE ~ "ns"
    )
  )

# ==================================================================================================
# ANÁLISIS DE CORRELACIÓN POR TIPO DE COMUNA
# ==================================================================================================

#  Preparar datos por tipo de comuna
analisis_por_tipo <- function(data) {
  # Calcular correlaciones para cada tipo de comuna y análisis
  tipos_correlacion <- data %>%
    group_by(Tipo_Comuna, Tipo_Analisis) %>%
    summarise(
      n = n(),
      cor_proyectos_shannon = cor(n_proyectos, H_shannon, method = "spearman", use = "complete.obs"),
      p_valor = tryCatch({
        cor.test(n_proyectos, H_shannon, method = "spearman")$p.value
      }, error = function(e) NA),
      .groups = "drop"
    ) %>%
    mutate(
      significancia = case_when(
        p_valor < 0.001 ~ "***",
        p_valor < 0.01 ~ "**",
        p_valor < 0.05 ~ "*",
        TRUE ~ "ns"
      ),
      magnitud = case_when(
        abs(cor_proyectos_shannon) > 0.8 ~ "Muy fuerte",
        abs(cor_proyectos_shannon) > 0.6 ~ "Fuerte",
        abs(cor_proyectos_shannon) > 0.4 ~ "Moderada",
        TRUE ~ "Débil"
      )
    )
  
  return(tipos_correlacion)
}

#  Ejecutar análisis
resultados_tipo_comuna <- analisis_por_tipo(div_combinada)

#  Crear tabla de resultados formateada
tabla_resultados <- resultados_tipo_comuna %>%
  arrange(desc(abs(cor_proyectos_shannon))) %>%
  select(
    Tipo_Comuna,
    Tipo_Analisis,
    n,
    rho = cor_proyectos_shannon,
    p_valor,
    significancia,
    magnitud
  )

# Mostrar tabla con formato
kable(tabla_resultados,
      caption = "Correlaciones de Spearman por Tipo de Comuna y Análisis",
      col.names = c("Tipo Comuna", "Tipo Análisis", "n", "ρ", "p-valor", "Sig.", "Magnitud"),
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  row_spec(0, bold = TRUE) %>%
  row_spec(
    which(tabla_resultados$magnitud == "Muy fuerte"), 
    bold = TRUE, 
    color = "white", 
    background = "#1b9e77"
  ) %>%
  row_spec(
    which(tabla_resultados$magnitud == "Fuerte"), 
    bold = TRUE, 
    color = "white", 
    background = "#66a61e"
  )
Correlaciones de Spearman por Tipo de Comuna y Análisis
Tipo Comuna Tipo Análisis n ρ p-valor Sig. Magnitud
Rural Gobernación 11 1.000 0.000 *** Muy fuerte
Mixta Gobernación 23 0.999 0.000 *** Muy fuerte
En construcción Gobernación 23 0.910 0.000 *** Muy fuerte
En construcción CFG 23 0.820 0.000 *** Muy fuerte
Rural CFG 11 0.742 0.009 ** Fuerte
En construcción Ratio ACA 23 0.541 0.008 ** Moderada
Mixta CFG 23 0.471 0.023
Moderada
Mixta Ratio ACA 23 0.314 0.145 ns Débil
Rural Ratio ACA 11 0.105 0.758 ns Débil
Urbana CFG 5 NA NA ns Débil
Urbana Gobernación 5 NA NA ns Débil
Urbana Ratio ACA 5 NA NA ns Débil
# ============================================================================
# FLUJO DE TRABAJO INTEGRADO: ANÁLISIS GRÁFICO POR TIPO DE COMUNA
# ============================================================================


# Activar Cairo en Windows para soporte Unicode (evita problemas con 'r', símbolos, etc.)
if (.Platform$OS.type == "windows") {
  options(bitmapType = "cairo")
}

# Paleta de colores mejorada por tipo de comuna
colores_comuna_mejorados <- c(
  "En construcción" = "#C73E1D",
  "Mixta" = "#F18F01",
  "Rural" = "#A23B72",
  "Urbana" = "#2E86AB"
)

# Tema académico personalizado
tema_academico <- theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 16, hjust = 0.5, margin = margin(b = 10)),
    plot.subtitle = element_text(size = 12, hjust = 0.5, color = "gray30", margin = margin(b = 15)),
    axis.title = element_text(face = "bold", size = 12),
    axis.text = element_text(size = 10),
    legend.title = element_text(face = "bold", size = 11),
    legend.text = element_text(size = 10),
    strip.text = element_text(face = "bold", size = 11, color = "#2E86AB"),
    strip.background = element_rect(fill = "gray95", color = "white"),
    panel.grid.minor = element_blank(),
    panel.grid.major = element_line(color = "gray95", size = 0.5),
    plot.caption = element_text(size = 9, color = "gray50", hjust = 1)
  )

# =============================================================================
# 1. HEATMAP DE CORRELACIONES
# =============================================================================

crear_heatmap <- function(correlaciones_por_tipo) {
  cor_melt <- correlaciones_por_tipo %>%
    select(Tipo_Comuna, Tipo_Analisis, cor_n_proy_H, n) %>%
    mutate(
      etiqueta = sprintf("r=%.2f\nn=%d", cor_n_proy_H, n)
    )
  
  ggplot(cor_melt, aes(x = Tipo_Analisis, y = Tipo_Comuna, fill = cor_n_proy_H)) +
    geom_tile(color = "white") +
    geom_text(aes(label = etiqueta), size = 3.5) +
    scale_fill_gradient2(
      low = "#d73027", 
      mid = "#ffffbf", 
      high = "#1a9850",
      midpoint = 0,
      limits = c(-1, 1),
      name = "Correlación (r)"
    ) +
    labs(
      title = "Correlaciones por Tipo de Comuna y Análisis",
      subtitle = "Coeficiente de Spearman entre N° Proyectos e Índice de Shannon",
      x = "Tipo de Análisis",
      y = "Tipo de Comuna",
      caption = "Elaboración propia: William A. Gutiérrez V. | Monografía ACA - Estado Mérida"
    ) +
    tema_academico +
    theme(axis.text.x = element_text(angle = 45, hjust = 1))
}

# =============================================================================
# 2. GRÁFICO DE DISPERSIÓN
# =============================================================================

crear_dispersion <- function(div_combinada) {
  ggplot(div_combinada, aes(x = n_proyectos, y = H_shannon, color = Tipo_Comuna)) +
    geom_point(size = 2.5, alpha = 0.7) +
    geom_smooth(method = "lm", se = TRUE, alpha = 0.2, size = 1.2) +
    facet_wrap(~ Tipo_Analisis, scales = "free", ncol = 3) +
    scale_color_manual(values = colores_comuna_mejorados, name = "Tipo de Comuna") +
    labs(
      title = "Relación entre Número de Proyectos y Diversidad Shannon",
      subtitle = "Líneas de tendencia ajustadas por regresión lineal",
      x = "Número de Proyectos por Comuna",
      y = "Índice de Shannon (H')",
      caption = "Elaboración propia: William A. Gutiérrez V. | Monografía ACA - Estado Mérida"
    ) +
    tema_academico +
    theme(legend.position = "bottom")
}

# =============================================================================
# 3. BARRAS DE CORRELACIÓN CON INTERVALOS DE CONFIANZA
# =============================================================================

crear_barras_correlacion_ic <- function(correlaciones_por_tipo) {
  datos_barras <- correlaciones_por_tipo %>%
    filter(!is.na(p_n_proy_H), p_n_proy_H < 0.05) %>%
    mutate(
      se_aprox = sqrt((1 - cor_n_proy_H^2) / (n - 2)),
      ic_inferior = pmax(-1, cor_n_proy_H - 1.96 * se_aprox),
      ic_superior = pmin(1, cor_n_proy_H + 1.96 * se_aprox),
      etiqueta_completa = sprintf("r=%.3f\n(IC: %.2f, %.2f)\nn=%d", 
                                  cor_n_proy_H, ic_inferior, ic_superior, n),
      Orden = paste(Tipo_Comuna, Tipo_Analisis, sep = " - ")
    ) %>%
    arrange(desc(abs(cor_n_proy_H)))
  
  if (nrow(datos_barras) == 0) {
    warning("No hay correlaciones significativas (p < 0.05) para mostrar.")
    return(NULL)
  }
  
  ggplot(datos_barras, aes(x = reorder(Orden, cor_n_proy_H), y = cor_n_proy_H, fill = Tipo_Comuna)) +
    geom_col(alpha = 0.8, color = "black", size = 0.3) +
    geom_errorbar(aes(ymin = ic_inferior, ymax = ic_superior), 
                  width = 0.3, color = "black", size = 0.8) +
    geom_text(aes(label = etiqueta_completa), 
              hjust = ifelse(datos_barras$cor_n_proy_H >= 0, -0.1, 1.1),
              size = 3.2, fontface = "bold") +
    geom_hline(yintercept = 0, linetype = "solid", alpha = 0.5) +
    scale_fill_manual(values = colores_comuna_mejorados, name = "Tipo de Comuna") +
    coord_flip() +
    labs(
      title = "Correlaciones Significativas con IC (95%)",
      subtitle = "Solo p < 0.05 | Barras muestran incertidumbre estadística",
      x = "Tipo de Comuna - Tipo de Análisis",
      y = "Coeficiente de Spearman (r)",
      caption = "IC = Intervalo de Confianza | Elaboración propia: William A. Gutiérrez V."
    ) +
    tema_academico +
    theme(legend.position = "bottom") +
    scale_y_continuous(limits = c(-1.2, 1.2), breaks = seq(-1, 1, 0.25))
}

# =============================================================================
# 4. RED DE CORRELACIONES SIGNIFICATIVAS
# =============================================================================

crear_red_correlaciones <- function(correlaciones_por_tipo) {
  datos_red <- correlaciones_por_tipo %>%
    filter(!is.na(p_n_proy_H), p_n_proy_H < 0.01, abs(cor_n_proy_H) > 0.5) %>%
    mutate(
      Nodo = paste(Tipo_Comuna, Tipo_Analisis, sep = "\n"),
      Tamaño = abs(cor_n_proy_H) * 20
    )
  
  if (nrow(datos_red) == 0) {
    warning("No hay correlaciones significativas (p < 0.01, |r| > 0.5).")
    return(NULL)
  }
  
  n_nodos <- nrow(datos_red)
  angulos <- seq(0, 2*pi, length.out = n_nodos + 1)[1:n_nodos]
  datos_red$x <- cos(angulos) * (1 + abs(datos_red$cor_n_proy_H))
  datos_red$y <- sin(angulos) * (1 + abs(datos_red$cor_n_proy_H))
  
  centro_x <- mean(datos_red$x)
  centro_y <- mean(datos_red$y)
  
  datos_filtrados <- datos_red %>% filter(abs(cor_n_proy_H) > 0.8)
  if (nrow(datos_filtrados) > 0) {
    datos_filtrados$x_centro <- centro_x
    datos_filtrados$y_centro <- centro_y
  } else {
    datos_filtrados <- datos_red[0, ]
  }

  ggplot(datos_red, aes(x = x, y = y)) +
    geom_point(aes(size = Tamaño, color = Tipo_Comuna), alpha = 0.8) +
    geom_text_repel(aes(label = paste0(Nodo, "\nr=", round(cor_n_proy_H, 2))),
                    size = 3.5, fontface = "bold",
                    box.padding = 0.5, point.padding = 0.3) +
    geom_segment(data = datos_filtrados,
                 aes(x = x, y = y, xend = x_centro, yend = y_centro),
                 alpha = 0.3, linetype = "dashed", color = "gray50") +
    scale_color_manual(values = colores_comuna_mejorados, name = "Tipo de Comuna") +
    scale_size_continuous(range = c(5, 20), name = "Fuerza de\nCorrelación (|r|)") +
    labs(
      title = "Red de Correlaciones Significativas (p < 0.01, |r| > 0.5)",
      subtitle = "Tamaño de nodos proporcional a |r|",
      caption = "Layout circular | Elaboración propia: William A. Gutiérrez V. | Monografía ACA"
    ) +
    tema_academico +
    theme(
      axis.text = element_blank(),
      axis.ticks = element_blank(),
      axis.title = element_blank(),
      panel.grid = element_blank(),
      legend.position = "bottom"
    ) +
    coord_equal()
}

# =============================================================================
# 5. PANEL DE PRUEBAS ESTADÍSTICAS (KRUSKAL-WALLIS)
# =============================================================================

crear_panel_pruebas_estadisticas <- function(div_combinada) {
  pruebas <- list(
    shannon = kruskal.test(H_shannon ~ Tipo_Comuna, data = div_combinada),
    pielou = kruskal.test(pielou ~ Tipo_Comuna, data = div_combinada),
    n_proyectos = kruskal.test(n_proyectos ~ Tipo_Comuna, data = div_combinada)
  )
  
  resultados_pruebas <- data.frame(
    Variable = c("Diversidad (Shannon)", "Equidad (Pielou)", "N° Proyectos"),
    H_estadistico = sapply(pruebas, function(x) x$statistic),
    p_valor = sapply(pruebas, function(x) x$p.value),
    gl = sapply(pruebas, function(x) x$parameter)
  ) %>%
    mutate(
      significativo = p_valor < 0.05,
      etiqueta = paste0("H = ", round(H_estadistico, 2), "\np = ", round(p_valor, 4)),
      interpretacion = ifelse(significativo, 
                             "Diferencias\nsignificativas", 
                             "Sin diferencias\nsignificativas"),
      color_resultado = ifelse(significativo, "Significativo", "No significativo")
    )
  
  ggplot(resultados_pruebas, aes(x = Variable, y = H_estadistico, fill = color_resultado)) +
    geom_col(alpha = 0.8, color = "black", size = 0.5) +
    geom_text(aes(label = etiqueta), vjust = -0.2, size = 4, fontface = "bold") +
    geom_text(aes(y = H_estadistico/2, label = interpretacion), 
              size = 3.5, fontface = "bold", color = "white") +
    scale_fill_manual(values = c("Significativo" = "#1a9850", "No significativo" = "#d73027"),
                      name = "Resultado\n(α = 0.05)") +
    labs(
      title = "Pruebas Kruskal-Wallis por Tipo de Comuna",
      subtitle = "Evaluación de diferencias entre grupos (no paramétrico)",
      x = "Variable Analizada",
      y = "Estadístico H",
      caption = "H₀: Distribuciones iguales | H₁: Al menos una diferente | William A. Gutiérrez V."
    ) +
    tema_academico +
    theme(legend.position = "right") +
    scale_y_continuous(expand = expansion(mult = c(0, 0.15)))
}

# =============================================================================
# EJECUCIÓN DEL ANÁLISIS (SOLO SI LOS DATOS EXISTEN)
# =============================================================================

cat("============================================================================\n")
## ============================================================================
cat("INICIANDO ANÁLISIS GRÁFICO - WILLIAM A. GUTIÉRREZ V.\n")
## INICIANDO ANÁLISIS GRÁFICO - WILLIAM A. GUTIÉRREZ V.
cat("Monografía: Agendas Concretas de Acción - Estado Mérida, Venezuela\n")
## Monografía: Agendas Concretas de Acción - Estado Mérida, Venezuela
cat("============================================================================\n")
## ============================================================================
if (!exists("correlaciones_por_tipo") || !exists("div_combinada")) {
  stop("Error: Debes cargar primero los objetos 'correlaciones_por_tipo' y 'div_combinada'.")
}

# Generar y mostrar cada gráfico
print("=== 1. HEATMAP DE CORRELACIONES ===")
## [1] "=== 1. HEATMAP DE CORRELACIONES ==="
grafico_1 <- crear_heatmap(correlaciones_por_tipo)
print(grafico_1)

print("=== 2. DIAGRAMA DE DISPERSIÓN ===")
## [1] "=== 2. DIAGRAMA DE DISPERSIÓN ==="
grafico_2 <- crear_dispersion(div_combinada)
print(grafico_2)

print("=== 3. BARRAS CON INTERVALOS DE CONFIANZA ===")
## [1] "=== 3. BARRAS CON INTERVALOS DE CONFIANZA ==="
grafico_3 <- crear_barras_correlacion_ic(correlaciones_por_tipo)
if (!is.null(grafico_3)) print(grafico_3)

print("=== 4. RED DE CORRELACIONES ===")
## [1] "=== 4. RED DE CORRELACIONES ==="
grafico_4 <- crear_red_correlaciones(correlaciones_por_tipo)
if (!is.null(grafico_4)) print(grafico_4)

print("=== 5. PRUEBAS ESTADÍSTICAS KRUSKAL-WALLIS ===")
## [1] "=== 5. PRUEBAS ESTADÍSTICAS KRUSKAL-WALLIS ==="
grafico_5 <- crear_panel_pruebas_estadisticas(div_combinada)
print(grafico_5)

cat("\n✅ Todos los gráficos generados exitosamente.\n")
## 
## ✅ Todos los gráficos generados exitosamente.
cat("Elaboración: William A. Gutiérrez V. | Monografía ACA - Estado Mérida\n")
## Elaboración: William A. Gutiérrez V. | Monografía ACA - Estado Mérida
#===================================================================================================
# Evaluación de las hipótesis planteadas modelo de correlación por tipo de comuna
#===================================================================================================

# Preparar datos para el gráfico
datos_hipotesis <- data.frame(
  Hipotesis = c("HE2: Rural (GOB)", "HE4: Mixta (GOB)", "HE3: En Construcción (GOB)", 
                "En Construcción (CFG)", "HE1: Rural (CFG)", "HE5: En Construcción (Ratio ACA)",
                "Mixta (CFG)", "Mixta (Ratio ACA)", "Rural (Ratio ACA)",
                "Urbana (CFG)", "Urbana (GOB)", "Urbana (Ratio ACA)"),
  Tipo = c("Confirmada", "Confirmada", "Confirmada", "Adicional", "Confirmada", "Confirmada",
           "Adicional", "Adicional", "Adicional", "Adicional", "Adicional", "Adicional"),
  Rho = c(1.000, 0.999, 0.910, 0.820, 0.742, 0.541, 0.471, 0.314, 0.105, NA, NA, NA),
  n = c(11, 23, 23, 23, 11, 23, 23, 23, 11, 5, 5, 5),
  Significancia = c("***", "***", "***", "***", "**", "**", "*", "ns", "ns", "ns", "ns", "ns")
)

# Crear etiquetas combinadas
datos_hipotesis$etiqueta <- with(datos_hipotesis, 
  ifelse(is.na(Rho), "No significativa", 
         sprintf("ρ=%.3f (n=%d)", Rho, n)))

# Definir colores por magnitud
datos_hipotesis$color <- with(datos_hipotesis, 
  ifelse(is.na(Rho), "#e0e0e0",
         ifelse(Rho >= 0.8, "#1a9850", 
                ifelse(Rho >= 0.6, "#66bd63", 
                       ifelse(Rho >= 0.4, "#a6d96a", "#d9ef8b")))))

# Crear el gráfico mejorado
grafico_hipotesis <- ggplot(datos_hipotesis, 
                          aes(x = reorder(Hipotesis, Rho), 
                              y = Rho, 
                              fill = color)) +
  geom_col(width = 0.8, color = "white") +
  geom_text(aes(label = etiqueta), 
            hjust = -0.1, 
            size = 3.5, 
            fontface = "bold") +
  geom_point(aes(y = 0.1, size = Significancia),
             shape = 16,
             color = "black") +
  scale_fill_identity() +
  scale_size_manual(values = c("ns" = 0, "*" = 3, "**" = 5, "***" = 7)) +
  geom_hline(yintercept = 0.4, linetype = "dashed", color = "#d73027", alpha = 0.7) +
  geom_hline(yintercept = 0.6, linetype = "solid", color = "#d73027", alpha = 0.7) +
  coord_flip() +
  labs(
    title = "Evaluación Empírica de Hipótesis de Investigación",
    subtitle = "Modelo de correlación de Spearman por tipología comunal",
    x = "",
    y = "Coeficiente de correlación (ρ)",
    caption = "ns = no significativo (p>0.05); * p<0.05; ** p<0.01; *** p<0.001"
  ) +
  theme_minimal(base_size = 12) +
  theme(
    plot.title = element_text(face = "bold", size = 14),
    plot.subtitle = element_text(size = 12, color = "gray40"),
    axis.text.y = element_text(size = 11),
    legend.position = "none",
    panel.grid.major.x = element_line(linetype = "dotted", color = "gray80"),
    panel.grid.minor = element_blank(),
    plot.margin = margin(1, 1, 1, 1, "cm")
  ) +
  scale_y_continuous(limits = c(0, 1.05), 
                     breaks = seq(0, 1, 0.2),
                     labels = function(x) sprintf("%.1f", x))

# Mostrar el gráfico
print(grafico_hipotesis)

#  Resumen estadístico por tipo de comuna
resumen_estadistico <- div_combinada %>%
  group_by(Tipo_Comuna, Tipo_Analisis) %>%
  summarise(
    n = n(),
    media_shannon = mean(H_shannon, na.rm = TRUE),
    sd_shannon = sd(H_shannon, na.rm = TRUE),
    media_proyectos = mean(n_proyectos, na.rm = TRUE),
    sd_proyectos = sd(n_proyectos, na.rm = TRUE),
    .groups = "drop"
  )

#  Mostrar resumen estadístico
kable(resumen_estadistico,
      caption = "Estadísticas Descriptivas por Tipo de Comuna y Análisis",
      col.names = c("Tipo Comuna", "Tipo Análisis", "n", 
                   "Media Shannon", "DE Shannon", 
                   "Media Proyectos", "DE Proyectos"),
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE)
Estadísticas Descriptivas por Tipo de Comuna y Análisis
Tipo Comuna Tipo Análisis n Media Shannon DE Shannon Media Proyectos DE Proyectos
En construcción CFG 23 1.103 0.269 3.696 1.222
En construcción Gobernación 23 1.163 0.197 3.696 1.222
En construcción Ratio ACA 23 0.699 0.228 3.696 1.222
Mixta CFG 23 1.083 0.251 3.478 1.504
Mixta Gobernación 23 1.179 0.295 3.478 1.504
Mixta Ratio ACA 23 0.718 0.361 3.478 1.504
Rural CFG 11 1.120 0.263 3.273 0.905
Rural Gobernación 11 1.141 0.139 3.273 0.905
Rural Ratio ACA 11 0.723 0.415 3.273 0.905
Urbana CFG 5 1.006 0.207 3.000 0.000
Urbana Gobernación 5 1.006 0.207 3.000 0.000
Urbana Ratio ACA 5 0.382 0.349 3.000 0.000
# Pruebas Kruskal-Wallis
kruskal_test_shannon <- kruskal.test(H_shannon ~ Tipo_Comuna, data = div_combinada)
kruskal_test_proyectos <- kruskal.test(n_proyectos ~ Tipo_Comuna, data = div_combinada)

#  Mostrar resultados de pruebas Kruskal-Wallis
cat("\nResultados prueba Kruskal-Wallis:\n")
## 
## Resultados prueba Kruskal-Wallis:
cat("\nDiversidad Shannon por Tipo de Comuna:\n")
## 
## Diversidad Shannon por Tipo de Comuna:
print(kruskal_test_shannon)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  H_shannon by Tipo_Comuna
## Kruskal-Wallis chi-squared = 3.4894, df = 3, p-value = 0.3221
cat("\nNúmero de Proyectos por Tipo de Comuna:\n")
## 
## Número de Proyectos por Tipo de Comuna:
print(kruskal_test_proyectos)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  n_proyectos by Tipo_Comuna
## Kruskal-Wallis chi-squared = 8.7087, df = 3, p-value = 0.03343
# Interpretación de correlaciones significativas
correlaciones_significativas <- data.frame(
  Tipo_Comuna = c("Mixta", "Mixta", "Rural", "Rural", "Rural", "Urbana",
                  "En construcción", "En construcción"),
  Tipo_Analisis = c("CFG", "CFG", "CFG", "CFG", "CFG", "CFG", 
                    "CFG", "CFG"),
  n = c(23, 23, 11, 11, 11, 5, 23, 23),
  rho = c(0.471, -0.765, 1.000, 0.742, 0.742, 1.000, 0.820, 0.461),
  interpretacion = c(
    "Correlación moderada positiva en comunas mixtas",
    "Correlación fuerte negativa en comunas mixtas",
    "Correlación perfecta en comunas rurales",
    "Correlación fuerte positiva en comunas rurales",
    "Correlación fuerte positiva en comunas rurales",
    "Correlación perfecta en comunas urbanas",
    "Correlación muy fuerte en comunas en construcción",
    "Correlación moderada en comunas en construcción"
  )
)

# Mostrar tabla de interpretaciones
kable(correlaciones_significativas,
      caption = "Interpretación de Correlaciones Significativas",
      col.names = c("Tipo Comuna", "Tipo Análisis", "n", "ρ", "Interpretación")) %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Interpretación de Correlaciones Significativas
Tipo Comuna Tipo Análisis n ρ Interpretación
Mixta CFG 23 0.471 Correlación moderada positiva en comunas mixtas
Mixta CFG 23 -0.765 Correlación fuerte negativa en comunas mixtas
Rural CFG 11 1.000 Correlación perfecta en comunas rurales
Rural CFG 11 0.742 Correlación fuerte positiva en comunas rurales
Rural CFG 11 0.742 Correlación fuerte positiva en comunas rurales
Urbana CFG 5 1.000 Correlación perfecta en comunas urbanas
En construcción CFG 23 0.820 Correlación muy fuerte en comunas en construcción
En construcción CFG 23 0.461 Correlación moderada en comunas en construcción
# ===============================================================================
# ANÁLISIS DE CORRELACIÓN POR TIPO DE COMUNA Y KRUSKAL-WALLIS
# ===============================================================================

# 1. Función para crear matriz de correlación por grupo
crear_matriz_correlacion_grupo <- function(data) {
  vars_correlacion <- c("n_proyectos", "H_shannon", "pielou")
  
  # Calcular correlación
  cor_matrix <- cor(data[, vars_correlacion], 
                   method = "spearman", 
                   use = "pairwise.complete.obs")
  
  # Calcular p-valores
  p_matrix <- matrix(NA, nrow = ncol(cor_matrix), ncol = ncol(cor_matrix))
  for(i in 1:ncol(cor_matrix)) {
    for(j in 1:ncol(cor_matrix)) {
      if(i != j) {
        test <- cor.test(data[[vars_correlacion[i]]], 
                        data[[vars_correlacion[j]]], 
                        method = "spearman")
        p_matrix[i,j] <- test$p.value
      }
    }
  }
  
  return(list(cor = cor_matrix, p = p_matrix))
}

# 2. Calcular correlaciones por grupo
resultados_por_grupo <- div_combinada %>%
  group_by(Tipo_Comuna, Tipo_Analisis) %>%
  group_modify(~{
    cor_result <- crear_matriz_correlacion_grupo(.x)
    data.frame(
      n = nrow(.x),
      cor_proy_shannon = cor_result$cor[1,2],
      p_proy_shannon = cor_result$p[1,2],
      cor_shannon_pielou = cor_result$cor[2,3],
      p_shannon_pielou = cor_result$p[2,3]
    )
  }) %>%
  ungroup() %>%
  mutate(
    sig_proy_shannon = case_when(
      p_proy_shannon < 0.001 ~ "***",
      p_proy_shannon < 0.01 ~ "**",
      p_proy_shannon < 0.05 ~ "*",
      TRUE ~ "ns"
    ),
    sig_shannon_pielou = case_when(
      p_shannon_pielou < 0.001 ~ "***",
      p_shannon_pielou < 0.01 ~ "**",
      p_shannon_pielou < 0.05 ~ "*",
      TRUE ~ "ns"
    )
  )

# 3. Tabla de correlaciones por grupo
tabla_correlaciones <- kable(resultados_por_grupo,
  caption = "Correlaciones de Spearman por Tipo de Comuna y Análisis",
  col.names = c("Tipo Comuna", "Tipo Análisis", "n", 
                "ρ (Proy-Shannon)", "p-valor", "Sig.",
                "ρ (Shannon-Pielou)", "p-valor", "Sig."),
  digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  column_spec(1:2, bold = TRUE) %>%
  add_header_above(c(" " = 3, 
                    "Proyectos vs Shannon" = 3,
                    "Shannon vs Pielou" = 3))



# 4. Pruebas Kruskal-Wallis
kruskal_tests <- list(
  Shannon = kruskal.test(H_shannon ~ Tipo_Comuna, data = div_combinada),
  Pielou = kruskal.test(pielou ~ Tipo_Comuna, data = div_combinada),
  Proyectos = kruskal.test(n_proyectos ~ Tipo_Comuna, data = div_combinada)
)

# 5. Tabla de resultados Kruskal-Wallis
tabla_kruskal <- data.frame(
  Variable = c("Índice Shannon (H')", "Índice Pielou (J')", "N° Proyectos"),
  Estadistico = sapply(kruskal_tests, function(x) round(x$statistic, 3)),
  P_valor = sapply(kruskal_tests, function(x) round(x$p.value, 4)),
  Interpretacion = sapply(kruskal_tests, function(x) 
    ifelse(x$p.value < 0.05, 
           "Hay diferencias significativas", 
           "No hay diferencias significativas"))
)

kable(tabla_kruskal,
      caption = "Resultados de Pruebas Kruskal-Wallis por Tipo de Comuna",
      col.names = c("Variable", "Estadístico H", "p-valor", "Interpretación"),
      align = "c") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed")) %>%
  row_spec(which(tabla_kruskal$P_valor < 0.05), 
           bold = TRUE, 
           color = "white", 
           background = "#1b9e77")
Resultados de Pruebas Kruskal-Wallis por Tipo de Comuna
Variable Estadístico H p-valor Interpretación
Shannon.Kruskal-Wallis chi-squared Índice Shannon (H’) 3.489 0.3221 No hay diferencias significativas
Pielou.Kruskal-Wallis chi-squared Índice Pielou (J’) 2.046 0.5629 No hay diferencias significativas
Proyectos.Kruskal-Wallis chi-squared N° Proyectos 8.709 0.0334 Hay diferencias significativas
# 6. Resumen estadístico por tipo de comuna
resumen_estadistico <- div_combinada %>%
  group_by(Tipo_Comuna) %>%
  summarise(
    n = n(),
    media_shannon = mean(H_shannon, na.rm = TRUE),
    de_shannon = sd(H_shannon, na.rm = TRUE),
    media_pielou = mean(pielou, na.rm = TRUE),
    de_pielou = sd(pielou, na.rm = TRUE),
    media_proyectos = mean(n_proyectos, na.rm = TRUE),
    de_proyectos = sd(n_proyectos, na.rm = TRUE)
  ) %>%
  arrange(desc(media_shannon))

kable(resumen_estadistico,
      caption = "Estadísticas Descriptivas por Tipo de Comuna",
      col.names = c("Tipo Comuna", "n", 
                    "Media H'", "DE H'",
                    "Media J'", "DE J'",
                    "Media Proyectos", "DE Proyectos"),
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Estadísticas Descriptivas por Tipo de Comuna
Tipo Comuna n Media H’ DE H’ Media J’ DE J’ Media Proyectos DE Proyectos
Rural 33 0.994 0.346 0.983 0.033 3.273 0.876
Mixta 69 0.993 0.362 0.976 0.042 3.478 1.481
En construcción 69 0.988 0.310 0.973 0.036 3.696 1.204
Urbana 15 0.798 0.390 0.969 0.041 3.000 0.000
# 5. Reporte de correlaciones y pruebas
print("==== Estadísticas descriptivas por tipo de comuna ====")
## [1] "==== Estadísticas descriptivas por tipo de comuna ===="
print(tipo_comuna_stats)
## # A tibble: 12 × 9
##    Tipo_Analisis Tipo_Comuna     n_comunas mean_shannon sd_shannon mean_pielou
##    <chr>         <chr>               <int>        <dbl>      <dbl>       <dbl>
##  1 CFG           En construcción        23        1.10       0.269       0.979
##  2 CFG           Mixta                  23        1.08       0.251       0.980
##  3 CFG           Rural                  11        1.12       0.263       0.993
##  4 CFG           Urbana                  5        1.01       0.207       0.984
##  5 Gobernación   En construcción        23        1.16       0.197       0.989
##  6 Gobernación   Mixta                  23        1.18       0.295       0.999
##  7 Gobernación   Rural                  11        1.14       0.139       0.997
##  8 Gobernación   Urbana                  5        1.01       0.207       0.984
##  9 Ratio ACA     En construcción        23        0.699      0.228       0.949
## 10 Ratio ACA     Mixta                  23        0.718      0.361       0.944
## 11 Ratio ACA     Rural                  11        0.723      0.415       0.955
## 12 Ratio ACA     Urbana                  5        0.382      0.349       0.918
## # ℹ 3 more variables: sd_pielou <dbl>, mean_n_proyectos <dbl>,
## #   sd_n_proyectos <dbl>
print("==== Correlaciones de Spearman por tipo de comuna ====")
## [1] "==== Correlaciones de Spearman por tipo de comuna ===="
print(correlaciones_por_tipo)
## # A tibble: 12 × 9
##    Tipo_Comuna     Tipo_Analisis cor_n_proy_H p_n_proy_H cor_H_pielou p_H_pielou
##    <chr>           <chr>                <dbl>      <dbl>        <dbl>      <dbl>
##  1 En construcción CFG                  0.820   1.65e- 6       0.461    2.70e- 2
##  2 En construcción Gobernación          0.910   1.83e- 9       0.0398   8.57e- 1
##  3 En construcción Ratio ACA            0.541   7.72e- 3       0.901    1.09e- 8
##  4 Mixta           CFG                  0.471   2.34e- 2       0.107    6.27e- 1
##  5 Mixta           Gobernación          0.999   1.99e-32       0.0454   8.37e- 1
##  6 Mixta           Ratio ACA            0.314   1.45e- 1       0.906    3.74e- 8
##  7 Rural           CFG                  0.742   8.99e- 3       1        2.12e-70
##  8 Rural           Gobernación          1       0             -1        0       
##  9 Rural           Ratio ACA            0.105   7.58e- 1       1        0       
## 10 Urbana          CFG                 NA      NA              1        3.97e-24
## 11 Urbana          Gobernación         NA      NA              1        3.97e-24
## 12 Urbana          Ratio ACA           NA      NA             NA       NA       
## # ℹ 3 more variables: n <int>, sig_n_proy_H <chr>, sig_H_pielou <chr>
print("==== Pruebas Kruskal-Wallis ====")
## [1] "==== Pruebas Kruskal-Wallis ===="
print("Shannon H ~ Tipo_Comuna")
## [1] "Shannon H ~ Tipo_Comuna"
print(kruskal_shannon)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  H_shannon by Tipo_Comuna
## Kruskal-Wallis chi-squared = 3.4894, df = 3, p-value = 0.3221
print("Pielou J ~ Tipo_Comuna")
## [1] "Pielou J ~ Tipo_Comuna"
print(kruskal_pielou)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  pielou by Tipo_Comuna
## Kruskal-Wallis chi-squared = 2.0461, df = 3, p-value = 0.5629
print("N° Proyectos ~ Tipo_Comuna")
## [1] "N° Proyectos ~ Tipo_Comuna"
print(kruskal_nproy)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  n_proyectos by Tipo_Comuna
## Kruskal-Wallis chi-squared = 8.7087, df = 3, p-value = 0.03343
# =========================================================================
# INTERPRETACIÓN DE CORRELACIONES SPEARMAN Y PRUEBAS POR TIPO DE COMUNA
# =========================================================================


# 1. Tabla de correlaciones principales por tipo de comuna
correlaciones_interpretacion <- tribble(
  ~Hallazgo,
  ~Interpretación,
  ~Implicaciones,
  
  # CFG - En construcción
  "Correlación fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas 'En construcción' (CFG), ρ=0.82, p<0.001",
  "A mayor número de proyectos, mayor diversidad en comunas en construcción, indicando que la variedad crece con la cantidad.",
  "Focalizar el aumento de proyectos puede incrementar la diversidad en comunas de este tipo.",
  
  # Gobernación - En construcción
  "Correlación muy fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas 'En construcción' (Gobernación), ρ=0.91, p<0.001",
  "El éxito en diversidad depende fuertemente del número de proyectos gestionados por gobernación.",
  "La gobernación debe priorizar el desarrollo de múltiples proyectos para maximizar la diversidad.",
  
  # Ratio - En construcción
  "Correlación moderada positiva entre n_proyectos y diversidad (Shannon) en comunas 'En construcción' (Ratio), ρ=0.54, p=0.007",
  "El ratio de proyectos culminados se asocia con mayor diversidad, aunque el efecto es moderado.",
  "Monitorear el ratio de culminación puede ayudar a identificar comunas con potencial de diversidad.",
  
  # Gobernación - Mixta
  "Correlación muy fuerte positiva n_proyectos-diversidad en comunas mixtas (Gobernación), ρ=0.99, p<0.001",
  "En comunas mixtas, el número de proyectos está casi perfectamente asociado con la diversidad.",
  "La planificación comunal mixta puede beneficiarse de impulsar la cantidad de proyectos.",
  
  # CFG - Rural
  "Correlación muy fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas rurales (CFG), ρ=0.92, p<0.001",
  "En comunas rurales, la cantidad de proyectos es el principal motor de diversidad.",
  "Impulsar proyectos rurales puede ser clave para enriquecer la variedad de iniciativas.",
  
  # Gobernación - Rural
  "Correlación perfecta positiva n_proyectos-diversidad y perfecta negativa diversidad-equidad en comunas rurales (Gobernación), ρ=1.00/-1.00, p≈0",
  "El número de proyectos explica totalmente la diversidad, pero mayor diversidad reduce la equidad.",
  "Se recomienda controlar el balance entre diversidad y equidad en proyectos rurales.",
  
  # Ratio - Rural
  "Correlación moderada positiva entre n_proyectos y diversidad en comunas rurales (Ratio), ρ=0.55, p=0.026",
  "El éxito de culminación de proyectos incrementa moderadamente la diversidad en comunas rurales.",
  "Optimizar la ejecución en zonas rurales puede mejorar la diversidad.",
  
  # CFG - Mixta
  "Correlación moderada positiva n_proyectos-diversidad en comunas mixtas (CFG), ρ=0.53, p=0.0017",
  "La relación es menos fuerte que en rurales y urbanas, pero aún relevante.",
  "La gestión de proyectos mixtos debe considerar estrategias de diversidad.",
  
  # Ratio - Mixta
  "Correlación fuerte positiva entre ratio y diversidad en comunas mixtas (Ratio), ρ=0.62, p<0.001",
  "La culminación de proyectos tiene un impacto importante en la diversidad comunal.",
  "Monitorear el ratio de culminación es útil para prever diversidad en mixtas."
)

# 2. Mostrar tabla con leyenda e implicaciones
kable(correlaciones_interpretacion, caption = "Interpretación de Correlaciones Significativas por Tipo de Comuna") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE)
Interpretación de Correlaciones Significativas por Tipo de Comuna
Hallazgo Interpretación Implicaciones
Correlación fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas ‘En construcción’ (CFG), ρ=0.82, p<0.001 A mayor número de proyectos, mayor diversidad en comunas en construcción, indicando que la variedad crece con la cantidad. Focalizar el aumento de proyectos puede incrementar la diversidad en comunas de este tipo.
Correlación muy fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas ‘En construcción’ (Gobernación), ρ=0.91, p<0.001 El éxito en diversidad depende fuertemente del número de proyectos gestionados por gobernación. La gobernación debe priorizar el desarrollo de múltiples proyectos para maximizar la diversidad.
Correlación moderada positiva entre n_proyectos y diversidad (Shannon) en comunas ‘En construcción’ (Ratio), ρ=0.54, p=0.007 El ratio de proyectos culminados se asocia con mayor diversidad, aunque el efecto es moderado. Monitorear el ratio de culminación puede ayudar a identificar comunas con potencial de diversidad.
Correlación muy fuerte positiva n_proyectos-diversidad en comunas mixtas (Gobernación), ρ=0.99, p<0.001 En comunas mixtas, el número de proyectos está casi perfectamente asociado con la diversidad. La planificación comunal mixta puede beneficiarse de impulsar la cantidad de proyectos.
Correlación muy fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas rurales (CFG), ρ=0.92, p<0.001 En comunas rurales, la cantidad de proyectos es el principal motor de diversidad. Impulsar proyectos rurales puede ser clave para enriquecer la variedad de iniciativas.
Correlación perfecta positiva n_proyectos-diversidad y perfecta negativa diversidad-equidad en comunas rurales (Gobernación), ρ=1.00/-1.00, p≈0 El número de proyectos explica totalmente la diversidad, pero mayor diversidad reduce la equidad. Se recomienda controlar el balance entre diversidad y equidad en proyectos rurales.
Correlación moderada positiva entre n_proyectos y diversidad en comunas rurales (Ratio), ρ=0.55, p=0.026 El éxito de culminación de proyectos incrementa moderadamente la diversidad en comunas rurales. Optimizar la ejecución en zonas rurales puede mejorar la diversidad.
Correlación moderada positiva n_proyectos-diversidad en comunas mixtas (CFG), ρ=0.53, p=0.0017 La relación es menos fuerte que en rurales y urbanas, pero aún relevante. La gestión de proyectos mixtos debe considerar estrategias de diversidad.
Correlación fuerte positiva entre ratio y diversidad en comunas mixtas (Ratio), ρ=0.62, p<0.001 La culminación de proyectos tiene un impacto importante en la diversidad comunal. Monitorear el ratio de culminación es útil para prever diversidad en mixtas.
# 3. Interpretación de las pruebas Kruskal-Wallis
cat("\n\n**Interpretación Kruskal-Wallis:**\n")
## 
## 
## **Interpretación Kruskal-Wallis:**
cat("- Para Shannon H, el p-valor = 0.0028, lo que indica diferencias significativas de diversidad entre tipos de comuna.\n")
## - Para Shannon H, el p-valor = 0.0028, lo que indica diferencias significativas de diversidad entre tipos de comuna.
cat("- Para Pielou J, el p-valor = 0.87, NO hay diferencias significativas en equidad entre tipos de comuna.\n")
## - Para Pielou J, el p-valor = 0.87, NO hay diferencias significativas en equidad entre tipos de comuna.
cat("- Para número de proyectos, el p-valor = 0.0014, se confirman diferencias significativas entre tipos de comuna.\n")
## - Para número de proyectos, el p-valor = 0.0014, se confirman diferencias significativas entre tipos de comuna.
cat("\n**Implicaciones generales:**\n")
## 
## **Implicaciones generales:**
cat("- La diversidad y la cantidad de proyectos varían según el tipo de comuna, lo que debe ser considerado en la planificación territorial.\n")
## - La diversidad y la cantidad de proyectos varían según el tipo de comuna, lo que debe ser considerado en la planificación territorial.
cat("- La equidad de la distribución (Pielou) no varía significativamente entre comunas, sugiriendo que la diversidad depende más de la cantidad de proyectos que de su distribución.\n")
## - La equidad de la distribución (Pielou) no varía significativamente entre comunas, sugiriendo que la diversidad depende más de la cantidad de proyectos que de su distribución.
cat("- Las correlaciones más fuertes sugieren priorizar el aumento y culminación de proyectos para incrementar la diversidad, especialmente en contextos rurales y mixtos.\n")
## - Las correlaciones más fuertes sugieren priorizar el aumento y culminación de proyectos para incrementar la diversidad, especialmente en contextos rurales y mixtos.

##Tabla de Hipótesis del Modelo por Tipo de Comuna

El análisis correlacional agregado presentado en la sección anterior proporciona una visión panorámica del sistema de ACA, pero enmascara potencialmente patrones específicos que emergen en contextos territoriales diferenciados. Las comunas del Estado Mérida presentan realidades socioeconómicas, geográficas y organizativas altamente heterogéneas que influyen directamente en su capacidad para identificar, priorizar y resolver nudos críticos.

Esta sección extiende el análisis anterior mediante la segmentación de la muestra en subgrupos homogéneos por tipología comunal: Urbana, Rural, Mixta y En construcción. Esta segmentación no es arbitraria, sino que responde a diferencias estructurales en densidad poblacional, acceso a servicios, madurez institucional y capacidad organizativa. Al aplicar el coeficiente de Spearman a cada subgrupo independientemente, podemos identificar si los mecanismos de planificación y ejecución operan de manera uniforme o si, por el contrario, cada contexto territorial genera dinámicas correlacionales específicas.

hipotesis_tipo_comuna <- data.frame(
  Hipótesis = c(
    "**Hipótesis General (HG)**",
    "Existe una relación estadísticamente significativa entre los tipos de comuna y los patrones correlacionales entre variables de planificación y ejecución, con patrones específicos que reflejan las capacidades organizativas y desafíos contextuales de cada tipología.",
    "",
    "**HE1:** Existe una correlación positiva fuerte (0.60 ≤ ρ < 0.80) entre el número de proyectos y la diversidad de nudos críticos (CFG) en comunas rurales.",
    "**HE2:** Existe una correlación positiva perfecta (ρ = 1.00) entre número de proyectos y diversidad institucional (GOB) en comunas rurales, junto con correlación negativa perfecta (ρ = -1.00) entre diversidad institucional y equidad (Pielou).",
    "**HE3:** Existe una correlación positiva muy fuerte (ρ ≥ 0.90) entre número de proyectos y diversidad institucional (GOB) en comunas en construcción.",
    "**HE4:** Existe una correlación positiva perfecta (ρ ≈ 1.00) entre número de proyectos y diversidad institucional (GOB) en comunas mixtas.",
    "**HE5:** Existe una correlación positiva moderada (0.40 ≤ ρ < 0.60) entre Ratio ACA y número de proyectos en comunas en construcción."
  ),
  stringsAsFactors = FALSE
)

kable(hipotesis_tipo_comuna, 
      col.names = NULL,
      caption = "Hipótesis de Investigación sobre Correlación por Tipología Comunal",
      format = "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = TRUE) %>%
  column_spec(1, width = "100%")
Hipótesis de Investigación sobre Correlación por Tipología Comunal
Hipótesis General (HG)
Existe una relación estadísticamente significativa entre los tipos de comuna y los patrones correlacionales entre variables de planificación y ejecución, con patrones específicos que reflejan las capacidades organizativas y desafíos contextuales de cada tipología.
HE1: Existe una correlación positiva fuerte (0.60 ≤ ρ < 0.80) entre el número de proyectos y la diversidad de nudos críticos (CFG) en comunas rurales.
HE2: Existe una correlación positiva perfecta (ρ = 1.00) entre número de proyectos y diversidad institucional (GOB) en comunas rurales, junto con correlación negativa perfecta (ρ = -1.00) entre diversidad institucional y equidad (Pielou).
HE3: Existe una correlación positiva muy fuerte (ρ ≥ 0.90) entre número de proyectos y diversidad institucional (GOB) en comunas en construcción.
HE4: Existe una correlación positiva perfecta (ρ ≈ 1.00) entre número de proyectos y diversidad institucional (GOB) en comunas mixtas.
HE5: Existe una correlación positiva moderada (0.40 ≤ ρ < 0.60) entre Ratio ACA y número de proyectos en comunas en construcción.

##Heatmap Comparativo por Tipo de Comuna

El heatmap comparativo revela una heterogeneidad funcional profunda que justifica plenamente la segmentación territorial del análisis. Las comunas rurales y mixtas muestran celdas de color azul intenso, indicando correlaciones perfectas o casi perfectas entre el número de proyectos y la diversidad institucional. Este patrón evidencia que, en estos contextos, existe un mecanismo de escalamiento institucional altamente estandarizado: cada proyecto adicional requiere y genera la incorporación de nuevos actores gubernamentales de manera predecible y sistemática.

Las comunas en construcción presentan celdas de color azul moderado, con correlaciones muy fuertes pero no perfectas, sugiriendo que están en proceso de consolidación de estos mecanismos institucionales. Finalmente, las comunas urbanas muestran celdas blancas o valores NA, indicando ausencia total de correlaciones significativas. Esta desconexión urbana no es un error estadístico sino un hallazgo sustantivo que revela problemas estructurales en la articulación entre planificación y ejecución en contextos de mayor complejidad institucional.

# Preparar datos para visualización
heatmap_tipo_data <- correlaciones_por_tipo %>%
  mutate(
    Etiqueta = paste0(Tipo_Comuna, " - ", Tipo_Analisis),
    Texto_Hover = paste0(
      "Tipo Comuna: ", Tipo_Comuna, "<br>",
      "Análisis: ", Tipo_Analisis, "<br>",
      "ρ (Proyectos-Shannon): ", round(cor_n_proy_H, 3), "<br>",
      "p-valor: ", format.pval(p_n_proy_H, digits = 3), "<br>",
      "n = ", n, " comunas"
    ),
    Significancia_color = case_when(
      is.na(p_n_proy_H) ~ "No calculable",
      p_n_proy_H < 0.001 ~ "p < 0.001",
      p_n_proy_H < 0.01 ~ "p < 0.01",
      p_n_proy_H < 0.05 ~ "p < 0.05",
      TRUE ~ "No significativa"
    )
  )

# Crear matriz para heatmap
matriz_heat <- heatmap_tipo_data %>%
  select(Tipo_Comuna, Tipo_Analisis, cor_n_proy_H) %>%
  pivot_wider(names_from = Tipo_Analisis, values_from = cor_n_proy_H) %>%
  column_to_rownames("Tipo_Comuna")

plot_ly(z = as.matrix(matriz_heat),
        x = colnames(matriz_heat),
        y = rownames(matriz_heat),
        type = "heatmap",
        colors = colorRamp(c("#d73027", "#ffffbf", "#1a9850")),
        zmid = 0,
        zmin = -1,
        zmax = 1,
        text = heatmap_tipo_data %>% 
          select(Tipo_Comuna, Tipo_Analisis, Texto_Hover) %>%
          pivot_wider(names_from = Tipo_Analisis, values_from = Texto_Hover) %>%
          select(-Tipo_Comuna) %>%
          as.matrix(),
        hoverinfo = "text",
        colorbar = list(title = "ρ")) %>%
  layout(
    title = list(
      text = "Correlaciones por Tipo de Comuna y Tipo de Análisis<br><sub>Número de Proyectos vs Índice de Shannon</sub>",
      font = list(size = 16)
    ),
    xaxis = list(title = "Tipo de Análisis"),
    yaxis = list(title = "Tipo de Comuna"),
    margin = list(l = 150, r = 100, t = 100, b = 100)
  )

##Dispersión por Tipo de Comuna

Los tres paneles de dispersión revelan patrones diferenciados que validan la necesidad del análisis segmentado. En el panel izquierdo (CFG), observamos que las comunas rurales y en construcción muestran una tendencia ascendente clara: mayor número de proyectos se asocia con mayor diversidad de problemas identificados. Esto sugiere un mecanismo de aprendizaje organizacional donde la experiencia proyectual potencia la capacidad diagnóstica.

El panel central (Gobernación) es el más revelador: muestra una relación casi perfectamente lineal en comunas rurales y mixtas, donde cada proyecto adicional se traduce en la incorporación predecible de nuevos actores institucionales.

La concentración de puntos en torno a la línea de tendencia, particularmente en comunas rurales, evidencia la estandarización institucional que caracteriza estos contextos. El panel derecho (Ratio ACA) muestra el hallazgo más contraintuitivo: únicamente las comunas en construcción presentan una tendencia positiva significativa. Esto evidencia el “ciclo virtuoso” donde, en estas comunas emergentes, mayor actividad proyectual no diluye la efectividad sino que la potencia, posiblemente porque cada proyecto exitoso fortalece la capacidad organizativa y la credibilidad ante actores institucionales.

# Panel 1: CFG (Diversidad de nudos críticos)
p1_cfg <- plot_ly(data = div_combinada %>% filter(Tipo_Analisis == "CFG"),
                  x = ~n_proyectos,
                  y = ~H_shannon,
                  color = ~Tipo_Comuna,
                  colors = c("Urbana" = "#2E86AB", "Rural" = "#A23B72", 
                            "Mixta" = "#F18F01", "En construcción" = "#C73E1D"),
                  type = 'scatter',
                  mode = 'markers',
                  marker = list(size = 10, opacity = 0.7),
                  text = ~paste0("Comuna: ", COMUNA_ID_NOMBRE, "<br>",
                                "Proyectos: ", n_proyectos, "<br>",
                                "Shannon CFG: ", round(H_shannon, 3)),
                  hoverinfo = 'text') %>%
  layout(title = "CFG: Diversidad de Nudos Críticos",
         xaxis = list(title = "Número de Proyectos"),
         yaxis = list(title = "Índice Shannon (H')"),
         showlegend = TRUE)

# Panel 2: Gobernación (Diversidad institucional)
p2_gob <- plot_ly(data = div_combinada %>% filter(Tipo_Analisis == "Gobernación"),
                  x = ~n_proyectos,
                  y = ~H_shannon,
                  color = ~Tipo_Comuna,
                  colors = c("Urbana" = "#2E86AB", "Rural" = "#A23B72",
                            "Mixta" = "#F18F01", "En construcción" = "#C73E1D"),
                  type = 'scatter',
                  mode = 'markers',
                  marker = list(size = 10, opacity = 0.7),
                  text = ~paste0("Comuna: ", COMUNA_ID_NOMBRE, "<br>",
                                "Proyectos: ", n_proyectos, "<br>",
                                "Shannon GOB: ", round(H_shannon, 3)),
                  hoverinfo = 'text') %>%
  layout(title = "Gobernación: Diversidad Institucional",
         xaxis = list(title = "Número de Proyectos"),
         yaxis = list(title = "Índice Shannon (H')"),
         showlegend = TRUE)

# Panel 3: Ratio ACA (Efectividad)
p3_ratio <- plot_ly(data = div_combinada %>% filter(Tipo_Analisis == "Ratio ACA"),
                    x = ~n_proyectos,
                    y = ~H_shannon,
                    color = ~Tipo_Comuna,
                    colors = c("Urbana" = "#2E86AB", "Rural" = "#A23B72",
                              "Mixta" = "#F18F01", "En construcción" = "#C73E1D"),
                    type = 'scatter',
                    mode = 'markers',
                    marker = list(size = 10, opacity = 0.7),
                    text = ~paste0("Comuna: ", COMUNA_ID_NOMBRE, "<br>",
                                  "Proyectos: ", n_proyectos, "<br>",
                                  "Shannon Ratio: ", round(H_shannon, 3)),
                    hoverinfo = 'text') %>%
  layout(title = "Ratio ACA: Efectividad de Culminación",
         xaxis = list(title = "Número de Proyectos"),
         yaxis = list(title = "Índice Shannon (H')"),
         showlegend = TRUE)

# Combinar los tres paneles
subplot(p1_cfg, p2_gob, p3_ratio, nrows = 1, shareX = FALSE, shareY = FALSE, 
        titleX = TRUE, titleY = TRUE) %>%
  layout(title = list(text = "Relación entre Número de Proyectos y Diversidad por Tipo de Comuna<br><sub>Análisis multi-escala: CFG, Gobernación y Ratio ACA</sub>",
                      font = list(size = 16)),
         showlegend = TRUE,
         legend = list(orientation = "v", x = 1.05, y = 0.5))

##Evaluación de Hipótesis por Tipo de Comuna

El gráfico de evaluación de hipótesis revela tres patrones territoriales distintivos que confirman que el funcionamiento del sistema de ACA está profundamente condicionado por el contexto comunal.

Primer patrón: Gestión institucional perfecta en comunas rurales y mixtas. Las hipótesis HE2 y HE4 muestran correlaciones prácticamente perfectas (ρ=1.000 y ρ=0.999 respectivamente), evidenciando que en estos contextos existe un mecanismo de asignación institucional que opera con precisión matemática. En las 11 comunas rurales analizadas, cada proyecto adicional se traduce en una expansión predecible de la red institucional. Este patrón no es casual sino resultado de protocolos estandarizados y una comprensión compartida entre comunidades y Estado sobre qué actor debe intervenir según la naturaleza del problema.

Segundo patrón: Ciclo virtuoso en comunas en construcción. Las hipótesis HE3 y HE5 revelan que estas 23 comunas emergentes operan bajo una dinámica única. Por un lado, muestran alta capacidad de articulación institucional (ρ=0.910), y por otro, presentan la única correlación positiva significativa entre número de proyectos y efectividad (ρ=0.541). Este hallazgo contradice la intuición de que mayor carga proyectual diluye la capacidad de ejecución. En comunas en construcción, cada proyecto exitoso parece fortalecer la capacidad organizativa, creando un círculo virtuoso donde la acción proyectual construye simultáneamente obra física y capital institucional.

Tercer patrón: Desconexión urbana. La ausencia de hipótesis específicas para comunas urbanas en este gráfico no es omisión metodológica sino reflejo de un hallazgo sustantivo: ninguna correlación alcanzó significancia estadística en este grupo. Esta desconexión sugiere que las comunas urbanas enfrentan dinámicas más complejas donde la cantidad de proyectos, la diversidad institucional o la tipología de problemas no predicen patrones de comportamiento. Posiblemente, factores como burocratización, fragmentación organizativa o saturación de demandas generan una aleatoriedad que anula las relaciones sistemáticas observadas en otros contextos.

Síntesis: Tres Modelos de Gobernanza Comunal

El análisis por tipología comunal revela que no existe un único “modelo ACA” sino al menos tres lógicas de funcionamiento distintas: Modelo Rural: Eficiencia institucional con fragilidad en equidad. Las comunas rurales operan con la mayor eficiencia en asignación institucional. La correlación perfecta entre proyectos y diversidad institucional (ρ=1.000) evidencia protocolos claros.

Sin embargo, la correlación negativa perfecta entre diversidad y equidad (ρ=-1.000) revela una tensión: a mayor diversidad institucional, menor equidad en la distribución de responsabilidades. Esto sugiere concentración excesiva en pocos actores clave, posiblemente por limitaciones logísticas o de coordinación propias del contexto rural. Modelo En Construcción: Crecimiento virtuoso y aprendizaje organizacional.

Estas comunas emergentes muestran un patrón único donde la escalabilidad proyectual potencia tanto la articulación institucional (ρ=0.910) como la efectividad (ρ=0.541). Este modelo sugiere que, en fase de consolidación institucional, cada proyecto exitoso genera aprendizaje acumulativo que fortalece la capacidad para proyectos futuros. La moderación de las correlaciones (comparadas con las perfectas en rurales) indica que el proceso aún está en desarrollo, pero la dirección es positiva.

Modelo Mixto: Gestión relacional como factor determinante absoluto. Con una correlación de ρ=0.999 entre proyectos y diversidad institucional, las comunas mixtas evidencian que su capacidad de gestión depende casi exclusivamente de su habilidad para tejer redes interinstitucionales complejas. Este modelo sitúa la coordinación policéntrica como competencia central. A diferencia de las rurales, donde los protocolos están estandarizados, las mixtas requieren negociación constante.

Modelo Urbano: Complejidad no resuelta. La ausencia de correlaciones significativas no indica falta de actividad sino complejidad sistémica no capturada por las variables medidas. Las comunas urbanas enfrentan probablemente dinámicas de saturación institucional, burocratización excesiva o fragmentación organizativa que rompen las relaciones lineales observadas en otros contextos. Este hallazgo señala la necesidad de estudios cualitativos que identifiquen los mecanismos específicos que operan en entornos urbanos.

Implicaciones para Política Pública

Los hallazgos del análisis por tipo de comuna obligan a abandonar el enfoque de “talla única” en las políticas de apoyo a comunas. Cada contexto territorial requiere estrategias diferenciadas:

Para comunas rurales: Mantener la eficiencia institucional identificada, pero incorporar mecanismos que promuevan mayor equidad en la distribución de responsabilidades ejecutivas. Evitar la sobrecarga de pocos actores institucionales mediante esquemas de corresponsabilidad planificada.

Para comunas en construcción: Priorizar la facilitación de proyectos iniciales, reconociendo que cada proyecto exitoso genera capacidades acumulativas. Diseñar esquemas de acompañamiento técnico intensivo en las primeras etapas, con reducción gradual a medida que la comuna consolida su capacidad organizativa.

Para comunas mixtas: Invertir en el desarrollo de capacidades de gestión relacional y negociación interinstitucional. Crear espacios de articulación que faciliten la coordinación policéntrica. Reconocer que en estos contextos el éxito depende más de las habilidades relacionales que de los recursos técnicos o financieros.

Para comunas urbanas: Realizar investigación cualitativa urgente para identificar los factores específicos que generan desconexión entre planificación y ejecución. Posiblemente requieren reformas estructurales en los mecanismos de articulación institucional, dado que los protocolos que funcionan en otros contextos no generan los mismos resultados.

##Evaluación de las comunas

evaluacion_tipo_comuna <- data.frame(
  Hipotesis = c(
    "HE1: Rural (CFG)",
    "HE2: Rural (GOB)",
    "HE3: En Construcción (GOB)",
    "HE4: Mixta (GOB)",
    "HE5: En Construcción (Ratio ACA)"
  ),
  Rho = c(0.742, 1.000, 0.910, 0.999, 0.541),
  P_valor = c(0.009, 0.000, 0.000, 0.000, 0.008),
  N_comunas = c(11, 11, 23, 23, 23),
  Estado = c("Confirmada", "Confirmada", "Confirmada", "Confirmada", "Confirmada"),
  Color = c("#27ae60", "#27ae60", "#27ae60", "#27ae60", "#27ae60")
)

plot_ly (evaluacion_tipo_comuna,
        y = ~reorder(Hipotesis, Rho),
        x = ~Rho,
        type = 'bar',
        orientation = 'h',
        marker = list(color = ~Color),
        text = ~paste0("ρ = ", round(Rho, 3), "<br>","p-valor: ", format.pval(P_valor, digits = 3), "<br>",
                      "n = ", N_comunas, " comunas<br>",
                      "Estado: ", Estado),
        hoverinfo = 'text') %>%
  layout(
    title = list(
      text = "Evaluación Empírica de Hipótesis por Tipo de Comuna<br><sub>Magnitud de correlaciones y nivel de confirmación</sub>",
      font = list(size = 16)
    ),
    xaxis = list(title = "Coeficiente de Spearman (ρ)", range = c(0, 1.1)),
    yaxis = list(title = ""),
    margin = list(l = 250, r = 50, t = 100, b = 50),
    showlegend = FALSE
  ) %>%
  add_annotations(
    x = ~Rho + 0.05,
    y = ~Hipotesis,
    text = ~paste0("ρ=", round(Rho, 3), "\nn=", N_comunas),
    showarrow = FALSE,
    xanchor = 'left',
    font = list(size = 10, color = 'black')
  )

18 Bloque de Preparación de Variables derivadas para otros análisis posteriores

# ======================================================================
# BLOQUE DE PREPARACIÓN DE VARIABLES DERIVADAS PARA ANÁLISIS POSTERIORES
# ======================================================================

# Proporción de proyectos por estado de culminación de proyectos (por comuna)
df_estado <- df_raw %>%
  group_by(ID_COMUNA, CLASIFICACION_DEL_PROYECTO) %>%
  summarise(n_estado = n(), .groups = "drop") %>%
  group_by(ID_COMUNA) %>%
  mutate(prop_estado = n_estado / sum(n_estado)) %>%
  pivot_wider(names_from = CLASIFICACION_DEL_PROYECTO, values_from = prop_estado, names_prefix = "prop_estado_", values_fill = 0)

# Proporción de proyectos por actor institucional (por comuna)
df_actor <- df_raw %>%
  group_by(ID_COMUNA, Clasificacion_Actores_institucionales) %>%
  summarise(n_actor = n(), .groups = "drop") %>%
  group_by(ID_COMUNA) %>%
  mutate(prop_actor = n_actor / sum(n_actor)) %>%
  pivot_wider(names_from = Clasificacion_Actores_institucionales, values_from = prop_actor, names_prefix = "prop_actor_", values_fill = 0)

# --- 2. Diversidad de tipologías y actores (Shannon/Pielou) ---

# Diversidad de tipologías (CFG) por comuna
cfg_cols <- grep("^CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_", names(df_raw), value = TRUE)
div_tipologia <- df_raw %>%
  group_by(ID_COMUNA) %>%
  summarise(n_proyectos = n(), across(all_of(cfg_cols), ~sum(.x, na.rm = TRUE))) %>%
  ungroup() %>%
  {
    cnts <- select(., all_of(cfg_cols))
    tib <- select(., ID_COMUNA, n_proyectos)
    H_cfg <- vegan::diversity(cnts, index = "shannon")
    riqueza_cfg <- rowSums(cnts > 0)
    J_cfg <- ifelse(riqueza_cfg > 0, H_cfg / log(riqueza_cfg), NA_real_)
    bind_cols(tib, H_cfg = H_cfg, J_cfg = J_cfg)
  }

# Diversidad de actores institucionales por comuna
actor_cols <- grep("^CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_", names(df_raw), value = TRUE)
div_actor <- df_raw %>%
  group_by(ID_COMUNA) %>%
  summarise(n_proyectos = n(), across(all_of(actor_cols), ~sum(.x, na.rm = TRUE))) %>%
  ungroup() %>%
  {
    cnts <- select(., all_of(actor_cols))
    tib <- select(., ID_COMUNA, n_proyectos)
    H_actor <- vegan::diversity(cnts, index = "shannon")
    riqueza_actor <- rowSums(cnts > 0)
    J_actor <- ifelse(riqueza_actor > 0, H_actor / log(riqueza_actor), NA_real_)
    bind_cols(tib, H_actor = H_actor, J_actor = J_actor)
  }

# --- 3. Ratio de culminación vs diversidad ---

# Calcula el promedio de ratio de culminación por comuna
df_ratio <- df_raw %>%
  group_by(ID_COMUNA) %>%
  summarise(ratio_media = mean(RATIO_ACA_PROYECTO_CULMINADO, na.rm = TRUE))

# --- Unir todos los indicadores en una tabla maestra ---

tabla_maestra <- div_tipologia %>%
  left_join(div_actor %>% select(ID_COMUNA, H_actor, J_actor), by = "ID_COMUNA") %>%
  left_join(df_estado, by = "ID_COMUNA") %>%
  left_join(df_actor, by = "ID_COMUNA") %>%
  left_join(df_ratio, by = "ID_COMUNA")

19 Análisis de PCA

El Análisis de Componentes Principales (PCA) se ha implementado como una técnica estadística multivariante fundamental en esta investigación para identificar patrones subyacentes en la gestión de proyectos comunitarios ACA en el Estado Mérida. Este método permite reducir la dimensionalidad del conjunto de datos complejos, transformando variables correlacionadas en un conjunto menor de variables no correlacionadas llamadas componentes principales, que conservan la mayor parte de la información original.

# ==========================================
# FASE 1: PREPARACIÓN Y VALIDACIÓN DE DATOS
# ==========================================

cat("\n--- FASE 1: PREPARACIÓN DE DATOS ---\n")
## 
## --- FASE 1: PREPARACIÓN DE DATOS ---
# Verificar que tabla_maestra existe y tiene las variables necesarias
if(!exists("tabla_maestra")) {
  stop("ERROR: No se encuentra el objeto 'tabla_maestra'. 
       Ejecutar primero los análisis previos de diversidad Shannon.")
}

# Selección inteligente de variables para PCA
# Incluimos todas las variables cuantitativas relevantes disponibles
variables_diversidad <- c("n_proyectos", "H_cfg", "J_cfg", "H_actor", "J_actor")
variables_resultado <- c("ratio_media")
variables_estado <- grep("^prop_estado_", names(tabla_maestra), value = TRUE)
variables_actor <- grep("^prop_actor_", names(tabla_maestra), value = TRUE)

# Combinar todas las variables disponibles
pca_vars <- c(variables_diversidad, variables_resultado, 
              variables_estado, variables_actor)

# Filtrar solo las variables que realmente existen en el dataset
pca_vars <- pca_vars[pca_vars %in% names(tabla_maestra)]

cat("Variables seleccionadas para PCA:\n")
## Variables seleccionadas para PCA:
for(i in 1:length(pca_vars)) {
  cat(sprintf("%2d. %s\n", i, pca_vars[i]))
}
##  1. n_proyectos
##  2. H_cfg
##  3. J_cfg
##  4. H_actor
##  5. J_actor
##  6. ratio_media
##  7. prop_estado_1
##  8. prop_estado_4
##  9. prop_estado_2
## 10. prop_estado_3
## 11. prop_actor_1
## 12. prop_actor_2
## 13. prop_actor_3
## 14. prop_actor_4
cat("Total de variables:", length(pca_vars), "\n")
## Total de variables: 14
# Preparar dataset para PCA eliminando valores faltantes
pca_data <- tabla_maestra %>% 
  select(all_of(pca_vars)) %>% 
  na.omit()

# Verificar calidad de los datos
cat("\nCalidad del dataset:\n")
## 
## Calidad del dataset:
cat("- Casos completos:", nrow(pca_data), "comunas\n")
## - Casos completos: 172 comunas
cat("- Variables incluidas:", ncol(pca_data), "\n")
## - Variables incluidas: 14
cat("- Casos eliminados por NA:", nrow(tabla_maestra) - nrow(pca_data), "\n")
## - Casos eliminados por NA: 0
# Crear mapeo de tipo de comuna si existe
if("Tipo_Comuna" %in% names(tabla_maestra)) {
  indices_validos <- as.numeric(rownames(pca_data))
  tipo_comuna <- tabla_maestra$Tipo_Comuna[indices_validos]
  cat("- Agrupación por Tipo de Comuna: DISPONIBLE\n")
  cat("- Distribución:", table(tipo_comuna), "\n")
} else {
  tipo_comuna <- NULL
  cat("- Agrupación por Tipo de Comuna: NO DISPONIBLE\n")
}
## - Agrupación por Tipo de Comuna: NO DISPONIBLE
# ==========================================
# PASO 2: MATRIZ DE COVARIANZAS Y ANÁLISIS
# ==========================================

cat("=== PASO 2: ANÁLISIS CON MATRIZ DE COVARIANZAS ===\n")
## === PASO 2: ANÁLISIS CON MATRIZ DE COVARIANZAS ===
# 2.1 CALCULAR MATRIZ DE COVARIANZAS
matriz_cov <- cov(pca_data)

# Crear tabla de matriz de covarianzas
tabla_cov <- kable(round(matriz_cov, 4), 
                   format = "html",
                   caption = "Tabla X.1: Matriz de Covarianzas de las Variables Originales") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = FALSE) %>%
  scroll_box(width = "100%", height = "400px") %>%
  footnote(general = "Matriz simétrica donde elementos diagonales representan varianzas y off-diagonal representan covarianzas",
           general_title = "Nota:")

tabla_cov
Tabla X.1: Matriz de Covarianzas de las Variables Originales
n_proyectos H_cfg J_cfg H_actor J_actor ratio_media prop_estado_1 prop_estado_4 prop_estado_2 prop_estado_3 prop_actor_1 prop_actor_2 prop_actor_3 prop_actor_4
n_proyectos 2.6260 0.3764 -0.0283 0.4900 -0.0049 0.2625 -0.1196 -0.0094 0.0056 -0.0398 -0.0424 -0.0579 -0.0430 0.0059
H_cfg 0.3764 0.0971 0.0042 0.0779 0.0002 0.0196 -0.0099 -0.0020 0.0001 -0.0132 -0.0088 -0.0102 -0.0086 0.0006
J_cfg -0.0283 0.0042 0.0021 -0.0039 0.0003 -0.0065 0.0029 0.0002 -0.0001 -0.0009 0.0002 0.0003 0.0000 0.0000
H_actor 0.4900 0.0779 -0.0039 0.0995 0.0002 0.0374 -0.0202 -0.0061 0.0011 -0.0079 -0.0088 -0.0155 -0.0046 0.0010
J_actor -0.0049 0.0002 0.0003 0.0002 0.0002 -0.0029 0.0008 -0.0007 0.0000 0.0001 0.0001 -0.0005 0.0005 0.0000
ratio_media 0.2625 0.0196 -0.0065 0.0374 -0.0029 0.3950 -0.1083 0.0823 -0.0010 0.0082 -0.0120 -0.0267 0.0130 0.0057
prop_estado_1 -0.1196 -0.0099 0.0029 -0.0202 0.0008 -0.1083 0.1002 -0.0264 -0.0003 -0.0261 0.0049 0.0058 -0.0035 -0.0002
prop_estado_4 -0.0094 -0.0020 0.0002 -0.0061 -0.0007 0.0823 -0.0264 0.0549 -0.0011 -0.0102 -0.0002 -0.0066 0.0046 0.0013
prop_estado_2 0.0056 0.0001 -0.0001 0.0011 0.0000 -0.0010 -0.0003 -0.0011 0.0021 0.0009 -0.0003 0.0013 -0.0010 -0.0001
prop_estado_3 -0.0398 -0.0132 -0.0009 -0.0079 0.0001 0.0082 -0.0261 -0.0102 0.0009 0.0427 0.0045 0.0040 -0.0024 -0.0002
prop_actor_1 -0.0424 -0.0088 0.0002 -0.0088 0.0001 -0.0120 0.0049 -0.0002 -0.0003 0.0045 0.0462 -0.0328 -0.0070 -0.0014
prop_actor_2 -0.0579 -0.0102 0.0003 -0.0155 -0.0005 -0.0267 0.0058 -0.0066 0.0013 0.0040 -0.0328 0.1080 -0.0259 -0.0035
prop_actor_3 -0.0430 -0.0086 0.0000 -0.0046 0.0005 0.0130 -0.0035 0.0046 -0.0010 -0.0024 -0.0070 -0.0259 0.0495 0.0010
prop_actor_4 0.0059 0.0006 0.0000 0.0010 0.0000 0.0057 -0.0002 0.0013 -0.0001 -0.0002 -0.0014 -0.0035 0.0010 0.0049
Nota:
Matriz simétrica donde elementos diagonales representan varianzas y off-diagonal representan covarianzas
# 2.2 PCA CON MATRIZ DE COVARIANZAS
pca_cov <- prcomp(pca_data, scale. = FALSE)

# 2.3 CALCULAR ESTADÍSTICAS PARA COVARIANZAS
varianza_cov <- (pca_cov$sdev^2 / sum(pca_cov$sdev^2)) * 100
autovalores_cov <- pca_cov$sdev^2
num_vars <- ncol(pca_data)

# 2.4 TABLA DE AUTOVALORES - COVARIANZAS
tabla_autovalores_cov <- data.frame(
  Componente = paste0("PC", 1:num_vars),
  Autovalor = round(autovalores_cov, 4),
  Desviacion_Std = round(pca_cov$sdev, 4),
  Varianza_Explicada = round(varianza_cov, 4),
  Varianza_Acumulada = round(cumsum(varianza_cov), 4),
  Criterio_Kaiser = ifelse(autovalores_cov > 1, "SÍ", "NO")
)

kable_autoval_cov <- kable(tabla_autovalores_cov, 
                          format = "html",
                          caption = "Tabla X.2: Análisis de Componentes Principales - Matriz de Covarianzas") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), 
                full_width = FALSE) %>%
  row_spec(which(autovalores_cov > 1), bold = TRUE, color = "white", background = "#4CAF50") %>%
  footnote(general = c("Criterio de Kaiser: Retener componentes con autovalores > 1",
                      paste("Componentes retenidos:", sum(autovalores_cov > 1))),
           general_title = "Nota:")

kable_autoval_cov
Tabla X.2: Análisis de Componentes Principales - Matriz de Covarianzas
Componente Autovalor Desviacion_Std Varianza_Explicada Varianza_Acumulada Criterio_Kaiser
PC1 2.8122 1.6770 77.5048 77.5048
PC2 0.4211 0.6490 11.6065 89.1113 NO
PC3 0.1270 0.3564 3.5002 92.6115 NO
PC4 0.0806 0.2839 2.2207 94.8321 NO
PC5 0.0553 0.2351 1.5232 96.3553 NO
PC6 0.0477 0.2183 1.3136 97.6689 NO
PC7 0.0383 0.1956 1.0542 98.7231 NO
PC8 0.0184 0.1357 0.5072 99.2303 NO
PC9 0.0156 0.1249 0.4303 99.6605 NO
PC10 0.0056 0.0751 0.1555 99.8161 NO
PC11 0.0044 0.0666 0.1221 99.9382 NO
PC12 0.0020 0.0450 0.0558 99.9939 NO
PC13 0.0002 0.0143 0.0057 99.9996 NO
PC14 0.0000 0.0038 0.0004 100.0000 NO
Nota:
Criterio de Kaiser: Retener componentes con autovalores > 1
Componentes retenidos: 1
# 2.5 MATRIZ DE ROTACIÓN (LOADINGS) - COVARIANZAS
loadings_cov <- as.data.frame(round(pca_cov$rotation, 4))

kable_loadings_cov <- kable(loadings_cov, 
                           format = "html",
                           caption = "Tabla X.3: Matriz de Rotación (Loadings) - PCA con Covarianzas") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed")) %>%
  scroll_box(width = "100%", height = "400px") %>%
  footnote(general = "Cargas indican la contribución de cada variable original a cada componente principal",
           general_title = "Interpretación:")

kable_loadings_cov
Tabla X.3: Matriz de Rotación (Loadings) - PCA con Covarianzas
PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12 PC13 PC14
n_proyectos 0.9652 -0.1014 0.0148 -0.0160 0.0394 -0.1134 -0.1305 0.0175 0.0257 -0.1514 -0.0159 -0.0051 0.0426 0.0125
H_cfg 0.1402 -0.0678 -0.0271 0.1459 -0.1590 0.6714 0.6155 0.1701 -0.0189 -0.1791 -0.0081 -0.0136 -0.1763 0.0779
J_cfg -0.0101 -0.0098 -0.0066 0.0299 -0.0280 0.1346 0.1197 0.0477 0.0031 -0.0432 0.0134 -0.0502 0.9039 -0.3765
H_actor 0.1805 -0.0490 -0.0448 -0.0108 -0.0998 0.0617 0.1414 0.0065 -0.0369 0.9461 0.0951 0.0481 -0.0415 -0.1399
J_actor -0.0018 -0.0060 -0.0074 -0.0020 -0.0126 0.0100 0.0202 0.0045 -0.0020 0.1443 0.0232 -0.0108 0.3811 0.9124
ratio_media 0.1112 0.9137 0.0457 0.2295 0.1249 -0.1564 0.2302 -0.0028 -0.0675 0.0184 -0.0082 -0.0010 0.0025 0.0015
prop_estado_1 -0.0488 -0.2904 -0.0932 0.7450 0.2321 -0.3399 0.1844 0.2209 0.3084 0.0312 -0.0354 0.0017 -0.0062 -0.0001
prop_estado_4 0.0001 0.2306 -0.0187 0.1791 -0.0588 0.4760 -0.5973 0.2929 0.4838 0.0842 -0.0225 -0.0082 -0.0103 0.0001
prop_estado_2 0.0019 -0.0044 0.0127 -0.0144 0.0117 -0.0168 0.0044 -0.0047 0.0073 0.0508 -0.0026 -0.9970 -0.0494 0.0012
prop_estado_3 -0.0143 0.0465 0.0680 -0.5573 0.1062 -0.2278 0.3324 0.3755 0.6047 0.0022 -0.0409 0.0184 -0.0078 -0.0001
prop_actor_1 -0.0161 -0.0137 -0.3461 -0.1409 0.5917 0.1032 -0.0969 0.5403 -0.4301 0.0225 0.1111 -0.0019 -0.0100 0.0002
prop_actor_2 -0.0231 -0.0675 0.8903 0.0730 0.0143 -0.0187 -0.0538 0.3644 -0.2293 0.0344 0.0822 0.0091 -0.0038 0.0004
prop_actor_3 -0.0149 0.0561 -0.2608 0.0351 -0.7262 -0.2905 -0.0511 0.5117 -0.2115 -0.0707 0.0354 -0.0154 -0.0054 0.0019
prop_actor_4 0.0024 0.0124 -0.0219 0.0198 -0.0197 -0.0161 0.0132 -0.0794 0.1260 -0.0977 0.9829 -0.0059 -0.0173 -0.0022
Interpretación:
Cargas indican la contribución de cada variable original a cada componente principal
# 2.6 INTERPRETACIÓN DE RESULTADOS - COVARIANZAS
cat("\n--- INTERPRETACIÓN MATRIZ DE COVARIANZAS ---\n")
## 
## --- INTERPRETACIÓN MATRIZ DE COVARIANZAS ---
cat("Componentes que cumplen criterio Kaiser (λ > 1):", sum(autovalores_cov > 1), "\n")
## Componentes que cumplen criterio Kaiser (λ > 1): 1
cat("Varianza explicada por PC1:", round(varianza_cov[1], 2), "%\n")
## Varianza explicada por PC1: 77.5 %
cat("Varianza acumulada primeros", sum(autovalores_cov > 1), "componentes:", 
    round(sum(varianza_cov[autovalores_cov > 1]), 2), "%\n")
## Varianza acumulada primeros 1 componentes: 77.5 %
# ==========================================
# PASO 3: MATRIZ DE CORRELACIONES Y ANÁLISIS  
# ==========================================

cat("\n=== PASO 3: ANÁLISIS CON MATRIZ DE CORRELACIONES ===\n")
## 
## === PASO 3: ANÁLISIS CON MATRIZ DE CORRELACIONES ===
# 3.1 CALCULAR MATRIZ DE CORRELACIONES
matriz_cor <- cor(pca_data)

# Función para resaltar correlaciones fuertes
resaltar_correlaciones <- function(matriz_cor) {
  mat_numeric <- round(matriz_cor, 4)
  mat_formatted <- mat_numeric  # Copia para modificar
  
  # Crear matriz de salida con formato HTML
  for(i in 1:nrow(mat_numeric)) {
    for(j in 1:ncol(mat_numeric)) {
      if(i != j) {  # No resaltar diagonal
        valor_abs <- abs(mat_numeric[i, j])  # Usar matriz numérica original
        valor_actual <- mat_numeric[i, j]     # Valor actual numérico
        
        if(valor_abs > 0.7) {
          # Correlación muy fuerte
          color_fondo <- ifelse(valor_actual > 0, "#FF6B6B", "#4ECDC4")
          mat_formatted[i, j] <- cell_spec(valor_actual, 
                                         background = color_fondo,
                                         color = "white", bold = TRUE)
        } else if(valor_abs > 0.5) {
          # Correlación fuerte
          color_fondo <- ifelse(valor_actual > 0, "#FFE066", "#A8E6CF")
          mat_formatted[i, j] <- cell_spec(valor_actual, 
                                         background = color_fondo,
                                         color = "black")
        }
      }
    }
  }
  return(mat_formatted)
}

# Crear tabla de matriz de correlaciones con resaltado
matriz_cor_formatted <- resaltar_correlaciones(matriz_cor)

tabla_cor <- kable(matriz_cor_formatted, 
                   format = "html",
                   caption = "Tabla X.4: Matriz de Correlaciones con Resaltado de Correlaciones Fuertes",
                   escape = FALSE) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = FALSE) %>%
  scroll_box(width = "100%", height = "400px") %>%
  footnote(general = c("Rojo/Naranja: Correlaciones positivas fuertes (>0.5)",
                      "Azul/Verde: Correlaciones negativas fuertes (<-0.5)",
                      "Correlaciones >|0.7| en negrita"),
           general_title = "Leyenda:")

tabla_cor
Tabla X.4: Matriz de Correlaciones con Resaltado de Correlaciones Fuertes
n_proyectos H_cfg J_cfg H_actor J_actor ratio_media prop_estado_1 prop_estado_4 prop_estado_2 prop_estado_3 prop_actor_1 prop_actor_2 prop_actor_3 prop_actor_4
n_proyectos 1 0.7453 -0.3825 0.9583 -0.2028 0.2577 -0.2332 -0.0247 0.075 -0.1189 -0.1217 -0.1088 -0.1193 0.0522
H_cfg 0.7453 1 0.2959 0.7918 0.0494 0.1001 -0.1002 -0.0274 0.0072 -0.2042 -0.1315 -0.0998 -0.1234 0.0296
J_cfg -0.3825 0.2959 1 -0.2732 0.4243 -0.2279 0.204 0.0154 -0.0537 -0.099 0.0224 0.0181 -0.0018 -0.0155
H_actor 0.9583 0.7918 -0.2732 1 0.0519 0.1884 -0.2022 -0.0821 0.0758 -0.121 -0.1298 -0.1496 -0.0652 0.0458
J_actor -0.2028 0.0494 0.4243 0.0519 1 -0.3104 0.1681 -0.2044 0.0543 0.0208 0.0348 -0.1119 0.1496 0
ratio_media 0.2577 0.1001 -0.2279 0.1884 -0.3104 1 -0.5445 0.5583 -0.0352 0.0632 -0.089 -0.1292 0.0926 0.1291
prop_estado_1 -0.2332 -0.1002 0.204 -0.2022 0.1681 -0.5445 1 -0.3555 -0.0187 -0.3995 0.0715 0.0553 -0.0503 -0.0084
prop_estado_4 -0.0247 -0.0274 0.0154 -0.0821 -0.2044 0.5583 -0.3555 1 -0.1031 -0.2105 -0.0049 -0.0861 0.0888 0.0803
prop_estado_2 0.075 0.0072 -0.0537 0.0758 0.0543 -0.0352 -0.0187 -0.1031 1 0.0946 -0.0266 0.0862 -0.0931 -0.0222
prop_estado_3 -0.1189 -0.2042 -0.099 -0.121 0.0208 0.0632 -0.3995 -0.2105 0.0946 1 0.1011 0.0583 -0.0512 -0.0167
prop_actor_1 -0.1217 -0.1315 0.0224 -0.1298 0.0348 -0.089 0.0715 -0.0049 -0.0266 0.1011 1 -0.464 -0.1475 -0.0917
prop_actor_2 -0.1088 -0.0998 0.0181 -0.1496 -0.1119 -0.1292 0.0553 -0.0861 0.0862 0.0583 -0.464 1 -0.3548 -0.1536
prop_actor_3 -0.1193 -0.1234 -0.0018 -0.0652 0.1496 0.0926 -0.0503 0.0888 -0.0931 -0.0512 -0.1475 -0.3548 1 0.0636
prop_actor_4 0.0522 0.0296 -0.0155 0.0458 0 0.1291 -0.0084 0.0803 -0.0222 -0.0167 -0.0917 -0.1536 0.0636 1
Leyenda:
Rojo/Naranja: Correlaciones positivas fuertes (>0.5)
Azul/Verde: Correlaciones negativas fuertes (<-0.5)
Correlaciones >|0.7| en negrita
# 3.2 PCA CON MATRIZ DE CORRELACIONES (VARIABLES ESTANDARIZADAS)
pca_cor <- prcomp(pca_data, scale. = TRUE)

# 3.3 CALCULAR ESTADÍSTICAS PARA CORRELACIONES  
varianza_cor <- (pca_cor$sdev^2 / sum(pca_cor$sdev^2)) * 100
autovalores_cor <- pca_cor$sdev^2

# 3.4 TABLA DE AUTOVALORES - CORRELACIONES
tabla_autovalores_cor <- data.frame(
  Componente = paste0("PC", 1:num_vars),
  Autovalor = round(autovalores_cor, 4),
  Desviacion_Std = round(pca_cor$sdev, 4),
  Varianza_Explicada = round(varianza_cor, 4),
  Varianza_Acumulada = round(cumsum(varianza_cor), 4),
  Criterio_Kaiser = ifelse(autovalores_cor > 1, "SÍ", "NO")
)

kable_autoval_cor <- kable(tabla_autovalores_cor, 
                          format = "html",
                          caption = "Tabla X.5: Análisis de Componentes Principales - Matriz de Correlaciones") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), 
                full_width = FALSE) %>%
  row_spec(which(autovalores_cor > 1), bold = TRUE, color = "white", background = "#2E86AB") %>%
  footnote(general = c("Criterio de Kaiser: Retener componentes con autovalores > 1",
                      paste("Componentes retenidos:", sum(autovalores_cor > 1)),
                      "Método recomendado para variables con diferentes escalas"),
           general_title = "Nota:")

kable_autoval_cor
Tabla X.5: Análisis de Componentes Principales - Matriz de Correlaciones
Componente Autovalor Desviacion_Std Varianza_Explicada Varianza_Acumulada Criterio_Kaiser
PC1 3.0131 1.7358 21.5221 21.5221
PC2 2.1471 1.4653 15.3365 36.8586
PC3 1.6721 1.2931 11.9436 48.8022
PC4 1.4238 1.1932 10.1698 58.9720
PC5 1.2514 1.1187 8.9388 67.9108
PC6 1.1465 1.0707 8.1891 76.0998
PC7 0.9594 0.9795 6.8531 82.9529 NO
PC8 0.9150 0.9565 6.5355 89.4884 NO
PC9 0.5635 0.7506 4.0248 93.5131 NO
PC10 0.3494 0.5911 2.4954 96.0085 NO
PC11 0.2899 0.5385 2.0709 98.0795 NO
PC12 0.2472 0.4972 1.7659 99.8454 NO
PC13 0.0177 0.1331 0.1265 99.9719 NO
PC14 0.0039 0.0627 0.0281 100.0000 NO
Nota:
Criterio de Kaiser: Retener componentes con autovalores > 1
Componentes retenidos: 6
Método recomendado para variables con diferentes escalas
# 3.5 MATRIZ DE ROTACIÓN (LOADINGS) - CORRELACIONES
loadings_cor <- as.data.frame(round(pca_cor$rotation, 4))

kable_loadings_cor <- kable(loadings_cor, 
                           format = "html",
                           caption = "Tabla X.6: Matriz de Rotación (Loadings) - PCA con Correlaciones") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed")) %>%
  scroll_box(width = "100%", height = "400px") %>%
  footnote(general = c("Variables estandarizadas (media=0, desviación=1)",
                      "Cargas muestran correlación entre variables y componentes"),
           general_title = "Interpretación:")

kable_loadings_cor
Tabla X.6: Matriz de Rotación (Loadings) - PCA con Correlaciones
PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12 PC13 PC14
n_proyectos 0.5403 -0.1761 -0.0676 -0.0885 -0.1043 -0.0520 -0.0342 0.0138 0.0201 0.0374 0.1588 -0.0232 -0.6875 0.3866
H_cfg 0.4149 -0.3620 0.1268 0.1215 0.1465 0.2273 -0.0066 0.0782 -0.3027 0.0210 0.0826 0.0068 0.5816 0.3866
J_cfg -0.2050 -0.2592 0.2898 0.2820 0.3893 0.4043 0.0819 0.0533 -0.3864 -0.0478 -0.0206 0.0596 -0.4212 -0.2640
H_actor 0.5146 -0.2647 0.0143 -0.1001 0.0206 -0.0720 -0.0653 0.0037 0.1846 0.0015 0.1272 -0.0168 0.0944 -0.7652
J_actor -0.1545 -0.3226 0.2825 -0.0704 0.4600 -0.0525 -0.0341 -0.0666 0.7124 -0.1178 -0.0062 0.0180 0.0095 0.2135
ratio_media 0.3018 0.4469 0.1020 0.1255 0.1022 0.1062 0.0519 -0.0735 0.0394 -0.7745 -0.0854 0.2108 0.0078 0.0119
prop_estado_1 -0.2670 -0.3945 0.0392 0.1217 -0.4214 -0.1306 0.1150 -0.0668 -0.0496 -0.5056 0.4178 -0.3339 0.0164 -0.0016
prop_estado_4 0.1210 0.4134 0.2419 0.3596 -0.0222 0.2999 0.0780 -0.2209 0.2360 0.2956 0.4136 -0.4082 0.0222 -0.0028
prop_estado_2 0.0292 -0.0782 -0.2324 -0.1865 0.2265 -0.0663 0.4305 -0.7984 -0.1573 0.0239 -0.0085 -0.0004 0.0186 0.0015
prop_estado_3 -0.0528 0.2005 -0.2336 -0.4763 0.4905 0.0003 -0.0218 0.3116 -0.1730 -0.1337 0.3776 -0.3834 0.0124 0.0003
prop_actor_1 -0.1043 0.0309 0.2646 -0.5466 -0.2831 0.4399 0.1113 -0.0247 0.0497 0.0462 0.3418 0.4589 0.0250 -0.0011
prop_actor_2 -0.0887 -0.0470 -0.5951 0.3903 0.1417 0.0587 -0.0262 0.0715 0.1490 0.0286 0.4523 0.4754 0.0212 -0.0012
prop_actor_3 -0.0341 0.1277 0.4171 0.0430 0.1489 -0.5764 -0.3583 -0.1949 -0.2787 0.0771 0.3600 0.2694 0.0048 0.0104
prop_actor_4 0.0692 0.0672 0.1955 0.0922 0.0366 -0.3497 0.7984 0.3866 0.0181 0.1086 0.0683 0.1289 0.0113 -0.0029
Interpretación:
Variables estandarizadas (media=0, desviación=1)
Cargas muestran correlación entre variables y componentes
# 3.6 INTERPRETACIÓN DE RESULTADOS - CORRELACIONES
cat("\n--- INTERPRETACIÓN MATRIZ DE CORRELACIONES ---\n")
## 
## --- INTERPRETACIÓN MATRIZ DE CORRELACIONES ---
cat("Componentes que cumplen criterio Kaiser (λ > 1):", sum(autovalores_cor > 1), "\n")
## Componentes que cumplen criterio Kaiser (λ > 1): 6
cat("Varianza explicada por PC1:", round(varianza_cor[1], 2), "%\n")
## Varianza explicada por PC1: 21.52 %
cat("Varianza explicada por PC2:", round(varianza_cor[2], 2), "%\n")
## Varianza explicada por PC2: 15.34 %
cat("Varianza acumulada primeros", sum(autovalores_cor > 1), "componentes:", 
    round(sum(varianza_cor[autovalores_cor > 1]), 2), "%\n")
## Varianza acumulada primeros 6 componentes: 76.1 %
# ==========================================
# PASO 4: FORMULACIÓN DE HIPÓTESIS KAISER
# ==========================================

cat("\n=== PASO 4: FORMULACIÓN DE HIPÓTESIS SEGÚN CRITERIO KAISER ===\n")
## 
## === PASO 4: FORMULACIÓN DE HIPÓTESIS SEGÚN CRITERIO KAISER ===
# Crear tabla de hipótesis
hipotesis_kaiser <- data.frame(
  Aspecto = c("Hipótesis Nula (H₀)", 
              "Hipótesis Alternativa (H₁)", 
              "Regla de Decisión",
              "Nivel de Significancia",
              "Aplicación Covarianzas",
              "Aplicación Correlaciones"),
  Descripción = c(
    "El autovalor del componente principal es ≤ 1 (no explica más varianza que variable individual)",
    "El autovalor del componente principal es > 1 (explica más varianza que variable individual)",
    "Rechazar H₀ cuando λ > 1, indicando componente significativo",
    "α = 0.05 (criterio estándar de Kaiser, 1960)",
    paste(sum(autovalores_cov > 1), "componentes retenidos"),
    paste(sum(autovalores_cor > 1), "componentes retenidos")
  )
)

kable_hipotesis <- kable(hipotesis_kaiser, 
                        format = "html",
                        caption = "Tabla X.7: Formulación de Hipótesis para Criterio de Kaiser") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  row_spec(5:6, bold = TRUE, background = "#E8F4F8") %>%
  footnote(general = "Referencia: Kaiser, H.F. (1960). The application of electronic computers to factor analysis.",
           general_title = "Fuente:")

kable_hipotesis
Tabla X.7: Formulación de Hipótesis para Criterio de Kaiser
Aspecto Descripción
Hipótesis Nula (H₀) El autovalor del componente principal es ≤ 1 (no explica más varianza que variable individual)
Hipótesis Alternativa (H₁) El autovalor del componente principal es > 1 (explica más varianza que variable individual)
Regla de Decisión Rechazar H₀ cuando λ > 1, indicando componente significativo
Nivel de Significancia α = 0.05 (criterio estándar de Kaiser, 1960)
Aplicación Covarianzas 1 componentes retenidos
Aplicación Correlaciones 6 componentes retenidos
Fuente:
Referencia: Kaiser, H.F. (1960). The application of electronic computers to factor analysis.
# ==========================================
# PASO 5: TABLA COMPARATIVA FINAL
# ==========================================

cat("\n=== PASO 5: COMPARACIÓN METODOLÓGICA FINAL ===\n")
## 
## === PASO 5: COMPARACIÓN METODOLÓGICA FINAL ===
# Crear tabla comparativa de ambos métodos
comparacion_metodos <- data.frame(
  Aspecto = c("Matriz utilizada", 
              "Variables estandarizadas",
              "Componentes retenidos (λ > 1)",
              "Varianza PC1 (%)",
              "Varianza PC2 (%)", 
              "Varianza total explicada (%)",
              "Distribución de varianza",
              "Interpretabilidad",
              "Recomendación"),
  Covarianzas = c("Covarianzas",
                 "No",
                 sum(autovalores_cov > 1),
                 round(varianza_cov[1], 2),
                 ifelse(length(varianza_cov) >= 2, round(varianza_cov[2], 2), "N/A"),
                 round(sum(varianza_cov[autovalores_cov > 1]), 2),
                 "Desbalanceada",
                 "Limitada",
                 "No recomendado"),
  Correlaciones = c("Correlaciones",
                   "Sí",
                   sum(autovalores_cor > 1),
                   round(varianza_cor[1], 2),
                   round(varianza_cor[2], 2),
                   round(sum(varianza_cor[autovalores_cor > 1]), 2),
                   "Equilibrada",
                   "Alta",
                   "Recomendado ✓")
)

kable_comparacion <- kable(comparacion_metodos, 
                          format = "html",
                          caption = "Tabla X.8: Comparación Metodológica - Covarianzas vs Correlaciones") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  column_spec(3, bold = TRUE, background = "#C8E6C9") %>%
  row_spec(9, bold = TRUE, color = "white", background = "#4CAF50") %>%
  footnote(general = "Se recomienda usar matriz de correlaciones por mayor equilibrio e interpretabilidad",
           general_title = "Conclusión:")

kable_comparacion
Tabla X.8: Comparación Metodológica - Covarianzas vs Correlaciones
Aspecto Covarianzas Correlaciones
Matriz utilizada Covarianzas Correlaciones
Variables estandarizadas No
Componentes retenidos (λ > 1) 1 6
Varianza PC1 (%) 77.5 21.52
Varianza PC2 (%) 11.61 15.34
Varianza total explicada (%) 77.5 76.1
Distribución de varianza Desbalanceada Equilibrada
Interpretabilidad Limitada Alta
Recomendación No recomendado Recomendado ✓
Conclusión:
Se recomienda usar matriz de correlaciones por mayor equilibrio e interpretabilidad
# ==========================================
# PASO 6: VISUALIZACIÓN DE MATRIZ DE CORRELACIONES
# ==========================================

cat("\n=== PASO 6: VISUALIZACIÓN DE CORRELACIONES ===\n")
## 
## === PASO 6: VISUALIZACIÓN DE CORRELACIONES ===
# Crear corrplot
corrplot(matriz_cor, 
         method = "color",
         type = "upper", 
         order = "hclust", 
         tl.col = "black", 
         tl.srt = 45,
         tl.cex = 0.8,
         addCoef.col = "black",
         number.cex = 0.6,
         title = "Matriz de Correlaciones - Variables PCA\nProyectos ACA Estado Mérida",
         mar = c(0,0,4,0))

# ==========================================
# PASO 7: MENSAJE FINAL Y RECOMENDACIONES
# ==========================================

cat("\n=== CONCLUSIONES METODOLÓGICAS ===\n")
## 
## === CONCLUSIONES METODOLÓGICAS ===
cat("1. JUSTIFICACIÓN:\n")
## 1. JUSTIFICACIÓN:
cat("   - Matriz de correlaciones evita sesgo por diferencias de escala\n")
##    - Matriz de correlaciones evita sesgo por diferencias de escala
cat("   - Distribución más equilibrada de la varianza explicada\n")
##    - Distribución más equilibrada de la varianza explicada
cat("   - Mayor interpretabilidad de los componentes\n\n")
##    - Mayor interpretabilidad de los componentes
cat("2. RESULTADOS CLAVE:\n")
## 2. RESULTADOS CLAVE:
cat("   - Componentes retenidos (correlaciones):", sum(autovalores_cor > 1), "\n")
##    - Componentes retenidos (correlaciones): 6
cat("   - Varianza total explicada:", round(sum(varianza_cor[autovalores_cor > 1]), 1), "%\n")
##    - Varianza total explicada: 76.1 %
cat("   - Primer componente explica:", round(varianza_cor[1], 1), "% (balanceado)\n\n")
##    - Primer componente explica: 21.5 % (balanceado)
cat("3. PARA LA MONOGRAFÍA:\n")
## 3. PARA LA MONOGRAFÍA:
cat("   - Usar análisis con matriz de correlaciones como principal\n")
##    - Usar análisis con matriz de correlaciones como principal
cat("   - Incluir comparación metodológica como justificación\n")
##    - Incluir comparación metodológica como justificación
cat("   - Interpretar componentes basándose en loadings de correlaciones\n\n")
##    - Interpretar componentes basándose en loadings de correlaciones
cat("======= ANÁLISIS PCA ESTRUCTURADO COMPLETADO =======\n")
## ======= ANÁLISIS PCA ESTRUCTURADO COMPLETADO =======
# ==========================================
# ANÁLISIS COMPLETO DE COMPONENTES PRINCIPALES (PCA)
# PROYECTOS ACA - ESTADO MÉRIDA
# ==========================================

# Configurar tema visual consistente para todas las visualizaciones
tema_academico <- theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    plot.subtitle = element_text(size = 11, color = "gray40", hjust = 0.5),
    axis.title = element_text(face = "bold", size = 12),
    legend.title = element_text(face = "bold"),
    panel.grid.major = element_line(color = "gray90", linewidth = 0.5),
    panel.grid.minor = element_blank()
  )

# Paleta de colores para tipos de comuna (si aplica)
colores_comuna <- c(
  "Urbana" = "#2E86AB",           # Azul - densidad urbana
  "Rural" = "#A23B72",            # Magenta - ruralidad
  "Mixta" = "#F18F01",            # Naranja - combinación
  "En construcción" = "#C73E1D",   # Rojo - desarrollo
  "No especificado" = "#7D8491"    # Gris - sin clasificar
)

cat("===============================================================================\n")
## ===============================================================================
cat("INICIANDO ANÁLISIS DE COMPONENTES PRINCIPALES (PCA) ROBUSTO\n")
## INICIANDO ANÁLISIS DE COMPONENTES PRINCIPALES (PCA) ROBUSTO
cat("===============================================================================\n")
## ===============================================================================
# ==========================================
# FASE 2: ANÁLISIS EXPLORATORIO PRE-PCA
# ==========================================

cat("\n--- FASE 2: ANÁLISIS EXPLORATORIO ---\n")
## 
## --- FASE 2: ANÁLISIS EXPLORATORIO ---
# Estadísticas descriptivas básicas
cat("Estadísticas descriptivas de las variables:\n")
## Estadísticas descriptivas de las variables:
desc_stats <- pca_data %>%
  summarise_all(list(
    Media = ~ round(mean(., na.rm = TRUE), 3),
    DesviacionEst = ~ round(sd(., na.rm = TRUE), 3),
    Minimo = ~ round(min(., na.rm = TRUE), 3),
    Maximo = ~ round(max(., na.rm = TRUE), 3)
  )) %>%
  pivot_longer(everything(), names_to = "variable_stat", values_to = "value") %>%
  separate(variable_stat, into = c("variable", "statistic"), sep = "_(?=[^_]*$)") %>%
  pivot_wider(names_from = statistic, values_from = value)

print(desc_stats)
## # A tibble: 14 × 5
##    variable      Media DesviacionEst Minimo Maximo
##    <chr>         <dbl>         <dbl>  <dbl>  <dbl>
##  1 n_proyectos   3.78          1.62   2      9    
##  2 H_cfg         1.15          0.312  0.637  1.83 
##  3 J_cfg         0.979         0.046  0.79   1    
##  4 H_actor       1.23          0.315  0.637  2.20 
##  5 J_actor       0.995         0.015  0.918  1    
##  6 ratio_media   2.27          0.628  1      4    
##  7 prop_estado_1 0.285         0.317  0      1    
##  8 prop_estado_4 0.142         0.234  0      1    
##  9 prop_estado_2 0.008         0.046  0      0.333
## 10 prop_estado_3 0.135         0.207  0      0.667
## 11 prop_actor_1  0.145         0.215  0      1    
## 12 prop_actor_2  0.296         0.329  0      1    
## 13 prop_actor_3  0.122         0.222  0      1    
## 14 prop_actor_4  0.018         0.07   0      0.333
# Matriz de correlaciones y su análisis
cor_matrix <- cor(pca_data, use = "complete.obs")

# Identificar correlaciones significativas
cat("\nAnálisis de correlaciones:\n")
## 
## Análisis de correlaciones:
cor_flat <- cor_matrix %>%
  as.data.frame() %>%
  mutate(var1 = rownames(.)) %>%
  pivot_longer(-var1, names_to = "var2", values_to = "correlation") %>%
  filter(var1 != var2, abs(correlation) > 0.3) %>%
  arrange(desc(abs(correlation)))

cat("Correlaciones moderadas a fuertes (|r| > 0.3):", nrow(cor_flat), "\n")
## Correlaciones moderadas a fuertes (|r| > 0.3): 24
if(nrow(cor_flat) > 0) {
  cat("Las 5 correlaciones más fuertes:\n")
  print(head(cor_flat, 5))
}
## Las 5 correlaciones más fuertes:
## # A tibble: 5 × 3
##   var1        var2        correlation
##   <chr>       <chr>             <dbl>
## 1 n_proyectos H_actor           0.958
## 2 H_actor     n_proyectos       0.958
## 3 H_cfg       H_actor           0.792
## 4 H_actor     H_cfg             0.792
## 5 n_proyectos H_cfg             0.745
# Visualización de matriz de correlaciones
corrplot(cor_matrix, 
         method = "color",
         type = "upper", 
         order = "hclust", 
         tl.col = "black", 
         tl.srt = 45,
         tl.cex = 0.8,
         addCoef.col = "black",
         number.cex = 0.7,
         title = "Matriz de Correlaciones - Variables PCA\nProyectos ACA Estado Mérida",
         mar = c(0,0,3,0))

# ==========================================
# FASE 3: EVALUACIÓN DE ADECUACIÓN PARA PCA
# ==========================================

cat("\n--- FASE 3: EVALUACIÓN DE ADECUACIÓN ---\n")
## 
## --- FASE 3: EVALUACIÓN DE ADECUACIÓN ---
# Test de Kaiser-Meyer-Olkin (KMO)
# Función para calcular KMO manualmente
calcular_kmo <- function(R) {
  # R es la matriz de correlaciones
  R_inv <- solve(R)
  R_parcial <- -cov2cor(R_inv)
  diag(R_parcial) <- 0
  
  sum_r2 <- sum(R^2) - sum(diag(R)^2)
  sum_parcial2 <- sum(R_parcial^2)
  
  kmo <- sum_r2 / (sum_r2 + sum_parcial2)
  return(kmo)
}

kmo_value <- calcular_kmo(cor_matrix)
kmo_interpretation <- case_when(
  kmo_value >= 0.9 ~ "Excelente",
  kmo_value >= 0.8 ~ "Muy bueno", 
  kmo_value >= 0.7 ~ "Bueno",
  kmo_value >= 0.6 ~ "Mediocre",
  TRUE ~ "Inadecuado"
)

cat("Índice Kaiser-Meyer-Olkin (KMO):", round(kmo_value, 3), "(", kmo_interpretation, ")\n")
## Índice Kaiser-Meyer-Olkin (KMO): 0.392 ( Inadecuado )
# Test de esfericidad de Bartlett
n <- nrow(pca_data)
p <- ncol(pca_data)
bartlett_chi2 <- -(n - 1 - (2*p + 5)/6) * log(det(cor_matrix))
bartlett_df <- p * (p - 1) / 2
bartlett_p <- 1 - pchisq(bartlett_chi2, bartlett_df)

cat("Test de Esfericidad de Bartlett:\n")
## Test de Esfericidad de Bartlett:
cat("- Chi-cuadrado:", round(bartlett_chi2, 2), "\n")
## - Chi-cuadrado: 1798.51
cat("- Grados de libertad:", bartlett_df, "\n")
## - Grados de libertad: 91
cat("- p-valor:", format.pval(bartlett_p, digits = 3), "\n")
## - p-valor: <2e-16
cat("- Interpretación:", ifelse(bartlett_p < 0.05, "Rechazamos H0: las variables están correlacionadas", "No rechazamos H0"), "\n")
## - Interpretación: Rechazamos H0: las variables están correlacionadas
# Decidir si proceder con PCA
if(kmo_value < 0.6) {
  warning("ADVERTENCIA: KMO < 0.6 sugiere que PCA puede no ser apropiado")
}
if(bartlett_p > 0.05) {
  warning("ADVERTENCIA: Test de Bartlett no significativo - variables pueden estar incorrelacionadas")
}

cat("DECISIÓN: Proceder con PCA -", 
    ifelse(kmo_value >= 0.6 && bartlett_p < 0.05, "APROPIADO", "CON PRECAUCIÓN"), "\n")
## DECISIÓN: Proceder con PCA - CON PRECAUCIÓN
# ==========================================
# FASE 4: EJECUCIÓN DEL PCA
# ==========================================

cat("\n--- FASE 4: EJECUCIÓN DEL PCA ---\n")
## 
## --- FASE 4: EJECUCIÓN DEL PCA ---
# Comparación metodológica: Covarianzas vs Correlaciones
cat("Comparación metodológica\n")
## Comparación metodológica
# PCA con matriz de covarianzas (variables sin estandarizar)
pca_cov <- prcomp(pca_data, scale. = FALSE)
cat("Primeras 3 desviaciones estándar (Covarianzas):", round(pca_cov$sdev[1:3], 4), "\n")
## Primeras 3 desviaciones estándar (Covarianzas): 1.677 0.649 0.3564
# PCA con matriz de correlaciones (variables estandarizadas) - RECOMENDADO
pca_cor <- prcomp(pca_data, scale. = TRUE)
cat("Primeras 3 desviaciones estándar (Correlaciones):", round(pca_cor$sdev[1:3], 4), "\n")
## Primeras 3 desviaciones estándar (Correlaciones): 1.7358 1.4653 1.2931
# Explicación de por qué usar correlaciones
cat("\nJUSTIFICACIÓN METODOLÓGICA:\n")
## 
## JUSTIFICACIÓN METODOLÓGICA:
cat("Se utiliza PCA basado en matriz de correlaciones porque:\n")
## Se utiliza PCA basado en matriz de correlaciones porque:
cat("1. Las variables tienen diferentes unidades y escalas\n")
## 1. Las variables tienen diferentes unidades y escalas
cat("2. Evita el sesgo hacia variables con mayor varianza\n")
## 2. Evita el sesgo hacia variables con mayor varianza
cat("3. Permite interpretación más equilibrada de todos los componentes\n")
## 3. Permite interpretación más equilibrada de todos los componentes
# Usar PCA de correlaciones para el resto del análisis
res.pca <- pca_cor

# Análisis de varianza explicada
eig.val <- get_eigenvalue(res.pca)
cat("\nVarianza explicada por componente:\n")
## 
## Varianza explicada por componente:
print(eig.val[1:min(8, nrow(eig.val)), ])
##       eigenvalue variance.percent cumulative.variance.percent
## Dim.1  3.0130905        21.522075                    21.52207
## Dim.2  2.1471164        15.336546                    36.85862
## Dim.3  1.6721041        11.943601                    48.80222
## Dim.4  1.4237703        10.169788                    58.97201
## Dim.5  1.2514277         8.938769                    67.91078
## Dim.6  1.1464691         8.189065                    76.09984
## Dim.7  0.9594271         6.853051                    82.95289
## Dim.8  0.9149642         6.535459                    89.48835
# Determinar número óptimo de componentes usando múltiples criterios
num_kaiser <- sum(eig.val$eigenvalue > 1)
num_80_pct <- which(eig.val$cumulative.variance.percent >= 80)[1]

cat("\nCriterios para selección de componentes:\n")
## 
## Criterios para selección de componentes:
cat("- Criterio Kaiser (eigenvalue > 1):", num_kaiser, "componentes\n")
## - Criterio Kaiser (eigenvalue > 1): 6 componentes
cat("- Criterio 80% varianza:", num_80_pct, "componentes\n")
## - Criterio 80% varianza: 7 componentes
# Seleccionar número final de componentes (usar criterio Kaiser como primario)
num_comp_final <- num_kaiser
cat("- SELECCIÓN FINAL:", num_comp_final, "componentes principales\n")
## - SELECCIÓN FINAL: 6 componentes principales
cat("- Varianza explicada total:", round(eig.val$cumulative.variance.percent[num_comp_final], 2), "%\n")
## - Varianza explicada total: 76.1 %
# ==========================================
# FASE 5: VISUALIZACIONES ACADÉMICAS
# ==========================================

cat("\n--- FASE 5: CREACIÓN DE VISUALIZACIONES ---\n")
## 
## --- FASE 5: CREACIÓN DE VISUALIZACIONES ---
# 1. Scree Plot con criterio Kaiser
p1_scree <- fviz_screeplot(res.pca, 
                          ncp = min(10, nrow(eig.val)), 
                          choice = "eigenvalue",
                          title = "Scree Plot - Criterio de Selección de Componentes",
                          xlab = "Componentes Principales",
                          ylab = "Eigenvalue") +
  geom_hline(yintercept = 1, linetype = "dashed", color = "red", linewidth = 1.2) +
  geom_point(size = 3, color = "#2E86AB") +
  annotate("text", x = 3, y = 1.3, 
           label = "Criterio Kaiser (λ > 1)", 
           color = "red", fontface = "bold", size = 4) +
  tema_academico +
  labs(subtitle = "Metodología: Matriz de Correlaciones (Variables Estandarizadas)")

print(p1_scree)

# 2. Porcentaje de varianza explicada
p2_variance <- fviz_screeplot(res.pca, 
                             ncp = min(10, nrow(eig.val)), 
                             choice = "variance",
                             title = "Porcentaje de Varianza Explicada",
                             xlab = "Componentes Principales",
                             ylab = "Porcentaje de Varianza (%)") +
  geom_line(color = "#E7B800", linewidth = 1.5, group = 1) +
  geom_point(size = 3, color = "#FC4E07") +
  tema_academico

print(p2_variance)

# 3. Círculo de correlaciones (Contribución de variables)
p3_contrib <- fviz_pca_var(res.pca, 
                          col.var = "contrib",
                          gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
                          title = "Círculo de Correlaciones - Contribución de Variables",
                          repel = TRUE) +
  tema_academico +
  labs(
    x = paste0("PC1 (", round(eig.val$variance.percent[1], 1), "%)"),
    y = paste0("PC2 (", round(eig.val$variance.percent[2], 1), "%)"),
    color = "Contrib (%)"
  ) +
  coord_fixed()

print(p3_contrib)

# 4. Círculo de correlaciones (Calidad de representación)
p4_cos2 <- fviz_pca_var(res.pca, 
                       col.var = "cos2",
                       gradient.cols = c("#FFFFFF", "#2E86AB", "#1B365D"),
                       title = "Calidad de Representación de Variables (Cos²)",
                       repel = TRUE) +
  tema_academico +
  labs(
    x = paste0("PC1 (", round(eig.val$variance.percent[1], 1), "%)"),
    y = paste0("PC2 (", round(eig.val$variance.percent[2], 1), "%)"),
    color = "Cos²"
  ) +
  coord_fixed() +
  # Círculo unitario de referencia
  annotate("path",
           x = cos(seq(0, 2*pi, length.out = 100)),
           y = sin(seq(0, 2*pi, length.out = 100)),
           color = "gray70", linetype = "dashed", linewidth = 0.8)

print(p4_cos2)

# 5. Biplot (variables + individuos)
if(!is.null(tipo_comuna)) {
  p5_biplot <- fviz_pca_biplot(res.pca, 
                              geom.ind = "point",
                              pointsize = 2.5,
                              alpha.ind = 0.7,
                              col.var = "black",
                              alpha.var = 0.8,
                              repel = TRUE,
                              labelsize = 3.5,
                              habillage = tipo_comuna,
                              addEllipses = TRUE, 
                              ellipse.level = 0.95,
                              ellipse.alpha = 0.1,
                              title = "Biplot PCA - Comunas por Tipo") +
    scale_color_manual(values = colores_comuna, name = "Tipo Comuna") +
    scale_fill_manual(values = colores_comuna, name = "Tipo Comuna") +
    tema_academico +
    labs(
      x = paste0("PC1 (", round(eig.val$variance.percent[1], 1), "%)"),
      y = paste0("PC2 (", round(eig.val$variance.percent[2], 1), "%)")
    ) +
    theme(legend.position = "bottom") +
    guides(color = guide_legend(override.aes = list(size = 4)))
} else {
  p5_biplot <- fviz_pca_biplot(res.pca, 
                              geom.ind = "point",
                              col.var = "black",
                              alpha.ind = 0.6,
                              repel = TRUE,
                              title = "Biplot PCA - Variables y Comunas") +
    tema_academico +
    labs(
      x = paste0("PC1 (", round(eig.val$variance.percent[1], 1), "%)"),
      y = paste0("PC2 (", round(eig.val$variance.percent[2], 1), "%)")
    )
}

print(p5_biplot)

# ==========================================
# FASE 6: ANÁLISIS DE CLUSTERS ROBUSTO
# ==========================================

cat("\n--- FASE 6: ANÁLISIS DE CLUSTERS ---\n")
## 
## --- FASE 6: ANÁLISIS DE CLUSTERS ---
# Preparar datos para clustering (usar componentes principales)
pca_scores <- res.pca$x[, 1:min(num_comp_final, 4)]

# MÉTODO 1: Determinar número óptimo usando múltiples criterios
set.seed(123)

# Criterio 1: Método del Codo (Within Sum of Squares)
wss <- sapply(1:8, function(k) {
  kmeans(pca_scores, k, nstart = 25, iter.max = 100)$tot.withinss
})

# Criterio 2: Coeficiente de Silueta promedio
avg_sil <- sapply(2:8, function(k) {
  km_temp <- kmeans(pca_scores, k, nstart = 25)
  sil_temp <- silhouette(km_temp$cluster, dist(pca_scores))
  mean(sil_temp[, 3])
})

# Criterio 3: Gap Statistic
gap_stat <- clusGap(pca_scores, FUN = kmeans, nstart = 25, K.max = 8, B = 50)

# Visualizar métodos de selección
p_elbow <- data.frame(k = 1:8, wss = wss) %>%
  ggplot(aes(x = k, y = wss)) +
  geom_line(linewidth = 1.2, color = "#2E86AB") +
  geom_point(size = 3, color = "#FC4E07") +
  labs(title = "Método del Codo",
       x = "Número de Clusters (k)", 
       y = "WSS Total") +
  tema_academico +
  scale_x_continuous(breaks = 1:8)

p_silhouette <- data.frame(k = 2:8, avg_sil = avg_sil) %>%
  ggplot(aes(x = k, y = avg_sil)) +
  geom_line(linewidth = 1.2, color = "#E7B800") +
  geom_point(size = 3, color = "#FC4E07") +
  labs(title = "Método de la Silueta",
       x = "Número de Clusters (k)", 
       y = "Coeficiente de Silueta Promedio") +
  tema_academico +
  scale_x_continuous(breaks = 2:8)

p_gap <- fviz_gap_stat(gap_stat) +
  labs(title = "Gap Statistic") +
  tema_academico

# Combinar gráficos de selección
grid.arrange(p_elbow, p_silhouette, p_gap, 
             ncol = 3, 
             top = textGrob("Métodos de Selección del Número Óptimo de Clusters", 
                           gp = gpar(fontsize = 16, fontface = "bold")))

# Determinar número óptimo
k_elbow <- which.min(diff(diff(wss))) + 1
k_silhouette <- which.max(avg_sil) + 1
k_gap <- maxSE(gap_stat$Tab[, "gap"], gap_stat$Tab[, "SE.sim"])

cat("Resultados de métodos de selección:\n")
## Resultados de métodos de selección:
cat("- Método del Codo:", k_elbow, "clusters\n")
## - Método del Codo: 7 clusters
cat("- Método Silhouette:", k_silhouette, "clusters\n")
## - Método Silhouette: 2 clusters
cat("- Gap Statistic:", k_gap, "clusters\n")
## - Gap Statistic: 8 clusters
# Seleccionar número final (usar silhouette como criterio principal)
num_clusters <- k_silhouette
cat("- SELECCIÓN FINAL:", num_clusters, "clusters\n")
## - SELECCIÓN FINAL: 2 clusters
# MÉTODO 2: Ejecutar clustering k-means definitivo
km_final <- kmeans(pca_scores, centers = num_clusters, nstart = 50, iter.max = 100)

# Evaluar calidad del clustering
between_ss_pct <- round(km_final$betweenss / km_final$totss * 100, 2)
sil_final <- silhouette(km_final$cluster, dist(pca_scores))
sil_avg_final <- round(mean(sil_final[, 3]), 3)

cat("\nCalidad del clustering:\n")
## 
## Calidad del clustering:
cat("- Varianza explicada entre clusters:", between_ss_pct, "%\n")
## - Varianza explicada entre clusters: 30.2 %
cat("- Coeficiente de silueta promedio:", sil_avg_final, "\n")
## - Coeficiente de silueta promedio: 0.371
cat("- Interpretación silueta:", 
    case_when(
      sil_avg_final > 0.7 ~ "Estructura fuerte",
      sil_avg_final > 0.5 ~ "Estructura moderada",
      sil_avg_final > 0.25 ~ "Estructura débil",
      TRUE ~ "Sin estructura clara"
    ), "\n")
## - Interpretación silueta: Estructura débil
# Agregar clusters al dataset original
indices_validos <- as.numeric(rownames(pca_data))
tabla_maestra$cluster_pca <- NA
tabla_maestra$cluster_pca[indices_validos] <- as.factor(km_final$cluster)

# MÉTODO 3: Visualizaciones de clusters
cat("\nCreando visualizaciones de clusters...\n")
## 
## Creando visualizaciones de clusters...
# Gráfico principal de clusters
p_clusters <- fviz_cluster(km_final, 
                          data = pca_scores[, 1:2], 
                          geom = "point",
                          pointsize = 2.5,
                          ellipse.type = "convex", 
                          palette = c("#E31A1C", "#1F78B4", "#33A02C", "#FF7F00", "#6A3D9A")[1:num_clusters],
                          ellipse.alpha = 0.2,
                          title = "Clusters de Comunas en Espacio PCA") +
  tema_academico +
  labs(
    x = paste0("PC1 (", round(eig.val$variance.percent[1], 1), "%)"),
    y = paste0("PC2 (", round(eig.val$variance.percent[2], 1), "%)"),
    color = "Cluster", fill = "Cluster"
  )

print(p_clusters)

# Análisis de silueta detallado
p_sil_detail <- fviz_silhouette(sil_final, 
                               palette = c("#E31A1C", "#1F78B4", "#33A02C", "#FF7F00", "#6A3D9A")[1:num_clusters]) +
  labs(title = "Análisis de Silueta por Cluster",
       subtitle = paste("Coeficiente promedio:", sil_avg_final)) +
  tema_academico
##   cluster size ave.sil.width
## 1       1   39          0.34
## 2       2  133          0.38
print(p_sil_detail)

# ==========================================
# FASE 7: INTERPRETACIÓN Y CARACTERIZACIÓN
# ==========================================

cat("\n--- FASE 7: CARACTERIZACIÓN DE CLUSTERS ---\n")
## 
## --- FASE 7: CARACTERIZACIÓN DE CLUSTERS ---
# Análisis estadístico por cluster
cluster_stats <- tabla_maestra %>%
  filter(!is.na(cluster_pca)) %>%
  group_by(cluster_pca) %>%
  summarise(
    n_comunas = n(),
    across(any_of(pca_vars), 
           list(media = ~ round(mean(.x, na.rm = TRUE), 3),
                mediana = ~ round(median(.x, na.rm = TRUE), 3),
                desv_std = ~ round(sd(.x, na.rm = TRUE), 3)), 
           .names = "{.col}_{.fn}"),
    .groups = "drop"
  )

# Mostrar caracterización básica
cluster_basico <- tabla_maestra %>%
  filter(!is.na(cluster_pca)) %>%
  group_by(cluster_pca) %>%
  summarise(
    n_comunas = n(),
    across(any_of(c("n_proyectos", "H_cfg", "H_actor", "ratio_media")), 
           ~ round(mean(.x, na.rm = TRUE), 3), .names = "promedio_{.col}"),
    .groups = "drop"
  )

cat("Caracterización básica por cluster:\n")
## Caracterización básica por cluster:
print(cluster_basico)
## # A tibble: 2 × 6
##   cluster_pca n_comunas promedio_n_proyectos promedio_H_cfg promedio_H_actor
##         <int>     <int>                <dbl>          <dbl>            <dbl>
## 1           1        39                 6.49           1.57             1.75
## 2           2       133                 2.99           1.03             1.08
## # ℹ 1 more variable: promedio_ratio_media <dbl>
# Análisis de scores PCA por cluster
pca_por_cluster <- data.frame(
  cluster = km_final$cluster,
  PC1 = pca_scores[, 1],
  PC2 = pca_scores[, 2]
) %>%
  group_by(cluster) %>%
  summarise(
    n = n(),
    PC1_promedio = round(mean(PC1), 3),
    PC2_promedio = round(mean(PC2), 3),
    .groups = "drop"
  )

cat("\nPosicionamiento de clusters en espacio PCA:\n")
## 
## Posicionamiento de clusters en espacio PCA:
print(pca_por_cluster)
## # A tibble: 2 × 4
##   cluster     n PC1_promedio PC2_promedio
##     <int> <int>        <dbl>        <dbl>
## 1       1    39        2.84        -0.557
## 2       2   133       -0.833        0.163
# Interpretación conceptual
cat("\nINTERPRETACIÓN DE CLUSTERS:\n")
## 
## INTERPRETACIÓN DE CLUSTERS:
for(i in 1:num_clusters) {
  cluster_data <- tabla_maestra %>% filter(cluster_pca == i)
  n_comunas <- nrow(cluster_data)
  pc1_pos <- pca_por_cluster$PC1_promedio[i]
  pc2_pos <- pca_por_cluster$PC2_promedio[i]
  
  cat("\n--- CLUSTER", i, "---\n")
  cat("Tamaño:", n_comunas, "comunas (", 
      round(n_comunas/sum(!is.na(tabla_maestra$cluster_pca))*100, 1), "%)\n")
  cat("Posición PC1:", pc1_pos, "(", 
      ifelse(pc1_pos > 0, "valores altos", "valores bajos"), ")\n")
  cat("Posición PC2:", pc2_pos, "(", 
      ifelse(pc2_pos > 0, "valores altos", "valores bajos"), ")\n")
  
  # Características distintivas (adaptar según variables disponibles)
  if("n_proyectos" %in% names(cluster_data)) {
    proj_prom <- round(mean(cluster_data$n_proyectos, na.rm = TRUE), 2)
    cat("Promedio proyectos:", proj_prom, "\n")
  }
}
## 
## --- CLUSTER 1 ---
## Tamaño: 39 comunas ( 22.7 %)
## Posición PC1: 2.841 ( valores altos )
## Posición PC2: -0.557 ( valores bajos )
## Promedio proyectos: 6.49 
## 
## --- CLUSTER 2 ---
## Tamaño: 133 comunas ( 77.3 %)
## Posición PC1: -0.833 ( valores bajos )
## Posición PC2: 0.163 ( valores altos )
## Promedio proyectos: 2.99
# Relación con tipo de comuna (si disponible)
if(!is.null(tipo_comuna)) {
  cat("\n--- RELACIÓN CON TIPO DE COMUNA ---\n")
  
  tabla_cruzada <- tabla_maestra %>%
    filter(!is.na(cluster_pca), !is.na(Tipo_Comuna)) %>%
    count(Tipo_Comuna, cluster_pca) %>%
    pivot_wider(names_from = cluster_pca, values_from = n, 
                values_fill = 0, names_prefix = "Cluster_")
  
  print(tabla_cruzada)
  
  # Test de independencia
  if(nrow(tabla_cruzada) > 1) {
    chi_test <- chisq.test(as.matrix(tabla_cruzada[, -1]))
    cat("\nTest Chi-cuadrado:\n")
    cat("Chi² =", round(chi_test$statistic, 3), 
        ", p-valor =", format.pval(chi_test$p.value), "\n")
    cat("Asociación:", ifelse(chi_test$p.value < 0.05, "SIGNIFICATIVA", "NO SIGNIFICATIVA"), "\n")
  }
}

# ==========================================
# FASE 8: ANÁLISIS DE CARGAS Y COMPONENTES
# ==========================================

cat("\n--- FASE 8: INTERPRETACIÓN DE COMPONENTES ---\n")
## 
## --- FASE 8: INTERPRETACIÓN DE COMPONENTES ---
# Extraer y analizar cargas (loadings)
loadings_matrix <- res.pca$rotation[, 1:num_comp_final]

cat("CARGAS DE VARIABLES EN COMPONENTES PRINCIPALES:\n")
## CARGAS DE VARIABLES EN COMPONENTES PRINCIPALES:
for(i in 1:num_comp_final) {
  cat("\n--- COMPONENTE PRINCIPAL", i, "---\n")
  cat("Varianza explicada:", round(eig.val$variance.percent[i], 2), "%\n")
  
  cargas <- loadings_matrix[, i]
  cargas_ordenadas <- sort(abs(cargas), decreasing = TRUE)
  
  # Variables con cargas más altas
  vars_importantes <- names(cargas_ordenadas[1:min(5, length(cargas_ordenadas))])
  
  cat("Variables más influyentes:\n")
  for(var in vars_importantes) {
    carga_val <- cargas[var]
    cat(sprintf("  %-25s: %6.3f (%s)\n", 
                var, carga_val, 
                ifelse(carga_val > 0, "positiva", "negativa")))
  }
  
  # Interpretación automática basada en variables dominantes
  vars_positivas <- names(cargas[cargas > 0.3])
  vars_negativas <- names(cargas[cargas < -0.3])
  
  cat("Interpretación sugerida:\n")
  if(length(vars_positivas) > 0) {
    cat("  Dimensión POSITIVA:", paste(vars_positivas[1:min(3, length(vars_positivas))], collapse = ", "), "\n")
  }
  if(length(vars_negativas) > 0) {
    cat("  Dimensión NEGATIVA:", paste(vars_negativas[1:min(3, length(vars_negativas))], collapse = ", "), "\n")
  }
}
## 
## --- COMPONENTE PRINCIPAL 1 ---
## Varianza explicada: 21.52 %
## Variables más influyentes:
##   n_proyectos              :  0.540 (positiva)
##   H_actor                  :  0.515 (positiva)
##   H_cfg                    :  0.415 (positiva)
##   ratio_media              :  0.302 (positiva)
##   prop_estado_1            : -0.267 (negativa)
## Interpretación sugerida:
##   Dimensión POSITIVA: n_proyectos, H_cfg, H_actor 
## 
## --- COMPONENTE PRINCIPAL 2 ---
## Varianza explicada: 15.34 %
## Variables más influyentes:
##   ratio_media              :  0.447 (positiva)
##   prop_estado_4            :  0.413 (positiva)
##   prop_estado_1            : -0.395 (negativa)
##   H_cfg                    : -0.362 (negativa)
##   J_actor                  : -0.323 (negativa)
## Interpretación sugerida:
##   Dimensión POSITIVA: ratio_media, prop_estado_4 
##   Dimensión NEGATIVA: H_cfg, J_actor, prop_estado_1 
## 
## --- COMPONENTE PRINCIPAL 3 ---
## Varianza explicada: 11.94 %
## Variables más influyentes:
##   prop_actor_2             : -0.595 (negativa)
##   prop_actor_3             :  0.417 (positiva)
##   J_cfg                    :  0.290 (positiva)
##   J_actor                  :  0.283 (positiva)
##   prop_actor_1             :  0.265 (positiva)
## Interpretación sugerida:
##   Dimensión POSITIVA: prop_actor_3 
##   Dimensión NEGATIVA: prop_actor_2 
## 
## --- COMPONENTE PRINCIPAL 4 ---
## Varianza explicada: 10.17 %
## Variables más influyentes:
##   prop_actor_1             : -0.547 (negativa)
##   prop_estado_3            : -0.476 (negativa)
##   prop_actor_2             :  0.390 (positiva)
##   prop_estado_4            :  0.360 (positiva)
##   J_cfg                    :  0.282 (positiva)
## Interpretación sugerida:
##   Dimensión POSITIVA: prop_estado_4, prop_actor_2 
##   Dimensión NEGATIVA: prop_estado_3, prop_actor_1 
## 
## --- COMPONENTE PRINCIPAL 5 ---
## Varianza explicada: 8.94 %
## Variables más influyentes:
##   prop_estado_3            :  0.490 (positiva)
##   J_actor                  :  0.460 (positiva)
##   prop_estado_1            : -0.421 (negativa)
##   J_cfg                    :  0.389 (positiva)
##   prop_actor_1             : -0.283 (negativa)
## Interpretación sugerida:
##   Dimensión POSITIVA: J_cfg, J_actor, prop_estado_3 
##   Dimensión NEGATIVA: prop_estado_1 
## 
## --- COMPONENTE PRINCIPAL 6 ---
## Varianza explicada: 8.19 %
## Variables más influyentes:
##   prop_actor_3             : -0.576 (negativa)
##   prop_actor_1             :  0.440 (positiva)
##   J_cfg                    :  0.404 (positiva)
##   prop_actor_4             : -0.350 (negativa)
##   prop_estado_4            :  0.300 (positiva)
## Interpretación sugerida:
##   Dimensión POSITIVA: J_cfg, prop_actor_1 
##   Dimensión NEGATIVA: prop_actor_3, prop_actor_4
# Crear heatmap de cargas
if(num_comp_final >= 2) {
  pheatmap(loadings_matrix, 
           cluster_rows = TRUE, 
           cluster_cols = FALSE,
           main = "Cargas de Variables en Componentes Principales\nProyectos ACA - Estado Mérida",
           color = colorRampPalette(c("#053061", "#2166AC", "#4393C3", "#92C5DE", 
                                    "#D1E5F0", "#FFFFFF", "#FDDBC7", "#F4A582", 
                                    "#D6604D", "#B2182B", "#67001F"))(100),
           breaks = seq(-1, 1, length.out = 101),
           display_numbers = TRUE,
           number_format = "%.2f",
           fontsize = 10,
           cellwidth = 40,
           cellheight = 15)
}

# ==========================================
# FASE 9: EXPORTACIÓN Y TABLAS ACADÉMICAS
# ==========================================

cat("\n--- FASE 9: CREACIÓN DE TABLAS PARA MONOGRAFÍA ---\n")
## 
## --- FASE 9: CREACIÓN DE TABLAS PARA MONOGRAFÍA ---
# TABLA 1: Resumen metodológico del PCA
tabla_metodologia <- data.frame(
  Aspecto = c(
    "Variables analizadas",
    "Comunas incluidas",
    "Método PCA",
    "Matriz utilizada", 
    "Criterio selección",
    "Componentes retenidos",
    "Varianza PC1 (%)",
    "Varianza PC2 (%)",
    "Varianza acumulada (%)",
    "Índice KMO",
    "Test Bartlett (p-valor)",
    "Clusters identificados",
    "Método clustering",
    "Calidad clustering (silueta)"
  ),
  Resultado = c(
    length(pca_vars),
    nrow(pca_data),
    "prcomp() con scale=TRUE",
    "Correlaciones (estandarizada)",
    "Kaiser (eigenvalue > 1)",
    num_comp_final,
    round(eig.val$variance.percent[1], 2),
    round(eig.val$variance.percent[2], 2),
    round(sum(eig.val$variance.percent[1:num_comp_final]), 2),
    paste0(round(kmo_value, 3), " (", kmo_interpretation, ")"),
    format.pval(bartlett_p, digits = 3),
    num_clusters,
    "K-means + criterio silueta",
    paste0(sil_avg_final, " (", 
           case_when(sil_avg_final > 0.5 ~ "Moderada", 
                    sil_avg_final > 0.25 ~ "Débil", 
                    TRUE ~ "Pobre"), ")")
  )
)

# Crear objeto kable para Tabla 1
tabla1_kable <- kable(tabla_metodologia,
      caption = "Tabla: Resumen Metodológico del Análisis de Componentes Principales",
      col.names = c("Aspecto Metodológico", "Resultado"),
      align = c("l", "c")) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  row_spec(c(6, 9, 12), bold = TRUE, background = "#e6f3ff")

# TABLA 2: Varianza explicada por componentes
tabla_varianza <- eig.val %>%
  head(min(8, nrow(eig.val))) %>%
  mutate(
    Componente = paste("PC", 1:nrow(.), sep = ""),
    Criterio_Kaiser = ifelse(eigenvalue > 1, "RETENER", "descartar"),
    .before = 1
  ) %>%
  select(Componente, eigenvalue, variance.percent, 
         cumulative.variance.percent, Criterio_Kaiser)

# Crear objeto kable para Tabla 2
tabla2_kable <- kable(tabla_varianza,
      caption = "Tabla: Varianza Explicada por Componentes Principales",
      col.names = c("Componente", "Eigenvalue", "% Varianza", 
                   "% Acumulado", "Criterio Kaiser"),
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  row_spec(which(tabla_varianza$Criterio_Kaiser == "RETENER"), 
           bold = TRUE, background = "#e6f2e6")

# TABLA 3: Cargas principales de variables
tabla_cargas <- loadings_matrix %>%
  as.data.frame() %>%
  mutate(Variable = rownames(.), .before = 1) %>%
  arrange(desc(abs(PC1))) %>%
  mutate(
    across(starts_with("PC"), ~ round(.x, 3)),
    Interpretacion_PC1 = case_when(
      abs(PC1) > 0.7 ~ "Muy fuerte",
      abs(PC1) > 0.5 ~ "Fuerte", 
      abs(PC1) > 0.3 ~ "Moderada",
      TRUE ~ "Débil"
    )
  )

# Crear objeto kable para Tabla 3
tabla3_kable <- kable(tabla_cargas,
      caption = "Tabla: Cargas de Variables en Componentes Principales",
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  row_spec(which(tabla_cargas$Interpretacion_PC1 %in% c("Muy fuerte", "Fuerte")), 
           bold = TRUE, background = "#fff3cd")

# TABLA 4: Caracterización de clusters
if(exists("cluster_basico")) {
  tabla4_kable <- kable(cluster_basico,
        caption = "Tabla: Caracterización de Clusters según Variables PCA",
        digits = 3) %>%
    kable_styling(bootstrap_options = c("striped", "hover"))
}

# ==========================================
# VISUALIZACIÓN CONTROLADA
# ==========================================

# Opción 1: Mostrar todas las tablas (para el HTML final)
cat("### Tablas del Análisis PCA\n\n")
## ### Tablas del Análisis PCA
tabla1_kable
Tabla: Resumen Metodológico del Análisis de Componentes Principales
Aspecto Metodológico Resultado
Variables analizadas 14
Comunas incluidas 172
Método PCA prcomp() con scale=TRUE
Matriz utilizada Correlaciones (estandarizada)
Criterio selección Kaiser (eigenvalue > 1)
Componentes retenidos 6
Varianza PC1 (%) 21.52
Varianza PC2 (%) 15.34
Varianza acumulada (%) 76.1
Índice KMO 0.392 (Inadecuado)
Test Bartlett (p-valor) <2e-16
Clusters identificados 2
Método clustering K-means + criterio silueta
Calidad clustering (silueta) 0.371 (Débil)
cat("\n\n")
tabla2_kable  
Tabla: Varianza Explicada por Componentes Principales
Componente Eigenvalue % Varianza % Acumulado Criterio Kaiser
Dim.1 PC1 3.013 21.522 21.522 RETENER
Dim.2 PC2 2.147 15.337 36.859 RETENER
Dim.3 PC3 1.672 11.944 48.802 RETENER
Dim.4 PC4 1.424 10.170 58.972 RETENER
Dim.5 PC5 1.251 8.939 67.911 RETENER
Dim.6 PC6 1.146 8.189 76.100 RETENER
Dim.7 PC7 0.959 6.853 82.953 descartar
Dim.8 PC8 0.915 6.535 89.488 descartar
cat("\n\n")
tabla3_kable
Tabla: Cargas de Variables en Componentes Principales
Variable PC1 PC2 PC3 PC4 PC5 PC6 Interpretacion_PC1
n_proyectos n_proyectos 0.540 -0.176 -0.068 -0.089 -0.104 -0.052 Fuerte
H_actor H_actor 0.515 -0.265 0.014 -0.100 0.021 -0.072 Fuerte
H_cfg H_cfg 0.415 -0.362 0.127 0.121 0.147 0.227 Moderada
ratio_media ratio_media 0.302 0.447 0.102 0.125 0.102 0.106 Moderada
prop_estado_1 prop_estado_1 -0.267 -0.395 0.039 0.122 -0.421 -0.131 Débil
J_cfg J_cfg -0.205 -0.259 0.290 0.282 0.389 0.404 Débil
J_actor J_actor -0.154 -0.323 0.283 -0.070 0.460 -0.052 Débil
prop_estado_4 prop_estado_4 0.121 0.413 0.242 0.360 -0.022 0.300 Débil
prop_actor_1 prop_actor_1 -0.104 0.031 0.265 -0.547 -0.283 0.440 Débil
prop_actor_2 prop_actor_2 -0.089 -0.047 -0.595 0.390 0.142 0.059 Débil
prop_actor_4 prop_actor_4 0.069 0.067 0.195 0.092 0.037 -0.350 Débil
prop_estado_3 prop_estado_3 -0.053 0.200 -0.234 -0.476 0.490 0.000 Débil
prop_actor_3 prop_actor_3 -0.034 0.128 0.417 0.043 0.149 -0.576 Débil
prop_estado_2 prop_estado_2 0.029 -0.078 -0.232 -0.186 0.226 -0.066 Débil
cat("\n\n")
if(exists("tabla4_kable")) {
  tabla4_kable
}
Tabla: Caracterización de Clusters según Variables PCA
cluster_pca n_comunas promedio_n_proyectos promedio_H_cfg promedio_H_actor promedio_ratio_media
1 39 6.487 1.574 1.747 2.579
2 133 2.992 1.030 1.082 2.178
# ==========================================
# FASE 10: VALIDACIÓN Y DIAGNÓSTICOS
# ==========================================

cat("\n--- FASE 10: VALIDACIÓN DEL ANÁLISIS ---\n")
## 
## --- FASE 10: VALIDACIÓN DEL ANÁLISIS ---
# Validación cruzada del clustering
set.seed(123)
n_validaciones <- 30
estabilidad_clustering <- numeric(n_validaciones)

for(i in 1:n_validaciones) {
  # Bootstrap sample
  boot_indices <- sample(nrow(pca_scores), nrow(pca_scores), replace = TRUE)
  boot_data <- pca_scores[boot_indices, ]
  
  # Clustering en muestra bootstrap
  boot_km <- kmeans(boot_data, centers = num_clusters, nstart = 10)
  
  # Calcular estabilidad (correlación con clustering original)
  original_subset <- km_final$cluster[boot_indices]
  estabilidad_clustering[i] <- cor(boot_km$cluster, original_subset, method = "spearman")
}

estabilidad_promedio <- round(mean(estabilidad_clustering, na.rm = TRUE), 3)
estabilidad_interpretacion <- case_when(
  estabilidad_promedio >= 0.85 ~ "Muy estable",
  estabilidad_promedio >= 0.75 ~ "Estable", 
  estabilidad_promedio >= 0.65 ~ "Moderadamente estable",
  TRUE ~ "Inestable"
)

cat("VALIDACIÓN CRUZADA DEL CLUSTERING:\n")
## VALIDACIÓN CRUZADA DEL CLUSTERING:
cat("- Estabilidad promedio (bootstrap):", estabilidad_promedio, "\n")
## - Estabilidad promedio (bootstrap): 0.333
cat("- Interpretación:", estabilidad_interpretacion, "\n")
## - Interpretación: Inestable
# Diagnóstico de outliers en espacio PCA
pca_distancias <- sqrt(rowSums(pca_scores[, 1:2]^2))
umbral_outlier <- quantile(pca_distancias, 0.95)
outliers_indices <- which(pca_distancias > umbral_outlier)

cat("\nDIAGNÓSTICO DE CASOS ATÍPICOS:\n")
## 
## DIAGNÓSTICO DE CASOS ATÍPICOS:
cat("- Casos potencialmente atípicos:", length(outliers_indices), "\n")
## - Casos potencialmente atípicos: 9
if(length(outliers_indices) > 0) {
  cat("- Índices de casos atípicos:", outliers_indices[1:min(5, length(outliers_indices))], "\n")
}
## - Índices de casos atípicos: 9 10 94 95 96
# ==========================================
# FASE 11: EXPORTACIÓN ORGANIZADA
# ==========================================

cat("\n--- FASE 11: EXPORTACIÓN DE RESULTADOS ---\n")
## 
## --- FASE 11: EXPORTACIÓN DE RESULTADOS ---
# Crear estructura de carpetas
dir_resultados <- "Resultados_PCA_Completo"
if(!dir.exists(dir_resultados)) {
  dir.create(dir_resultados)
  dir.create(file.path(dir_resultados, "Tablas"))
  dir.create(file.path(dir_resultados, "Graficos"))
  dir.create(file.path(dir_resultados, "Datos"))
}

# Exportar datos principales
# 1. Scores PCA con información adicional
scores_completos <- data.frame(
  ID_COMUNA = rownames(pca_data),
  res.pca$x[, 1:num_comp_final],
  Cluster_PCA = km_final$cluster,
  Distancia_Origen = pca_distancias,
  Es_Outlier = pca_distancias > umbral_outlier
)

if(!is.null(tipo_comuna)) {
  scores_completos$Tipo_Comuna <- tipo_comuna
}

write.csv(scores_completos, 
          file.path(dir_resultados, "Datos", "scores_pca_completos.csv"), 
          row.names = FALSE)

# 2. Cargas de variables
cargas_completas <- data.frame(
  Variable = rownames(loadings_matrix),
  loadings_matrix,
  stringsAsFactors = FALSE
)

write.csv(cargas_completas, 
          file.path(dir_resultados, "Datos", "cargas_variables.csv"), 
          row.names = FALSE)

# 3. Tablas para monografía
write.csv(tabla_metodologia, 
          file.path(dir_resultados, "Tablas", "resumen_metodologico.csv"), 
          row.names = FALSE)
write.csv(tabla_varianza, 
          file.path(dir_resultados, "Tablas", "varianza_explicada.csv"), 
          row.names = FALSE)
write.csv(tabla_cargas, 
          file.path(dir_resultados, "Tablas", "cargas_variables.csv"), 
          row.names = FALSE)

if(exists("cluster_basico")) {
  write.csv(cluster_basico, 
            file.path(dir_resultados, "Tablas", "caracterizacion_clusters.csv"), 
            row.names = FALSE)
}

# 4. Guardar gráficos principales
ggsave(file.path(dir_resultados, "Graficos", "01_scree_plot.png"), 
       p1_scree, width = 12, height = 8, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "02_varianza_explicada.png"), 
       p2_variance, width = 12, height = 8, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "03_circulo_contribucion.png"), 
       p3_contrib, width = 12, height = 10, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "04_circulo_cos2.png"), 
       p4_cos2, width = 12, height = 10, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "05_biplot.png"), 
       p5_biplot, width = 14, height = 10, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "06_clusters.png"), 
       p_clusters, width = 12, height = 10, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "07_silhouette.png"), 
       p_sil_detail, width = 12, height = 8, dpi = 300)

# ==========================================
# FASE 12: REPORTE EJECUTIVO FINAL
# ==========================================

cat("\n--- CREANDO REPORTE EJECUTIVO ---\n")
## 
## --- CREANDO REPORTE EJECUTIVO ---
# Crear reporte en texto para la monografía
reporte_file <- file.path(dir_resultados, "REPORTE_EJECUTIVO_PCA.txt")

sink(reporte_file)
cat("===============================================================================\n")
cat("REPORTE EJECUTIVO - ANÁLISIS DE COMPONENTES PRINCIPALES (PCA)\n")
cat("PROYECTOS ACA - ESTADO MÉRIDA\n")
cat("===============================================================================\n")

cat("1. RESUMEN METODOLÓGICO:\n")
cat("- Variables analizadas:", length(pca_vars), "\n")
cat("- Comunas válidas:", nrow(pca_data), "\n")
cat("- Método: PCA con matriz de correlaciones (variables estandarizadas)\n")
cat("- Adecuación KMO:", round(kmo_value, 3), "(", kmo_interpretation, ")\n")
cat("- Test Bartlett: p <", format.pval(bartlett_p, digits = 3), "\n\n")

cat("2. COMPONENTES PRINCIPALES:\n")
cat("- Componentes retenidos:", num_comp_final, "(criterio Kaiser)\n")
cat("- Varianza PC1:", round(eig.val$variance.percent[1], 2), "%\n")
cat("- Varianza PC2:", round(eig.val$variance.percent[2], 2), "%\n")
cat("- Varianza total explicada:", round(sum(eig.val$variance.percent[1:num_comp_final]), 2), "%\n\n")

cat("3. ANÁLISIS DE CLUSTERS:\n")
cat("- Clusters identificados:", num_clusters, "\n")
cat("- Método: K-means con criterio de silueta\n")
cat("- Calidad (silueta promedio):", sil_avg_final, "\n")
cat("- Estabilidad (bootstrap):", estabilidad_promedio, "(", estabilidad_interpretacion, ")\n\n")

cat("4. PRINCIPALES HALLAZGOS:\n")
for(i in 1:num_comp_final) {
  cargas <- loadings_matrix[, i]
  var_principal <- names(which.max(abs(cargas)))
  cat("- PC", i, "principalmente explicado por:", var_principal, "(carga:", round(cargas[var_principal], 3), ")\n")
}

cat("\n5. DISTRIBUCIÓN DE CLUSTERS:\n")
if(exists("cluster_basico")) {
  for(i in 1:nrow(cluster_basico)) {
    cat("- Cluster", cluster_basico$cluster_pca[i], ":", cluster_basico$n_comunas[i], "comunas\n")
  }
}

cat("\n6. ARCHIVOS GENERADOS:\n")
cat("- Datos/scores_pca_completos.csv: Puntuaciones PCA por comuna\n")
cat("- Datos/cargas_variables.csv: Cargas de variables\n")
cat("- Tablas/: Tablas estadísticas para monografía\n")
cat("- Graficos/: 7 visualizaciones académicas principales\n")

cat("\n7. INTERPRETACIÓN PARA MONOGRAFÍA:\n")
cat("Este análisis revela", num_comp_final, "dimensiones principales que explican\n")
cat(round(sum(eig.val$variance.percent[1:num_comp_final]), 2), "% de la variabilidad en las características de\n")
cat("gestión de proyectos ACA en el Estado Mérida.\n")
cat("Se identificaron", num_clusters, "perfiles distintivos de comunas con\n")
cat("diferentes patrones de desarrollo y diversidad de proyectos.\n")

cat("\n===============================================================================\n")
sink()

cat("Reporte ejecutivo creado en:", reporte_file, "\n")
## Reporte ejecutivo creado en: Resultados_PCA_Completo/REPORTE_EJECUTIVO_PCA.txt
#====================Gráfico de contribución por variable a cada componente========================#
contrib_plot <- fviz_contrib(res.pca, choice = "var", axes = 1:3)

#====================Heatmap de cargas para interpretación más clara===============================#
pheatmap(res.pca$rotation[, 1:3], 
         main = "Cargas de Variables por Componente",
         cluster_cols = FALSE)

# ================================Gráfico de calidad de representación (cos2)=====================#
fviz_pca_var(res.pca, col.var = "cos2", axes = c(1,2))

# =============================Análisis de outliers en espacio PCA===============================#
fviz_pca_ind(res.pca, col.ind = "cos2", 
             select.ind = list(cos2 = 0.7))

#=======================Validación cruzada del clustering con tabla estática en kable==============#


set.seed(123)  # Para reproducibilidad

# Función de estabilidad con bootstrap (usando ARI)
bootstrap_stability <- function(data, k, n_boot = 100) {
  stability_scores <- numeric(n_boot)
  original_km <- kmeans(data, k, nstart = 25)
  
  for (i in 1:n_boot) {
    boot_indices <- sample(nrow(data), replace = TRUE)
    boot_data <- data[boot_indices, ]
    boot_km <- kmeans(boot_data, k, nstart = 25)
    
    stability_scores[i] <- adjustedRandIndex(original_km$cluster[boot_indices], 
                                             boot_km$cluster)
  }
  
  return(mean(stability_scores, na.rm = TRUE))
}

# Rango de k (ajustable)
k_range <- 2:10

# Cálculo de puntajes de estabilidad
stability_scores <- sapply(k_range, function(k) {
  bootstrap_stability(pca_scores, k, n_boot = 100)  # Ajuste n_boot si necesita más/menos muestras
})

# Crear data frame para la tabla
stability_df <- data.frame(
  `Número de Clusters (k)` = k_range,
  `Puntaje de Estabilidad Promedio (ARI)` = round(stability_scores, 4)
)

# Generar tabla con kable (simple y estilizada)
kable(stability_df, 
      caption = "Estabilidad del Clustering por Número de Clusters (k)",
      align = c("c", "c"),
      booktabs = TRUE) %>%
  kable_styling(latex_options = c("striped", "hold_position"), 
                full_width = FALSE, 
                font_size = 12) %>%
  row_spec(0, bold = TRUE) %>%  # Encabezado en negrita
  add_footnote("Nota: Valores ARI más altos indican mayor estabilidad. Fuente: Cálculos propios basados en bootstrap (n = 100 muestras).")
Estabilidad del Clustering por Número de Clusters (k)
Número.de.Clusters..k. Puntaje.de.Estabilidad.Promedio..ARI.
2 0.9722
3 0.6210
4 0.6204
5 0.7239
6 0.7258
7 0.7289
8 0.7380
9 0.7880
10 0.7993
a Nota: Valores ARI más altos indican mayor estabilidad. Fuente: Cálculos propios basados en bootstrap (n = 100 muestras).
# Grafico de estabilidad del clustering

k_range <- 2:10
stability_scores <- runif(length(k_range), min = 0.4, max = 0.9)  # Placeholder; reemplace con valores reales

# Crear data frame con nombres de columnas simplificados
stability_df <- data.frame(
  k = k_range,
  stability = round(stability_scores, 4)
)

# Identificar k óptimo (mayor estabilidad)
optimal_k <- stability_df$k[which.max(stability_df$stability)]

# Generar el gráfico

ggplot(stability_df, aes(x = k, y = stability)) +
  geom_line(color = "#2E86AB", linewidth = 1.2) +
  geom_point(color = "#FC4E07", size = 3) +
  geom_vline(xintercept = optimal_k, linetype = "dashed", color = "red", linewidth = 0.8) +  # Resaltar k óptimo
  annotate("text", x = optimal_k + 0.5, y = max(stability_df$stability) * 0.9, 
           label = paste("k óptimo =", optimal_k), color = "red", angle = 90) +  # Etiqueta para k óptimo
  labs(
    title = "Estabilidad del Clustering vs. Número de Clusters (k)",
    subtitle = "Basado en Bootstrap con ARI Promedio (n = 100 muestras)",
    x = "Número de Clusters (k)",
    y = "Puntaje de Estabilidad Promedio (ARI)",
    caption = "Elaborado por William Gutierrez"  # Etiqueta solicitada
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14),
    plot.subtitle = element_text(hjust = 0.5, size = 10),
    plot.caption = element_text(hjust = 1, size = 9, face = "italic", color = "gray50"),
    axis.title = element_text(face = "bold", size = 12),
    axis.text = element_text(size = 10)
  ) +
  scale_x_continuous(breaks = stability_df$k) +
  scale_y_continuous(limits = c(0, 1))  # ARI típicamente entre 0 y 1

# Guardar el gráfico para su monografía
ggsave("estabilidad_clustering_plot.png", width = 8, height = 6, dpi = 300)


# ==========================================
# RESUMEN FINAL
# ==========================================

cat("\n===============================================================================\n")
## 
## ===============================================================================
cat("ANÁLISIS PCA COMPLETADO EXITOSAMENTE\n")
## ANÁLISIS PCA COMPLETADO EXITOSAMENTE
cat("===============================================================================\n")
## ===============================================================================
cat("RESULTADOS PRINCIPALES:\n")
## RESULTADOS PRINCIPALES:
cat("✓ Variables analizadas:", length(pca_vars), "\n")
## ✓ Variables analizadas: 14
cat("✓ Comunas incluidas:", nrow(pca_data), "\n")
## ✓ Comunas incluidas: 172
cat("✓ Componentes retenidos:", num_comp_final, "( varianza:", round(sum(eig.val$variance.percent[1:num_comp_final]), 1), "%)\n")
## ✓ Componentes retenidos: 6 ( varianza: 76.1 %)
cat("✓ Clusters identificados:", num_clusters, "( calidad:", sil_avg_final, ")\n")
## ✓ Clusters identificados: 2 ( calidad: 0.371 )
cat("✓ Validación KMO:", round(kmo_value, 3), "(", kmo_interpretation, ")\n")
## ✓ Validación KMO: 0.392 ( Inadecuado )
cat("✓ Archivos exportados en:", dir_resultados, "\n")
## ✓ Archivos exportados en: Resultados_PCA_Completo
cat("===============================================================================\n")
## ===============================================================================
cat("LISTO PARA INCORPORAR EN MONOGRAFÍA\n")
## LISTO PARA INCORPORAR EN MONOGRAFÍA
cat("===============================================================================\n")
## ===============================================================================

#Resultados:

En el procedimiento de Análisis de Componentes Principales (ACP) realizado, se aplicaron dos pruebas clave para evaluar la adecuación muestral: el Índice KMO (Kaiser-Meyer-Olkin) y la Prueba de Esfericidad de Bartlett. A continuación, se interpretan estos resultados en el contexto de la investigación:

• Índice KMO: 0.392 (considerado “Inadecuado”) (Kaiser H. &., 1974).

• Prueba de esfericidad de Bartlett: χ² (91) = 1085.2, p < 0.001 (significativo).

El criterio de Kaiser, también conocido como la regla del valor propio mayor que uno, es un método estadístico utilizado en el análisis factorial y análisis de componentes principales (PCA), un valor propio mayor que uno significa que el factor explica más varianza que una variable individual.

Esto es crucial para garantizar que los factores retenidos sean significativos y contribuyan significativamente a la estructura general de los datos (Kaiser H. F., 1960)

Pruebas de hipotesis

H₀: El autovalor del componente principal es ≤ 1, el componente no explica más varianza que una variable individual estandarizada.

H₁: El autovalor del componente principal es > 1, el componente explica más varianza que una variable individual estandarizada.

Regla de decisión:

Se rechaza H₀ cuando el autovalor es mayor que 1, indicando que el componente, explica una cantidad de varianza significativa y debe ser retenido para el análisis.

Prueba KMO: 0.392 (Estructura insuficiente)

Test Bartlett: p < 2e-16 (Correlaciones significativas)

Las correlaciones entre variables son débiles (KMO bajo), pero existen patrones significativos que justifican el análisis PCA, aunque con limitaciones reconocidas.

Patrones Identificados:

PC1 - Volumen de Actividad (21.5%)

Variable principal: n_proyectos (carga: 0.54)

Representa la intensidad de participación comunal

PC2 - Efectividad (15.3%)

Variable principal: ratio_media (carga: 0.447)

Captura la capacidad de ejecución exitosa

PC3 - Patrón Institucional 1 (12.8%)

Variable principal: prop_actor_2 (carga: -0.595)

Refleja participación de actores específicos

PC4 - Patrón Institucional 2 (10.5%)

Variable principal: prop_actor_1 (carga: -0.547)

Otro aspecto de la estructura institucional

PC5 - Estados de Culminación (8.9%)

Variable principal: prop_estado_3 (carga: 0.49)

Relacionado con fases de los proyectos

PC6 - Patrón Institucional 3 (7.0%)

Variable principal: prop_actor_3 (carga: -0.576)

Tercera dimensión institucional

Hallazgos Principales:

6 dimensiones explican el 76.1% de la variabilidad en gestión ACA

PC1 y PC2 son las dimensiones más importantes (volumen y efectividad)

Patrones institucionales emergen en múltiples componentes**

Agrupamiento territorial muestra dos perfiles diferenciados**

La gestión de proyectos ACA en Mérida se caracteriza por diferencias en volumen de actividad y efectividad, con influencia de actores institucionales específicos, aunque los patrones no están fuertemente definidos.

##Graficos interactivos

# ==========================================
# GRÁFICOS INTERACTIVOS PARA ANÁLISIS PCA
# ==========================================

## 1. SCREE PLOT INTERACTIVO
scree_interactivo <- plot_ly() %>%
  add_trace(
    x = ~1:length(eig.val$eigenvalue),
    y = ~eig.val$eigenvalue,
    type = 'scatter',
    mode = 'lines+markers',
    name = 'Eigenvalues',
    line = list(color = '#2E86AB', width = 3),
    marker = list(size = 8, color = '#2E86AB'),
    text = ~paste('Componente:', 1:length(eig.val$eigenvalue),
                  '<br>Eigenvalue:', round(eig.val$eigenvalue, 3),
                  '<br>% Varianza:', round(eig.val$variance.percent, 2), '%',
                  '<br>% Acumulado:', round(eig.val$cumulative.variance.percent, 2), '%'),
    hoverinfo = 'text'
  ) %>%
  add_trace(
    x = ~1:length(eig.val$eigenvalue),
    y = 1,
    type = 'scatter',
    mode = 'lines',
    name = 'Límite Kaiser (λ=1)',
    line = list(color = '#E74C3C', width = 2, dash = 'dash'),
    hoverinfo = 'none'
  ) %>%
  layout(
    title = list(
      text = '<b>Scree Plot Interactivo - Criterio de Selección</b>',
      font = list(size = 16)
    ),
    xaxis = list(
      title = 'Componentes Principales',
      tickvals = 1:length(eig.val$eigenvalue)
    ),
    yaxis = list(title = 'Eigenvalue'),
    hovermode = 'closest',
    showlegend = TRUE,
    annotations = list(
      list(
        x = length(eig.val$eigenvalue)/2,
        y = max(eig.val$eigenvalue) * 0.9,
        text = paste('Componentes retenidos:', num_comp_final),
        showarrow = FALSE,
        bgcolor = 'rgba(255,255,255,0.8)',
        bordercolor = '#2E86AB'
      )
    )
  )

## 2. CÍRCULO DE CORRELACIONES INTERACTIVO
# Preparar datos de variables
var_coord <- as.data.frame(res.pca$rotation[, 1:2])
var_coord$Variable <- rownames(var_coord)
var_coord$Contribucion <- (res.pca$rotation[, 1]^2 + res.pca$rotation[, 2]^2) * 100
var_coord$Cos2 <- var_coord$Contribucion / 100

circulo_correlaciones <- plot_ly() %>%
  # Círculo unitario de referencia
  add_trace(
    x = cos(seq(0, 2*pi, length.out = 100)),
    y = sin(seq(0, 2*pi, length.out = 100)),
    type = 'scatter',
    mode = 'lines',
    line = list(color = 'gray', dash = 'dot'),
    name = 'Círculo Unitario',
    hoverinfo = 'none'
  ) %>%
  # Variables
  add_trace(
    data = var_coord,
    x = ~PC1,
    y = ~PC2,
    type = 'scatter',
    mode = 'markers+text',
    text = ~Variable,
    textposition = 'top center',
    marker = list(
      size = ~Contribucion/5 + 10,
      color = ~Cos2,
      colorscale = 'Viridis',
      showscale = TRUE,
      colorbar = list(title = 'Calidad (Cos²)')
    ),
    name = 'Variables',
    textfont = list(size = 10),
    hoverinfo = 'text',
    hovertext = ~paste('<b>', Variable, '</b>',
                      '<br>PC1:', round(PC1, 3),
                      '<br>PC2:', round(PC2, 3),
                      '<br>Contribución:', round(Contribucion, 1), '%',
                      '<br>Calidad (Cos²):', round(Cos2, 3))
  ) %>%
  # Vectores desde origen
  add_trace(
    data = var_coord,
    x = ~0,
    y = ~0,
    xend = ~PC1,
    yend = ~PC2,
    type = 'scatter',
    mode = 'lines',
    line = list(color = 'rgba(100,100,100,0.3)', width = 1),
    showlegend = FALSE,
    hoverinfo = 'none'
  ) %>%
  layout(
    title = list(
      text = '<b>Círculo de Correlaciones Interactivo</b>',
      font = list(size = 16)
    ),
    xaxis = list(
      title = paste0('PC1 (', round(eig.val$variance.percent[1], 1), '%)'),
      scaleanchor = "y",
      scaleratio = 1
    ),
    yaxis = list(
      title = paste0('PC2 (', round(eig.val$variance.percent[2], 1), '%)')
    ),
    showlegend = TRUE
  )

## 3. BIPLOT INTERACTIVO CON CLUSTERS
# Preparar datos de individuos (comunas)
ind_coord <- as.data.frame(res.pca$x[, 1:2])
ind_coord$ID_COMUNA <- rownames(ind_coord)
ind_coord$Cluster <- as.factor(km_final$cluster)

# Colores para clusters
colores_clusters <- c('#E31A1C', '#1F78B4', '#33A02C', '#FF7F00', '#6A3D9A')[1:num_clusters]

biplot_interactivo <- plot_ly() %>%
  # Individuos (comunas)
  add_trace(
    data = ind_coord,
    x = ~PC1,
    y = ~PC2,
    type = 'scatter',
    mode = 'markers',
    color = ~Cluster,
    colors = colores_clusters,
    marker = list(size = 10, opacity = 0.7, line = list(width = 1, color = 'white')),
    text = ~paste('<b>Comuna:</b>', ID_COMUNA,
                  '<br><b>Cluster:</b>', Cluster,
                  '<br><b>PC1:</b>', round(PC1, 3),
                  '<br><b>PC2:</b>', round(PC2, 3)),
    hoverinfo = 'text',
    name = 'Comunas'
  ) %>%
  # Variables
  add_trace(
    data = var_coord,
    x = ~PC1 * 2,  # Escalar para mejor visualización
    y = ~PC2 * 2,
    type = 'scatter',
    mode = 'markers+text',
    text = ~Variable,
    textposition = 'middle center',
    marker = list(
      size = 8,
      color = 'black',
      symbol = 'diamond'
    ),
    textfont = list(color = 'black', size = 11),
    hoverinfo = 'text',
    hovertext = ~paste('<b>Variable:</b>', Variable,
                      '<br><b>PC1:</b>', round(PC1, 3),
                      '<br><b>PC2:</b>', round(PC2, 3)),
    name = 'Variables',
    showlegend = FALSE
  ) %>%
  # Vectores de variables
  add_trace(
    data = var_coord,
    x = ~0,
    y = ~0,
    xend = ~PC1 * 2,
    yend = ~PC2 * 2,
    type = 'scatter',
    mode = 'lines',
    line = list(color = 'rgba(0,0,0,0.5)', width = 1.5),
    showlegend = FALSE,
    hoverinfo = 'none'
  ) %>%
  layout(
    title = list(
      text = '<b>Biplot Interactivo - Comunas y Variables</b>',
      font = list(size = 16)
    ),
    xaxis = list(
      title = paste0('PC1 (', round(eig.val$variance.percent[1], 1), '%)')
    ),
    yaxis = list(
      title = paste0('PC2 (', round(eig.val$variance.percent[2], 1), '%)')
    ),
    showlegend = TRUE,
    legend = list(
      title = list(text = '<b>Cluster</b>')
    )
  )

## 4. HEATMAP INTERACTIVO DE CARGAS PCA
cargas_matrix <- as.matrix(res.pca$rotation[, 1:num_comp_final])

heatmap_cargas <- plot_ly(
  x = colnames(cargas_matrix),
  y = rownames(cargas_matrix),
  z = cargas_matrix,
  type = 'heatmap',
  colorscale = 'RdBu',
  zmid = 0,
  colorbar = list(title = 'Carga'),
  hoverinfo = 'x+y+z',
  hovertemplate = paste(
    'Variable: %{y}<br>',
    'Componente: %{x}<br>',
    'Carga: %{z:.3f}<br>',
    '<extra></extra>'
  )
) %>%
  layout(
    title = list(
      text = '<b>Heatmap de Cargas PCA</b>',
      font = list(size = 16)
    ),
    xaxis = list(title = 'Componentes Principales'),
    yaxis = list(title = 'Variables', tickangle = -30),
    margin = list(l = 150)
  )

## 5. GRÁFICO 3D INTERACTIVO DE COMPONENTES
if(num_comp_final >= 3) {
  # Preparar datos 3D
  coord_3d <- as.data.frame(res.pca$x[, 1:3])
  coord_3d$ID_COMUNA <- rownames(coord_3d)
  coord_3d$Cluster <- as.factor(km_final$cluster)
  
  plot_3d <- plot_ly(
    data = coord_3d,
    x = ~PC1,
    y = ~PC2,
    z = ~PC3,
    type = 'scatter3d',
    mode = 'markers',
    color = ~Cluster,
    colors = colores_clusters,
    marker = list(size = 5, opacity = 0.8),
    text = ~paste('<b>Comuna:</b>', ID_COMUNA,
                  '<br><b>Cluster:</b>', Cluster,
                  '<br><b>PC1:</b>', round(PC1, 3),
                  '<br><b>PC2:</b>', round(PC2, 3),
                  '<br><b>PC3:</b>', round(PC3, 3)),
    hoverinfo = 'text'
  ) %>%
  layout(
    title = list(
      text = '<b>Visualización 3D - Primeros 3 Componentes</b>',
      font = list(size = 16)
    ),
    scene = list(
      xaxis = list(title = paste0('PC1 (', round(eig.val$variance.percent[1], 1), '%)')),
      yaxis = list(title = paste0('PC2 (', round(eig.val$variance.percent[2], 1), '%)')),
      zaxis = list(title = paste0('PC3 (', round(eig.val$variance.percent[3], 1), '%)'))
    )
  )
} else {
  plot_3d <- plot_ly() %>%
    layout(
      title = list(
        text = '<b>Visualización 3D No Disponible</b>',
        font = list(size = 16)
      ),
      annotations = list(
        list(
          text = "Se requieren al menos 3 componentes para visualización 3D",
          xref = "paper", yref = "paper",
          x = 0.5, y = 0.5, xanchor = "center", yanchor = "center",
          showarrow = FALSE
        )
      )
    )
}

## 6. TABLA INTERACTIVA DE CARGAS
# Crear tabla interactiva de cargas
cargas_interactiva <- cargas_matrix %>%
  as.data.frame() %>%
  rownames_to_column("Variable") %>%
  DT::datatable(
    rownames = FALSE,
    extensions = c('Buttons', 'Scroller'),
    options = list(
      dom = 'Bfrtip',
      buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
      pageLength = 10,
      scrollX = TRUE,
      scrollY = "400px",
      scroller = TRUE
    ),
    caption = htmltools::tags$caption(
      style = 'caption-side: top; text-align: center;',
      htmltools::strong('Tabla Interactiva de Cargas PCA')
    )
  ) %>%
  DT::formatRound(columns = 2:(ncol(cargas_matrix)+1), digits = 3)

## 7. GRÁFICO DE CONTRIBUCIÓN ACUMULADA INTERACTIVO
contrib_acumulada <- plot_ly(
  x = 1:length(eig.val$cumulative.variance.percent),
  y = eig.val$cumulative.variance.percent,
  type = 'scatter',
  mode = 'lines+markers',
  line = list(color = '#27AE60', width = 3),
  marker = list(size = 8, color = '#27AE60'),
  text = ~paste('Componentes: 1-', 1:length(eig.val$cumulative.variance.percent),
                '<br>Varianza Acumulada:', round(eig.val$cumulative.variance.percent, 2), '%'),
  hoverinfo = 'text'
) %>%
  add_trace(
    x = num_comp_final,
    y = eig.val$cumulative.variance.percent[num_comp_final],
    type = 'scatter',
    mode = 'markers',
    marker = list(size = 12, color = '#E74C3C', symbol = 'star'),
    name = paste('Selección (', num_comp_final, ' comp.)'),
    text = paste('Punto de corte:<br>', num_comp_final, 'componentes<br>',
                 round(eig.val$cumulative.variance.percent[num_comp_final], 2), '% varianza'),
    hoverinfo = 'text'
  ) %>%
  layout(
    title = list(
      text = '<b>Varianza Acumulada por Componentes</b>',
      font = list(size = 16)
    ),
    xaxis = list(
      title = 'Número de Componentes',
      tickvals = 1:length(eig.val$cumulative.variance.percent)
    ),
    yaxis = list(
      title = 'Varianza Acumulada (%)',
      range = c(0, 105)
    ),
    showlegend = FALSE,
    annotations = list(
      list(
        x = num_comp_final,
        y = eig.val$cumulative.variance.percent[num_comp_final] + 5,
        text = paste(num_comp_final, 'componentes'),
        showarrow = TRUE,
        arrowhead = 4,
        arrowsize = 1,
        ax = 0,
        ay = -40
      )
    )
  )

# ==========================================
# PANEL DE CONTROL INTERACTIVO
# ==========================================

cat("### Panel de Gráficos Interactivos PCA\n\n")
## ### Panel de Gráficos Interactivos PCA
cat("A continuación se presentan los gráficos interactivos del análisis de componentes principales:\n\n")
## A continuación se presentan los gráficos interactivos del análisis de componentes principales:
# Mostrar los gráficos en orden
cat("#### 1. Scree Plot Interactivo\n")
## #### 1. Scree Plot Interactivo
scree_interactivo
cat("\n#### 2. Círculo de Correlaciones Interactivo\n")
## 
## #### 2. Círculo de Correlaciones Interactivo
circulo_correlaciones
cat("\n#### 3. Biplot Interactivo con Clusters\n")
## 
## #### 3. Biplot Interactivo con Clusters
biplot_interactivo
cat("\n#### 4. Heatmap de Cargas PCA\n")
## 
## #### 4. Heatmap de Cargas PCA
heatmap_cargas
cat("\n#### 5. Visualización 3D de Componentes\n")
## 
## #### 5. Visualización 3D de Componentes
plot_3d
cat("\n#### 6. Varianza Acumulada Interactiva\n")
## 
## #### 6. Varianza Acumulada Interactiva
contrib_acumulada
cat("\n#### 7. Tabla Interactiva de Cargas\n")
## 
## #### 7. Tabla Interactiva de Cargas
cargas_interactiva
# ==========================================
# FUNCIONES DE EXPORTACIÓN
# ==========================================

# Función para exportar gráficos interactivos
exportar_graficos_interactivos <- function() {
  dir_interactivos <- file.path(dir_resultados, "Graficos_Interactivos")
  if(!dir.exists(dir_interactivos)) {
    dir.create(dir_interactivos)
  }
  
  # Exportar como HTML
  htmlwidgets::saveWidget(
    scree_interactivo,
    file.path(dir_interactivos, "01_scree_interactivo.html")
  )
  
  htmlwidgets::saveWidget(
    circulo_correlaciones,
    file.path(dir_interactivos, "02_circulo_correlaciones.html")
  )
  
  htmlwidgets::saveWidget(
    biplot_interactivo,
    file.path(dir_interactivos, "03_biplot_interactivo.html")
  )
  
  htmlwidgets::saveWidget(
    heatmap_cargas,
    file.path(dir_interactivos, "04_heatmap_cargas.html")
  )
  
  if(num_comp_final >= 3) {
    htmlwidgets::saveWidget(
      plot_3d,
      file.path(dir_interactivos, "05_visualizacion_3d.html")
    )
  }
  
  htmlwidgets::saveWidget(
    contrib_acumulada,
    file.path(dir_interactivos, "06_varianza_acumulada.html")
  )
  
  cat("✓ Gráficos interactivos exportados en:", dir_interactivos, "\n")
}

# Ejecutar exportación (opcional)
# exportar_graficos_interactivos()

cat("\n### Instrucciones de Uso:\n")
## 
## ### Instrucciones de Uso:
cat("- **Hover**: Pase el cursor sobre puntos para ver detalles\n")
## - **Hover**: Pase el cursor sobre puntos para ver detalles
cat("- **Zoom**: Use el mouse para hacer zoom en áreas específicas\n")
## - **Zoom**: Use el mouse para hacer zoom en áreas específicas
cat("- **Selección**: Click y arrastre para seleccionar regiones\n")
## - **Selección**: Click y arrastre para seleccionar regiones
cat("- **Reset**: Doble click para resetear la vista\n")
## - **Reset**: Doble click para resetear la vista
cat("- **Descarga**: Use el menú de herramientas para descargar imágenes\n")
## - **Descarga**: Use el menú de herramientas para descargar imágenes
cat("\n### Interpretación Interactiva:\n")
## 
## ### Interpretación Interactiva:
cat("1. **Scree Plot**: Identifique componentes con eigenvalue > 1 (línea roja)\n")
## 1. **Scree Plot**: Identifique componentes con eigenvalue > 1 (línea roja)
cat("2. **Círculo de Correlaciones**: Variables cerca del círculo están bien representadas\n")
## 2. **Círculo de Correlaciones**: Variables cerca del círculo están bien representadas
cat("3. **Biplot**: Relacione comunas (puntos) con variables (vectores)\n")
## 3. **Biplot**: Relacione comunas (puntos) con variables (vectores)
cat("4. **Heatmap**: Identifique variables más influyentes en cada componente\n")
## 4. **Heatmap**: Identifique variables más influyentes en cada componente
cat("5. **3D**: Explore relaciones tridimensionales entre componentes\n")
## 5. **3D**: Explore relaciones tridimensionales entre componentes

20 Análisis territorial

# ==============================================================================
# ANÁLISIS TERRITORIAL COMPLETO Y MEJORADO - PROYECTOS ACA ESTADO MÉRIDA
# ==============================================================================

# Resolver conflictos
conflicts_prefer(dplyr::first)
conflict_prefer("select", "dplyr")
conflict_prefer("filter", "dplyr")

# ==============================================================================
# FASE 1: CONFIGURACIÓN ESTÉTICA PROFESIONAL
# ==============================================================================

# Tema cartográfico profesional mejorado
tema_mapa_profesional <- theme_void() +
  theme(
    plot.title = element_text(size = 18, face = "bold", hjust = 0.5, 
                             color = "#2c3e50", margin = margin(b = 15)),
    plot.subtitle = element_text(size = 14, hjust = 0.5, color = "#34495e", 
                                margin = margin(b = 20)),
    plot.caption = element_text(size = 11, hjust = 1, color = "#7f8c8d", 
                               margin = margin(t = 15)),
    legend.position = "right",
    legend.title = element_text(face = "bold", size = 12, color = "#2c3e50"),
    legend.text = element_text(size = 11, color = "#34495e"),
    legend.key.size = unit(1.2, "cm"),
    legend.margin = margin(l = 20),
    panel.background = element_rect(fill = "#f8f9fa", color = NA),
    plot.background = element_rect(fill = "white", color = NA),
    plot.margin = margin(25, 25, 25, 25),
    # Mejora para los elementos de escala y norte
    axis.title = element_blank(),
    axis.text = element_blank(),
    axis.ticks = element_blank()
  )

# Paleta de colores sofisticada y consistente
colores_estado_merida <- c(
  "Urbana" = "#1f77b4",           # Azul institucional
  "Rural" = "#d62728",            # Rojo terroso
  "Mixta" = "#ff7f0e",            # Naranja vibrante
  "En construcción" = "#2ca02c",  # Verde progreso
  "No especificado" = "#9467bd"   # Púrpura neutro
)

# Función para bordes del estado más visibles
crear_borde_estado <- function(shapefile_estado) {
  geom_sf(data = shapefile_estado, 
          fill = NA, 
          color = "#34495e", 
          size = 1.2, 
          linetype = "solid")
}

# ==============================================================================
# FASE 2: CARGA Y PREPARACIÓN DE DATOS MEJORADA
# ==============================================================================

cat("================================================================================\n")
## ================================================================================
cat("INICIANDO ANÁLISIS TERRITORIAL INTEGRAL - VERSIÓN MEJORADA\n")
## INICIANDO ANÁLISIS TERRITORIAL INTEGRAL - VERSIÓN MEJORADA
cat("================================================================================\n")
## ================================================================================
# Cargar todos los shapefiles con verificación
cat("Cargando shapefiles del Estado Mérida...\n")
## Cargando shapefiles del Estado Mérida...
# 1. Parroquias (base principal)
parroquias_sf <- st_read("C:/Users/william/Desktop/monografia aca merida/datos/MERIDA/DPT_PARROQUIAl/merida.shx", quiet = TRUE)
cat("✓ Parroquias cargadas:", nrow(parroquias_sf), "registros\n")
## ✓ Parroquias cargadas: 86 registros
# 2. Municipios
municipios_sf <- st_read("C:/Users/william/Desktop/monografia aca merida/datos/MERIDA/DPT_MUNICIPAL/merida_mun.shx", quiet = TRUE)
cat("✓ Municipios cargados:", nrow(municipios_sf), "registros\n")
## ✓ Municipios cargados: 23 registros
# 3. Centros poblados
centros_sf <- st_read("C:/Users/william/Desktop/monografia aca merida/datos/MERIDA/merida.shx", quiet = TRUE)
cat("✓ Centros poblados cargados:", nrow(centros_sf), "registros\n")
## ✓ Centros poblados cargados: 86 registros
# 4. Estado completo (para bordes)
estados_sf <- st_read("C:/Users/william/Desktop/monografia aca merida/datos/MERIDA/DPT_ESTADO/vzla_estados.shx", quiet = TRUE)
merida_estado <- estados_sf %>% filter(ESTADO == "MERIDA")
cat("✓ Límites estatales cargados\n")
## ✓ Límites estatales cargados
# Preparar datos de proyectos con mejoras
df_raw$COD_UBIGEO <- as.character(df_raw$COD_UBIGEO)

# Clasificación mejorada de tipos de comuna
df_raw <- df_raw %>%
  mutate(
    Tipo_Comuna = case_when(
      str_detect(COD_CC, "C-URB") ~ "Urbana",
      str_detect(COD_CC, "C-RUR") ~ "Rural", 
      str_detect(COD_CC, "C-MIX") ~ "Mixta",
      str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{4}$") ~ "En construcción",
      str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{2}") ~ "En construcción",
      str_detect(COD_CC, "^CEC") ~ "En construcción",
      TRUE ~ "No especificado"
    ),
    # Variables auxiliares para análisis territorial
    Codigo_Municipal = str_sub(COD_UBIGEO, 1, 4),
    Intensidad_Proyectos = case_when(
      n_proyectos >= 4 ~ "Alta (4+)",
      n_proyectos == 3 ~ "Media (3)",
      n_proyectos <= 2 ~ "Baja (≤2)"
    ),
    Efectividad_Categoria = case_when(
      RATIO_ACA_PROYECTO_CULMINADO >= 4 ~ "Muy Alta",
      RATIO_ACA_PROYECTO_CULMINADO == 3 ~ "Alta",
      RATIO_ACA_PROYECTO_CULMINADO == 2 ~ "Media", 
      RATIO_ACA_PROYECTO_CULMINADO == 1 ~ "Baja"
    )
  )

# ==============================================================================
# FASE 3: MAPAS BÁSICOS MEJORADOS CON BORDES DEL ESTADO
# ==============================================================================

cat("\n--- CREANDO MAPAS BÁSICOS MEJORADOS ---\n")
## 
## --- CREANDO MAPAS BÁSICOS MEJORADOS ---
# Unión principal con estadísticas mejoradas
parroquias_proyectos <- parroquias_sf %>%
  left_join(df_raw, by = c("ID" = "COD_UBIGEO")) %>%
  # Agregar estadísticas por parroquia
  group_by(ID) %>%
  mutate(
    proyectos_parroquia = n(),
    diversidad_tipologias = n_distinct(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, na.rm = TRUE),
    ratio_promedio = mean(RATIO_ACA_PROYECTO_CULMINADO, na.rm = TRUE)
  ) %>%
  ungroup()

# MAPA 1: Distribución de proyectos con bordes mejorados
mapa_distribucion_pro <- ggplot() +
  # Base: Parroquias con proyectos
  geom_sf(data = parroquias_proyectos, 
          aes(fill = n_proyectos), 
          color = "white", 
          size = 0.2) +
  # Borde del Estado Mérida más visible
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5, 
          linetype = "solid") +
  # Escala de colores mejorada
  scale_fill_viridis_c(
    name = "N° Proyectos\nACA",
    option = "plasma",
    na.value = "grey95",
    trans = "sqrt",
    breaks = pretty_breaks(n = 5),
    labels = function(x) round(x, 0),
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1.5,
      barheight = 12,
      frame.colour = "#34495e",
      frame.linewidth = 0.5
    )
  ) +
  # Elementos cartográficos mejorados
  annotation_scale(
    location = "br", 
    width_hint = 0.3,
    text_cex = 1.1,
    text_face = "bold",
    text_col = "#2c3e50",
    bar_cols = c("#2c3e50", "white")
  ) +
  annotation_north_arrow(
    location = "tl", 
    style = north_arrow_fancy_orienteering,
    height = unit(1.8, "cm"), 
    width = unit(1.8, "cm")
  ) +
  labs(
    title = "Distribución Territorial de Proyectos ACA",
    subtitle = "Estado Mérida por Parroquia (2019-2025) • Análisis de Cobertura Territorial",
    caption = "Fuente: Elaboración propia • William A. Gutiérrez V. • Datos: Agendas Concretas de Acción"
  ) +
  tema_mapa_profesional

print(mapa_distribucion_pro)

# MAPA 2: Efectividad territorial con mejoras
mapa_efectividad_pro <- ggplot() +
  geom_sf(data = parroquias_proyectos, 
          aes(fill = RATIO_ACA_PROYECTO_CULMINADO), 
          color = "white", 
          size = 0.2) +
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5) +
  scale_fill_gradient2(
    name = "Ratio de\nEfectividad",
    low = "#d73027", 
    mid = "#fee08b", 
    high = "#1a9850",
    midpoint = 2.5,
    na.value = "grey95",
    breaks = 1:4,
    labels = c("Baja (1)", "Media (2)", "Alta (3)", "Muy Alta (4)"),
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1.5,
      barheight = 12,
      frame.colour = "#34495e",
      frame.linewidth = 0.5
    )
  ) +
  annotation_scale(location = "br", width_hint = 0.3, text_cex = 1.1, text_face = "bold") +
  annotation_north_arrow(location = "tl", style = north_arrow_fancy_orienteering,
                         height = unit(1.8, "cm"), width = unit(1.8, "cm")) +
  labs(
    title = "Efectividad Territorial de Proyectos ACA",
    subtitle = "Ratio de Culminación por Parroquia • Análisis de Resultados",
    caption = "Fuente: Elaboración propia • William A. Gutiérrez V. • Escala: 1 (Baja) a 4 (Muy Alta)"
  ) +
  tema_mapa_profesional

print(mapa_efectividad_pro)

# MAPA 3: Tipos de comuna con estadísticas integradas
mapa_tipos_comuna_pro <- ggplot() +
  geom_sf(data = parroquias_proyectos %>% filter(!is.na(Tipo_Comuna)), 
          aes(fill = Tipo_Comuna), 
          color = "white", 
          size = 0.2) +
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5) +
  scale_fill_manual(
    name = "Tipo de\nComuna",
    values = colores_estado_merida,
    na.value = "grey95",
    guide = guide_legend(
      title.position = "top",
      keywidth = unit(1.5, "cm"),
      keyheight = unit(1, "cm"),
      override.aes = list(size = 0)
    )
  ) +
  annotation_scale(location = "br", width_hint = 0.3, text_cex = 1.1, text_face = "bold") +
  annotation_north_arrow(location = "tl", style = north_arrow_fancy_orienteering,
                         height = unit(1.8, "cm"), width = unit(1.8, "cm")) +
  labs(
    title = "Clasificación Territorial de Comunas",
    subtitle = "Tipología Organizacional del Estado Mérida • Análisis Institucional",
    caption = "Fuente: Elaboración propia • Clasificación basada en códigos de comuna"
  ) +
  tema_mapa_profesional

print(mapa_tipos_comuna_pro)

# ==============================================================================
# FASE 4: MAPAS AVANZADOS Y ANÁLISIS MULTI-ESCALA
# ==============================================================================

cat("\n--- CREANDO MAPAS AVANZADOS ---\n")
## 
## --- CREANDO MAPAS AVANZADOS ---
# MAPA 4: Análisis municipal con población
datos_municipales <- df_raw %>%
  mutate(Codigo_Municipal = str_sub(COD_UBIGEO, 1, 4)) %>%
  group_by(Codigo_Municipal) %>%
  summarise(
    total_proyectos = n(),
    total_comunas = n_distinct(ID_COMUNA),
    ratio_promedio = mean(RATIO_ACA_PROYECTO_CULMINADO, na.rm = TRUE),
    tipo_comuna_dominante = names(sort(table(Tipo_Comuna), decreasing = TRUE))[1],
    .groups = "drop"
  )

municipios_enriquecidos <- municipios_sf %>%
  left_join(datos_municipales, by = c("ID_MUNICIP" = "Codigo_Municipal"))

mapa_municipal_pro <- ggplot() +
  geom_sf(data = municipios_enriquecidos, 
          aes(fill = total_proyectos), 
          color = "white", 
          size = 0.4) +
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5) +
  geom_sf_text(data = municipios_enriquecidos %>% filter(!is.na(total_proyectos)), 
               aes(label = str_wrap(FIRST_MUNI, 12)), 
               size = 3, color = "#2c3e50", fontface = "bold",
               check_overlap = TRUE) +
  scale_fill_gradient2(
    name = "Proyectos\nACA",
    low = "#eff3ff", 
    mid = "#6baed6", 
    high = "#08519c",
    midpoint = median(municipios_enriquecidos$total_proyectos, na.rm = TRUE),
    na.value = "grey95",
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1.5,
      barheight = 12
    )
  ) +
  annotation_scale(location = "br", width_hint = 0.3, text_cex = 1.1, text_face = "bold") +
  annotation_north_arrow(location = "tl", style = north_arrow_fancy_orienteering,
                         height = unit(1.8, "cm"), width = unit(1.8, "cm")) +
  labs(
    title = "Distribución Municipal de Proyectos ACA",
    subtitle = "Análisis Regional • 23 Municipios del Estado Mérida",
    caption = "Fuente: Elaboración propia • Incluye nombres municipales para referencia geográfica"
  ) +
  tema_mapa_profesional

print(mapa_municipal_pro)

# MAPA 5: Mapa de densidad con centros poblados
centros_con_datos <- centros_sf %>%
  mutate(
    COD_PARROQUIA = str_pad(str_sub(as.character(CODIGO_CP), 1, 6), 6, pad = "0")
  ) %>%
  left_join(
    parroquias_proyectos %>% 
      st_drop_geometry() %>%
      group_by(ID) %>%
      summarise(
        proyectos_parroquia = first(n_proyectos),
        efectividad_parroquia = first(RATIO_ACA_PROYECTO_CULMINADO),
        tipo_comuna_parroquia = first(Tipo_Comuna),
        .groups = "drop"
      ),
    by = c("COD_PARROQUIA" = "ID")
  ) %>%
  filter(!is.na(proyectos_parroquia))

mapa_densidad_pro <- ggplot() +
  geom_sf(data = parroquias_proyectos, 
          aes(fill = n_proyectos), 
          color = "white", 
          size = 0.1, 
          alpha = 0.7) +
  geom_sf(data = centros_con_datos, 
          aes(size = proyectos_parroquia, 
              color = efectividad_parroquia), 
          alpha = 0.8) +
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5) +
  scale_fill_viridis_c(
    name = "Proyectos\n(Base)",
    option = "plasma",
    na.value = "grey95",
    trans = "sqrt",
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1,
      barheight = 8
    )
  ) +
  scale_size_continuous(
    name = "Intensidad\n(Puntos)",
    range = c(1, 4),
    guide = guide_legend(
      title.position = "top",
      override.aes = list(color = "#2c3e50")
    )
  ) +
  scale_color_gradient2(
    name = "Efectividad\n(Color)",
    low = "#d73027", 
    mid = "#fee08b", 
    high = "#1a9850",
    midpoint = 2.5,
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1,
      barheight = 8
    )
  ) +
  annotation_scale(location = "br", width_hint = 0.25, text_cex = 1, text_face = "bold") +
  annotation_north_arrow(location = "tl", style = north_arrow_fancy_orienteering,
                         height = unit(1.5, "cm"), width = unit(1.5, "cm")) +
  labs(
    title = "Análisis Multi-escala: Parroquias y Centros Poblados",
    subtitle = "Densidad Territorial • Doble Representación Espacial",
    caption = "Fuente: Elaboración propia • Base: Parroquias, Overlay: Centros poblados"
  ) +
  tema_mapa_profesional +
  theme(legend.box = "vertical")

print(mapa_densidad_pro)

# ==============================================================================
# FASE 5: MAPAS COMPLEMENTARIOS CON NUEVOS ANÁLISIS
# ==============================================================================

# MAPA 6: Diversidad de tipologías por territorio
diversidad_parroquial <- parroquias_proyectos %>%
  st_drop_geometry() %>%
  filter(!is.na(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG)) %>%
  group_by(ID, PARROQUIA, MUNICIPIO) %>%
  summarise(
    n_proyectos = n(),
    diversidad_tipologias = n_distinct(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG),
    shannon_tipologia = vegan::diversity(table(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG)),
    tipologia_principal = names(sort(table(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG), 
                                   decreasing = TRUE))[1],
    .groups = "drop"
  )

parroquias_diversidad <- parroquias_sf %>%
  left_join(diversidad_parroquial, by = "ID")

mapa_diversidad_pro <- ggplot() +
  geom_sf(data = parroquias_diversidad, 
          aes(fill = shannon_tipologia), 
          color = "white", 
          size = 0.2) +
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5) +
  scale_fill_viridis_c(
    name = "Diversidad\nShannon\n(H')",
    option = "cividis",
    na.value = "grey95",
    breaks = pretty_breaks(n = 5),
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1.5,
      barheight = 12
    )
  ) +
  annotation_scale(location = "br", width_hint = 0.3, text_cex = 1.1, text_face = "bold") +
  annotation_north_arrow(location = "tl", style = north_arrow_fancy_orienteering,
                         height = unit(1.8, "cm"), width = unit(1.8, "cm")) +
  labs(
    title = "Diversidad de Nudos Críticos por Territorio",
    subtitle = "Índice de Shannon para Tipologías CFG • Análisis de Variedad Temática",
    caption = "Fuente: Elaboración propia • Valores altos = mayor diversidad problemática"
  ) +
  tema_mapa_profesional

print(mapa_diversidad_pro)

# ==============================================================================
# FASE 6: PANEL INTEGRADO Y COMPARATIVO
# ==============================================================================

cat("\n--- CREANDO PANEL COMPARATIVO FINAL ---\n")
## 
## --- CREANDO PANEL COMPARATIVO FINAL ---
# Crear panel de 2x3 con los mejores mapas
panel_territorial <- (mapa_distribucion_pro + mapa_efectividad_pro) / 
                    (mapa_tipos_comuna_pro + mapa_municipal_pro) /
                    (mapa_densidad_pro + mapa_diversidad_pro)

panel_territorial <- panel_territorial + 
  plot_annotation(
    title = "ANÁLISIS TERRITORIAL INTEGRAL - PROYECTOS ACA ESTADO MÉRIDA",
    subtitle = "Distribución, Efectividad, Tipologías y Análisis Multi-escala",
    caption = "Elaboración: William A. Gutiérrez V. | Fuente: Agendas Concretas de Acción 2019-2025",
    theme = theme(
      plot.title = element_text(size = 20, face = "bold", hjust = 0.5, color = "#2c3e50"),
      plot.subtitle = element_text(size = 16, hjust = 0.5, color = "#34495e"),
      plot.caption = element_text(size = 12, hjust = 1, color = "#7f8c8d")
    )
  )

print(panel_territorial)

# ==============================================================================
# FASE 7: ESTADÍSTICAS Y RESUMEN FINAL
# ==============================================================================

cat("\n--- GENERANDO ESTADÍSTICAS TERRITORIALES ---\n")
## 
## --- GENERANDO ESTADÍSTICAS TERRITORIALES ---
# Estadísticas comprehensivas
estadisticas_territoriales <- list(
  cobertura_general = parroquias_proyectos %>%
    st_drop_geometry() %>%
    summarise(
      total_parroquias = n_distinct(ID),
      parroquias_con_proyectos = sum(!is.na(n_proyectos)),
      cobertura_pct = round(parroquias_con_proyectos / total_parroquias * 100, 1),
      total_proyectos = sum(n_proyectos, na.rm = TRUE)
    ),
  
  por_tipo_comuna = parroquias_proyectos %>%
    st_drop_geometry() %>%
    filter(!is.na(Tipo_Comuna)) %>%
    group_by(Tipo_Comuna) %>%
    summarise(
      n_parroquias = n_distinct(ID),
      total_proyectos = n(),
      proyectos_promedio = round(mean(n_proyectos, na.rm = TRUE), 2),
      efectividad_promedio = round(mean(RATIO_ACA_PROYECTO_CULMINADO, na.rm = TRUE), 2),
      .groups = "drop"
    ),
  
  ranking_parroquias = parroquias_proyectos %>%
    st_drop_geometry() %>%
    filter(!is.na(n_proyectos)) %>%
    arrange(desc(n_proyectos)) %>%
    head(10) %>%
    select(PARROQUIA, MUNICIPIO, n_proyectos, RATIO_ACA_PROYECTO_CULMINADO, Tipo_Comuna)
)

# Mostrar estadísticas
cat("\n=== RESUMEN ESTADÍSTICO TERRITORIAL ===\n")
## 
## === RESUMEN ESTADÍSTICO TERRITORIAL ===
cat("Cobertura:", estadisticas_territoriales$cobertura_general$cobertura_pct, "%\n")
## Cobertura: 216.3 %
cat("Proyectos totales:", estadisticas_territoriales$cobertura_general$total_proyectos, "\n")
## Proyectos totales: 694
print(estadisticas_territoriales$por_tipo_comuna)
## # A tibble: 4 × 5
##   Tipo_Comuna     n_parroquias total_proyectos proyectos_promedio
##   <chr>                  <int>           <int>              <dbl>
## 1 En construcción           14              64               3.59
## 2 Mixta                     15              77               3.81
## 3 Rural                      6              30               3.8 
## 4 Urbana                     5              15               3.8 
## # ℹ 1 more variable: efectividad_promedio <dbl>
print(estadisticas_territoriales$ranking_parroquias)
## # A tibble: 10 × 5
##    PARROQUIA            MUNICIPIO n_proyectos RATIO_ACA_PROYECTO_C…¹ Tipo_Comuna
##    <chr>                <chr>           <dbl>                  <dbl> <chr>      
##  1 PRESIDENTE BETANCOU… ALBERTO …           4                      1 Mixta      
##  2 PRESIDENTE BETANCOU… ALBERTO …           4                      1 Mixta      
##  3 PRESIDENTE BETANCOU… ALBERTO …           4                      1 Mixta      
##  4 PRESIDENTE BETANCOU… ALBERTO …           4                      4 Urbana     
##  5 PRESIDENTE BETANCOU… ALBERTO …           4                      4 Urbana     
##  6 PRESIDENTE BETANCOU… ALBERTO …           4                      4 Urbana     
##  7 PRESIDENTE BETANCOU… ALBERTO …           4                      1 Rural      
##  8 PRESIDENTE BETANCOU… ALBERTO …           4                      4 Rural      
##  9 PRESIDENTE BETANCOU… ALBERTO …           4                      1 Rural      
## 10 PRESIDENTE PAEZ      ALBERTO …           4                      3 En constru…
## # ℹ abbreviated name: ¹​RATIO_ACA_PROYECTO_CULMINADO
# Exportar mapas mejorados
ggsave("mapa_01_distribucion_profesional.png", mapa_distribucion_pro, 
       width = 14, height = 11, dpi = 300, bg = "white")
ggsave("mapa_02_efectividad_profesional.png", mapa_efectividad_pro, 
       width = 14, height = 11, dpi = 300, bg = "white")
ggsave("mapa_03_tipos_comuna_profesional.png", mapa_tipos_comuna_pro, 
       width = 14, height = 11, dpi = 300, bg = "white")
ggsave("mapa_04_municipal_profesional.png", mapa_municipal_pro, 
       width = 14, height = 11, dpi = 300, bg = "white")
ggsave("mapa_05_densidad_profesional.png", mapa_densidad_pro, 
       width = 16, height = 12, dpi = 300, bg = "white")
ggsave("mapa_06_diversidad_profesional.png", mapa_diversidad_pro, 
       width = 14, height = 11, dpi = 300, bg = "white")
ggsave("panel_territorial_completo.png", panel_territorial, 
       width = 24, height = 18, dpi = 300, bg = "white")

cat("\n================================================================================\n")
## 
## ================================================================================
cat("ANÁLISIS TERRITORIAL PROFESIONAL COMPLETADO EXITOSAMENTE\n")
## ANÁLISIS TERRITORIAL PROFESIONAL COMPLETADO EXITOSAMENTE
cat("================================================================================\n")
## ================================================================================
cat("MAPAS GENERADOS:\n")
## MAPAS GENERADOS:
cat("1. Distribución territorial con bordes mejorados\n")
## 1. Distribución territorial con bordes mejorados
cat("2. Efectividad territorial con escala mejorada\n") 
## 2. Efectividad territorial con escala mejorada
cat("3. Tipos de comuna con colores profesionales\n")
## 3. Tipos de comuna con colores profesionales
cat("4. Análisis municipal con etiquetas\n")
## 4. Análisis municipal con etiquetas
cat("5. Análisis multi-escala (parroquias + centros)\n")
## 5. Análisis multi-escala (parroquias + centros)
cat("6. Diversidad de tipologías (Shannon)\n")
## 6. Diversidad de tipologías (Shannon)
cat("7. Panel territorial integrado (2x3)\n")
## 7. Panel territorial integrado (2x3)
cat("================================================================================\n")
## ================================================================================

Estoy creando un HTML a través de R Markdown para la exposición de mis pasantías, de mis resultados de la tesis monografía que desarrolle, me puedes ayudar a plantear la sección de analisis territorial para colocarla en ese HTML que será mi instrumento para la exposición, como podría construir digamos ese analisis territorial , viendo el código y viendo el texto que los interpreta, para hacerlo en ese HTML y que pueda expresar lo mas interesante que conseguí en la tesis monografica, puedes ayudarme a interpretar de forma concisa este analisis territorial , estoy planteando así las diapositivas digamos en el html, presento una introducción corta, las graficas interactivas junto con las tablas, e interpreto los resultados concisos como para una diapositiva, me puedes ayudar con ese analisis territorial, este es mi codigo con imagenes fijas, quiero darte ademas la estructura de los shapefile, para mejorar los mapas interactivos o cualquier optimización:

##Mapas interactivos

Síntesis de Resultados

Distribución desigual: 65% de proyectos concentrados en 30% del territorio, principalmente en eje urbano Mérida-Ejido

Efectividad diferenciada: Comunas urbanas muestran 40% mayor efectividad que rurales

Diversidad correlacionada: Mayor número de proyectos = mayor diversidad tipológica (ρ = 0.82 en zonas mixtas)

Segmentación territorial clara: Urbano (alta densidad), Rural (enfoque específico), Mixto (comportamiento intermedio)

Brecha de planificación: Correlación perfecta diagnóstico-gestión en electricidad (ρ = 1.0) vs desconexión en otros sectores

Patrón centro-periferia: Disminución progresiva de proyectos desde núcleos urbanos hacia áreas rurales

Oportunidad réplica: Modelos exitosos en comunas mixtas pueden escalarse a contextos similares

Priorización necesaria: 4 tipologías concentran 62.6% de nudos críticos, indicando focos de intervención

Eficiencia territorial: Zonas con clusters de centros poblados muestran mejor coordinación institucional

Política diferenciada: Urge adaptar estrategias por tipo comuna para maximizar impacto

## Iniciando preparación de datos espaciales...
## ✓ Parroquias transformadas a WGS84 y textos limpiados
## ✓ Municipios transformados a WGS84 y textos limpiados
## ✓ Centros poblados transformados a WGS84 y textos limpiados
## ✓ Estado Mérida transformado a WGS84
## ✓ Todos los shapefiles transformados a WGS84 correctamente
## Preparando datos para mapas interactivos...
## ✓ Datos preparados para mapas interactivos
## Creando Mapa 1: Distribución territorial...
## Rango de proyectos por parroquia: 0 - 20
## Creando Mapa 2: Efectividad y diversidad...
## Creando Mapa 3: Tipos de comuna...
## Tipos de comuna encontrados: Rural, Mixta, En construccion, Urbana
## Mostrando resultados...
## ### Mapa 1: Distribución Territorial
## ### Mapa 2: Efectividad y Diversidad
## ### Mapa 3: Tipos de Comuna
## ### Resumen Estadístico del Análisis
Resumen General del Análisis de Agendas Concretas de Acción - Estado Mérida 2019-2025
Métrica Valor
Total Proyectos Analizados 198.00
Comunas Evaluadas 59.00
Parroquias con Proyectos 30.00
Efectividad Promedio General 2.26
Tipologías Diferentes Identificadas 16.00
Municipios Involucrados 13.00
## 
## --- ANÁLISIS COMPLETADO ---
## Se han generado 3 mapas interactivos
