1 Introducción: Contexto y Alcance

El feminicidio representa la manifestación más extrema de la violencia de género. Este informe tiene como objetivo analizar la correlación estadística entre el número de feminicidios y otros delitos relacionados (delitos sexuales, violencia intrafamiliar, homicidios generales y suicidios) a nivel departamental en Colombia, enfocándose exclusivamente en las víctimas mujeres. Utilizamos el Coeficiente de Correlación de Pearson para establecer la fuerza y dirección de estas relaciones, complementado con análisis descriptivos clave sobre el perfil de la víctima y la ejecución del delito. El análisis se centra en la data de hechos ocurridos en el periodo 2024-2025 y las proyecciones poblacionales correspondientes, asegurando la temporalidad de los datos.


2 Marco Teórico

2.1 Introducción

Para interpretar correctamente las correlaciones estadísticas presentadas en este informe, es fundamental comprender el marco conceptual que sustenta el análisis de la violencia de género y el feminicidio en Colombia. Este marco se estructura en cuatro pilares teóricos que explican tanto la naturaleza del delito como los patrones identificados en los datos.

Navegue por las pestañas para explorar cada componente teórico.

2.1.0.1 Contexto del Marco Teórico

Este análisis estadístico se fundamenta en teorías consolidadas sobre violencia de género que permiten interpretar las correlaciones numéricas más allá de simples asociaciones matemáticas. Los cuatro pilares teóricos presentados explican:

  • Por qué el feminicidio es un delito distinto del homicidio común
  • Cómo la violencia escala progresivamente (continuum)
  • Dónde ocurre principalmente (contexto íntimo)
  • Cuáles son los factores multinivel que influyen (enfoque ecológico)

2.1.0.2 Hipótesis Central del Estudio

Hipótesis: Existe una correlación positiva fuerte entre la Violencia Intrafamiliar (VIF) y el Feminicidio a nivel departamental, dado que la VIF actúa como un precursor estadísticamente significativo y una señal de alerta temprana del riesgo feminicida, validando empíricamente la teoría del continuum de la violencia de género.

Esta hipótesis será validada mediante el Coeficiente de Correlación de Pearson en la Sección 5 del presente informe.

2.3 2. Teoría del Continuum

2.3.0.1 Fundamento Teórico: Liz Kelly

La socióloga Liz Kelly propone el concepto de continuum de violencia sexual y de género, argumentando que las diferentes formas de violencia contra las mujeres no son eventos aislados, sino manifestaciones de un mismo fenómeno estructural.

2.3.0.1.1 Principios del Continuum:
  1. Espectro de Severidad: La violencia de género existe en un rango que va desde formas “sutiles” hasta letales
  2. Escalada Progresiva: Las formas “menores” de violencia pueden escalar hacia formas más graves
  3. Interconexión: El feminicidio raramente es un evento repentino o aislado; es precedido por señales de alerta

2.3.0.2 El Ciclo de la Violencia: Lenore Walker

Lenore Walker complementa esta teoría con su modelo del “Ciclo de la Violencia”, que describe tres fases recurrentes en las relaciones violentas:

Fase 1 - Acumulación de Tensión: - Incremento gradual de hostilidad - Agresiones verbales y psicológicas - Control y aislamiento progresivo

Fase 2 - Explosión Violenta: - Episodio agudo de violencia física - Pérdida aparente de control del agresor - Daño físico significativo a la víctima

Fase 3 - Luna de Miel: - Arrepentimiento temporal del agresor - Promesas de cambio y reconciliación - Refuerzo del vínculo emocional

2.3.0.2.1 Característica Crítica del Ciclo:

Walker demostró empíricamente que este ciclo tiende a: - Acelerarse con el tiempo (intervalos más cortos entre episodios) - Agravarse en severidad (violencia más intensa en cada ciclo) - Minimizar la fase de luna de miel hasta desaparecer

2.3.0.3 Vinculación con los Hallazgos Estadísticos

La correlación fuerte y positiva encontrada en este estudio entre Violencia Intrafamiliar (VIF) y Feminicidio valida empíricamente estas teorías.

Evidencia cuantitativa del continuum:

  • A mayor volumen de denuncias por VIF en un departamento, mayor es la probabilidad estadística de feminicidios
  • La VIF actúa como un indicador de alerta temprana del riesgo feminicida
  • Los departamentos con alta VIF que implementan intervenciones efectivas pueden interrumpir el continuum

Interpretación de Outliers:

Los departamentos que se desvían de la tendencia lineal pueden indicar:

  • Alta VIF + Bajos Feminicidios: Intervención estatal efectiva o subregistro del delito
  • Alta VIF + Altos Feminicidios: Falla en los mecanismos de protección o escalada acelerada

2.4 3. Feminicidio Íntimo

2.4.0.1 Tipología del Feminicidio

El feminicidio puede clasificarse según la relación entre víctima y agresor:

2.4.0.1.1 Feminicidio Íntimo

Definición: Perpetrado por parejas, exparejas o personas con las que la víctima mantuvo relaciones sentimentales o sexuales.

Datos globales (OMS): Más del 35% de los homicidios de mujeres a nivel mundial son cometidos por su pareja íntima, una proporción significativamente mayor que en los homicidios de hombres.

Características distintivas: - Ocurre en el ámbito privado (hogar) - Precedido por historia de violencia doméstica - Motivado por celos, posesión o ruptura de la relación

2.4.0.1.2 Feminicidio No Íntimo

Definición: Cometido por agresores sin vínculo sentimental con la víctima.

Contextos frecuentes: - Violencia sexual por desconocidos - Criminalidad organizada - Trata de personas - Conflicto armado

2.4.0.2 La Teoría del Poder y Control

La Rueda del Poder y Control, desarrollada por el Domestic Abuse Intervention Project de Duluth, Minnesota, explica que la violencia de pareja no es resultado de “pérdida de control” sino de una estrategia deliberada para mantener dominación sobre la víctima.

2.4.0.2.1 Tácticas de Control Identificadas:
  1. Intimidación: Miradas, gestos, destrucción de objetos, maltrato de mascotas
  2. Abuso Emocional: Humillaciones, insultos, hacer sentir culpable
  3. Aislamiento: Controlar contactos, salidas, comunicaciones
  4. Minimización y Negación: Restar importancia a la violencia, culpar a la víctima
  5. Uso de los Hijos: Amenazas de quitarle los hijos, uso como mensajeros
  6. Control Económico: Impedirle trabajar, control total de recursos
  7. Privilegio Masculino: Tratarla como sirvienta, tomar decisiones unilaterales
  8. Coerción y Amenazas: Amenazas de violencia, suicidio, denuncia ante autoridades

2.4.0.3 Evidencia en los Datos de Este Estudio

El análisis del “Presunto Agresor” revela que la mayoría de los feminicidios en Colombia son cometidos por parejas o exparejas, confirmando la predominancia del feminicidio íntimo.

2.4.0.3.1 Mecanismo Causal y Significado Criminológico

El análisis del “Mecanismo Causal” muestra el uso frecuente de: - Armas cortopunzantes (cuchillos, machetes) - Asfixia (estrangulamiento) - Golpes contundentes

Estos métodos denotan:

  1. Violencia “cuerpo a cuerpo” de naturaleza personal
  2. Intencionalidad específica de causar sufrimiento prolongado
  3. Acceso y cercanía característica de relaciones de intimidad
  4. Componente pasional o de “castigo” vinculado a la relación

Contraste con homicidios masculinos:

Los homicidios de hombres típicamente involucran: - Armas de fuego - Espacios públicos (calles, bares) - Agresores desconocidos o con conflictos puntuales

Esta diferencia refuerza la naturaleza específica del feminicidio como violencia de género.

2.5 4. Enfoque Ecológico

2.5.0.1 El Modelo Ecológico de Bronfenbrenner

Urie Bronfenbrenner propuso un modelo de análisis de los fenómenos sociales en múltiples niveles concéntricos de influencia. Este modelo fue adaptado por Lori Heise para explicar específicamente la violencia de género.

2.5.0.2 Los Cuatro Niveles del Modelo Ecológico Aplicado al Feminicidio

2.5.0.2.1 Nivel 1: Microsistema (Individual)

Factores personales de víctima y agresor:

Del agresor: - Historia personal de violencia (testigo o víctima en infancia) - Abuso de sustancias (alcohol, drogas) - Trastornos de personalidad o salud mental - Creencias de superioridad masculina - Baja autoestima y necesidad de control

De la víctima: - Historia previa de violencia - Dependencia económica del agresor - Aislamiento social - Baja autoestima producto de la violencia

2.5.0.2.2 Nivel 2: Mesosistema (Relacional)

Dinámica de la relación de pareja:

  • Conflictos por dinero, celos, infidelidad
  • Desequilibrios de poder (edad, educación, recursos)
  • Historia de violencia en la relación
  • Procesos de separación o ruptura (momento de mayor riesgo)
  • Control reproductivo y sexual
2.5.0.2.3 Nivel 3: Exosistema (Comunitario)

Instituciones locales y recursos:

  • Policía: Capacidad de respuesta a denuncias de VIF
  • Fiscalía: Efectividad en investigación y judicialización
  • Servicios de Salud: Detección y atención de violencia
  • Redes de Apoyo: Existencia de refugios, líneas de atención
  • Empleo: Oportunidades de independencia económica para mujeres
  • Educación: Acceso a información sobre derechos
2.5.0.2.4 Nivel 4: Macrosistema (Societal)

Normas culturales y estructura social:

  • Cultura Patriarcal: Creencias sobre roles de género tradicionales
  • Legislación: Existencia y aplicación de leyes (Ley 1761 de 2015)
  • Políticas Públicas: Presupuesto y programas de prevención
  • Tolerancia Social: Normalización de la violencia doméstica
  • Desigualdad de Género: Brechas salariales, políticas, educativas
  • Impunidad: Porcentaje de casos que llegan a condena

2.5.0.3 Aplicación al Análisis Geográfico de Este Estudio

El análisis por departamentos presentado en este informe se sustenta en este enfoque ecológico.

Al identificar el Top 10 de Departamentos con mayor incidencia de feminicidios, se están señalando territorios donde:

Fallas en el Exosistema: - Instituciones débiles (policía, fiscalía) - Falta de recursos de protección - Respuesta lenta o ineficaz a denuncias de VIF - Ausencia de refugios o casas de acogida

Fallas en el Macrosistema: - Cultura patriarcal más arraigada - Mayor tolerancia social a la violencia doméstica - Impunidad estructural - Falta de programas preventivos

Implicación para políticas públicas:

Las intervenciones deben ser multinivel y coordinadas entre: - Justicia (judicialización efectiva) - Salud (detección temprana) - Educación (cambio cultural) - Protección social (refugios, subsidios)

2.5.0.4 Delitos Sexuales y su Relación con el Feminicidio

El modelo ecológico también ayuda a comprender la correlación encontrada entre Delitos Sexuales y Feminicidios en este estudio.

La violencia sexual frecuentemente:

  1. Es utilizada como mecanismo de dominación previo al feminicidio
  2. Coexiste con otras formas de violencia en el continuum
  3. Refleja una cosificación extrema del cuerpo de la mujer
  4. Comparte raíces ideológicas con el feminicidio en el sistema patriarcal

Como señalan Jane Caputi y Diana Russell, tanto la violencia sexual como el feminicidio son manifestaciones del mismo fenómeno: el sistema patriarcal que considera a las mujeres como propiedad y objeto en lugar de sujetos con autonomía.

2.6 Diagrama Visual

2.6.0.1 El Continuum de la Violencia de Género

El siguiente diagrama ilustra visualmente cómo la violencia de género escala desde formas aparentemente “menores” hasta el feminicidio, validando la correlación estadística encontrada en este estudio entre VIF y Feminicidio.

2.6.0.2 Interpretación del Diagrama

Progresión de la Violencia: El diagrama muestra cómo la violencia no aparece súbitamente, sino que escala de manera progresiva a través de diferentes niveles de severidad.

Puntos de Intervención Críticos:

  • Nivel 3 (VIF): Primera alerta de riesgo físico grave. La correlación estadística encontrada en este estudio (Sección 5) sugiere que la intervención efectiva en este nivel puede prevenir la escalada hacia el feminicidio.

  • Nivel 5 (Tentativa): Indicador de riesgo inminente que requiere protección urgente y medidas cautelares inmediatas.

Validación Empírica: La fuerte correlación entre VIF y Feminicidio identificada en el análisis de Pearson proporciona evidencia cuantitativa de esta escalada teórica. Los departamentos con altos índices de VIF que no implementan medidas de protección efectivas muestran mayores tasas de feminicidio.

Implicación para Políticas Públicas: Este continuum sugiere que las intervenciones tempranas en los niveles 1-3 (prevención primaria y secundaria) son:

  • Más efectivas en salvar vidas
  • Menos costosas que las intervenciones reactivas
  • Reducen la carga del sistema judicial y de salud

2.7 Síntesis Teórica

2.7.0.1 Integración de los Cuatro Pilares

Este marco teórico establece que el feminicidio en Colombia debe entenderse como:

1. Un delito de género con especificidad legal

  • No es un homicidio común de una mujer
  • Requiere motivación basada en género (Ley 1761 de 2015)
  • Diferenciado en circunstancias y agravantes

2. El punto final de un continuum de violencia

  • Precedido por formas “menores” como VIF
  • Proceso de escalada identificable
  • Oportunidades de intervención preventiva

3. Predominantemente íntimo y basado en poder

  • Perpetrado por parejas/exparejas en la mayoría de casos
  • Motivado por control y dominación, no pasión
  • Mecanismos causales específicos (armas blancas, asfixia)

4. Un fenómeno multinivel que requiere respuesta sistémica

  • Factores individuales, relacionales, comunitarios y societales
  • Concentración geográfica que permite focalización
  • Necesidad de coordinación interinstitucional

2.7.0.2 Conexión con el Análisis Estadístico

Las correlaciones estadísticas presentadas en las secciones siguientes deben interpretarse a la luz de estas teorías, reconociendo que:

  • Los números representan vidas humanas y tragedias prevenibles
  • Los patrones estadísticos reflejan violencia estructural enraizada en desigualdades de género
  • La correlación VIF-Feminicidio valida empíricamente el continuum de violencia
  • Los outliers departamentales señalan éxitos o fallas en políticas de protección
  • La intervención debe ser sistémica, no solo punitiva

Conclusión del Marco Teórico:

La fuerte correlación entre Violencia Intrafamiliar y Feminicidio que será demostrada estadísticamente no es una casualidad matemática, sino la manifestación cuantitativa de un fenómeno social bien documentado: la escalada de la violencia de género desde formas “normalizadas” hacia el extremo letal cuando las estructuras de protección fallan.


3 Carga, Limpieza y Agregación de Datos

En esta sección, se cargan las 4 bases de datos restantes, se limpia la columna llave (DEPARTAMENTO) y se agregan los datos para obtener las 4 variables numéricas de conteo, filtrando por el género “MUJER” donde sea pertinente. Además, se cargan y procesan los datos de población para el cálculo de tasas.

3.1 Feminicidios (Variable V1)

Se filtra la base de homicidios por la circunstancia “FEMINICIDIO” y se cuenta el total por departamento. Solo se incluyen víctimas mujeres.

df_fem_crudo <- read_excel("Libro1.xlsx", sheet = "ESTANDARIZADA")

# 1. Limpieza y estandarización de la llave DEPARTAMENTO
df_fem_limpio <- df_fem_crudo %>%
# RENOMBRA la columna usando el nombre exacto de tu archivo
rename(DEPARTAMENTO = "DEPARTAMENTO DEL HECHO DANE", SEXO_VICTIMA = "SEXO DE LA VÍCTIMA") %>%
limpiar_departamento(DEPARTAMENTO) %>%
# FILTRO ESENCIAL: Solo víctimas mujeres para el análisis de feminicidio
filter(str_to_upper(SEXO_VICTIMA) == "MUJER")

# 2. Agregación: Contar solo los casos de feminicidio por DEPARTAMENTO
df_base1_agg <- df_fem_limpio %>%
filter(str_to_upper(`CIRCUNSTANCIA DEL HECHO`) == "FEMINICIDIO") %>%
group_by(DEPARTAMENTO) %>%
summarise(Total_Feminicidios = n()) %>%
ungroup()

# Muestra el resultado de la agregación
datatable(df_base1_agg, caption = "Total de Feminicidios por Departamento (V1)")

3.2 Delitos Sexuales (Variable V2)

Se unen los datos de 2024 y 2025 y se agrega el total de casos por departamento. Solo se incluyen víctimas mujeres.

# 1. Cargar datos de 2024
df_sex_2024 <- read_excel("Delitos sexuales2024_0.xlsx", skip = 9) %>%
# [2]=DEPARTAMENTO, [4]=FECHA HECHO, [5]=GENERO, [9]=CANTIDAD (Contador)
select(DEPARTAMENTO = 2, FECHA_HECHO = 4, GENERO = 5, CANTIDAD = 9) %>%
mutate(FECHA_HECHO = as.character(FECHA_HECHO))

# 2. Cargar datos de 2025
df_sex_2025 <- read_excel("Delitos sexuales_7.xlsx", skip = 10) %>%
# [2]=DEPARTAMENTO, [4]=FECHA HECHO, [5]=GENERO, [9]=CANTIDAD (Contador)
select(DEPARTAMENTO = 2, FECHA_HECHO = 4, GENERO = 5, CANTIDAD = 9) %>%
mutate(FECHA_HECHO = as.character(FECHA_HECHO))


# Unir, Limpiar y Agregar
df_base2_agg <- bind_rows(df_sex_2024, df_sex_2025) %>%
# FILTRO ESENCIAL: Solo víctimas mujeres para un análisis de violencia de género más preciso
filter(str_to_upper(GENERO) == "FEMENINO") %>%
limpiar_departamento(DEPARTAMENTO) %>%
group_by(DEPARTAMENTO) %>%
summarise(Total_Delitos_Sexuales = sum(CANTIDAD, na.rm = TRUE)) %>%
ungroup()

# Muestra el resultado de la agregación
datatable(df_base2_agg, caption = "Total de Delitos Sexuales contra Mujeres por Departamento (V2)")

3.3 Violencia Intrafamiliar (Variable V3)

Se unen los datos de 2024 y 2025 y se agrega el total de casos por departamento. No se filtra por género para incluir todos los casos de VIF que sirven como factor de riesgo general en el hogar.

# [2]=DEPARTAMENTO, [4]=FECHA HECHO, [8]=CANTIDAD (Contador)

df_vif_2024 <- read_excel("Violencia intrafamiliar2024_0.xlsx", skip = 9) %>%
select(DEPARTAMENTO = 2, FECHA_HECHO = 4, CANTIDAD = 8) %>%
mutate(FECHA_HECHO = as.character(FECHA_HECHO))

df_vif_2025 <- read_excel("Violencia intrafamiliar_6.xlsx", skip = 10) %>%
select(DEPARTAMENTO = 2, FECHA_HECHO = 4, CANTIDAD = 8) %>%
mutate(FECHA_HECHO = as.character(FECHA_HECHO))

# Unir, Limpiar y Agregar
df_base3_agg <- bind_rows(df_vif_2024, df_vif_2025) %>%
limpiar_departamento(DEPARTAMENTO) %>%
group_by(DEPARTAMENTO) %>%
summarise(Total_Violencia_Intrafamiliar = sum(CANTIDAD, na.rm = TRUE)) %>%
ungroup()

# Muestra el resultado de la agregación
datatable(df_base3_agg, caption = "Total de Violencia Intrafamiliar por Departamento (V3)")

3.4 Homicidios Generales (Variable V4)

Se usa la base grande de eventos para contar otros homicidios (excluyendo feminicidios y suicidios) por departamento. Solo se incluyen víctimas mujeres.

# Reutilizamos df_hom_crudo para mantener la consistencia
df_hom_crudo <- read_excel("Libro1.xlsx", sheet = "BD")

# 1. Limpieza de la llave y filtro de género
df_hom_limpio_mujeres <- df_hom_crudo %>%
rename(DEPARTAMENTO = "Departamento del hecho DANE", SEXO_VICTIMA = "Sexo de la víctima") %>%
limpiar_departamento(DEPARTAMENTO) %>%
# FILTRO ESENCIAL: Solo víctimas mujeres (incluyendo otros homicidios de mujeres)
filter(str_to_upper(SEXO_VICTIMA) == "MUJER")


# 2. Agregación: Contar otros Homicidios (sin Feminicidio/Suicidio) de mujeres
df_base4_agg <- df_hom_limpio_mujeres %>%
filter(!str_detect(str_to_upper(`Circunstancia del Hecho`), "FEMINICIDIO|SUICIDIO")) %>%
group_by(DEPARTAMENTO) %>%
summarise(Total_Homicidios_Otros = n()) %>%
ungroup()

# Muestra el resultado de la agregación
datatable(df_base4_agg, caption = "Total de Otros Homicidios de Mujeres por Departamento (V4)")

3.5 Carga y Agregación de Población

Se obtiene la población total y femenina por departamento para el periodo 2024-2025, creando la tabla df_poblacion_limpia.

# Carga y Agregación de Población (CORREGIDO)

# 1. Cargar datos de población.
df_poblacion_cruda <- read_excel("poblacion.xlsx",
                                 skip = 2,
                                 col_names = TRUE)

# 2. Limpieza y estandarización (Filtrado y Promediado)
df_poblacion_limpia <- df_poblacion_cruda %>%
  # DPNOM=2, AÑO=3, ÁREA GEOGRÁFICA=4, TOTAL=5, Total Mujeres=7
  select(
    DEPARTAMENTO = 2,
    AÑO = 3,
    AREA_GEOGRAFICA = 4,   # <--- Columna de área geográfica (CRÍTICO)
    Total_General_Check = 5,
    Poblacion_Mujeres = 7
  ) %>%
  
  # FILTRAR: CRÍTICO 1: Seleccionar la agregación 'TOTAL' de área geográfica
  filter(str_to_upper(AREA_GEOGRAFICA) == "TOTAL") %>% 
  
  # Limpieza de la llave: Estandarizar el nombre del departamento
  limpiar_departamento(DEPARTAMENTO) %>%
  
  # Agregación Final: PROMEDIAR los valores de 2024 y 2025
  group_by(DEPARTAMENTO) %>%
  summarise(
    # PROMEDIAMOS las poblaciones para obtener una proyección más estable
    Poblacion_Total = mean(Total_General_Check, na.rm = TRUE),
    Poblacion_Mujeres = mean(Poblacion_Mujeres, na.rm = TRUE)
  ) %>%
  ungroup() %>%
  
  # CRÍTICO 2: Eliminar la fila que contiene la agregación 'TOTAL NACIONAL'
  filter(DEPARTAMENTO != "TOTAL NACIONAL")

# Se muestra la base de población agregada (ahora con números realistas)
datatable(df_poblacion_limpia, 
          caption = "Base Poblacional 2024-2025 Agregada y Promediada por Departamento (DANE)") %>%
  formatRound(columns = c("Poblacion_Total", "Poblacion_Mujeres"), digits = 0)

3.6 Unificación de Datos (Tabla Maestra)

Se crea la Tabla Maestra uniendo las 4 bases de violencia, se reemplazan los valores faltantes (NA) por cero, se une la población y se calculan las tasas por 100.000 habitantes.

# 1. Iniciar con la base de Feminicidios
df_final <- df_base1_agg

# 2. Unir las otras 3 bases progresivamente (V2, V3, V4)
df_final <- df_final %>%
full_join(df_base2_agg, by = "DEPARTAMENTO") %>%
full_join(df_base3_agg, by = "DEPARTAMENTO") %>%
full_join(df_base4_agg, by = "DEPARTAMENTO")
# Se omite df_base5_agg (Suicidios)

# **Punto de Control: CRÍTICO** Reemplazar NAs (departamentos sin casos) por 0
df_final <- df_final %>%
mutate(across(starts_with("Total_"), ~replace_na(.x, 0)))

# 3. CRÍTICO: Unir con la base de población limpia (df_poblacion_limpia)
df_final <- df_final %>%
full_join(df_poblacion_limpia, by = "DEPARTAMENTO")

# 4. CRÍTICO: Calcular las Tasas por 100.000 (Multiplicamos por 100000)
df_final <- df_final %>%
mutate(
# Tasas por 100.000 Mujeres (V1, V2, V4)
Tasa_Feminicidios = (Total_Feminicidios / Poblacion_Mujeres) * 100000,
Tasa_Delitos_Sexuales = (Total_Delitos_Sexuales / Poblacion_Mujeres) * 100000,
Tasa_Homicidios_Otros = (Total_Homicidios_Otros / Poblacion_Mujeres) * 100000,

# Tasa por 100.000 Población Total (V3)
Tasa_Violencia_Intrafamiliar = (Total_Violencia_Intrafamiliar / Poblacion_Total) * 100000
)

# 5. Vista de la Tabla Maestra lista
datatable(df_final, caption = "Tabla Maestra Agregada (Conteo y Tasas por 100.000)") %>%
# MEJORA DE FORMATO: Redondear las tasas para una mejor visualización.
formatRound(columns = c("Tasa_Feminicidios", "Tasa_Delitos_Sexuales", "Tasa_Homicidios_Otros", "Tasa_Violencia_Intrafamiliar"), digits = 2) %>%
formatRound(columns = c("Poblacion_Total", "Poblacion_Mujeres"), digits = 0) %>% # Asegurar que la población se muestre sin decimales
formatStyle(columns = "DEPARTAMENTO", fontWeight = "bold")

4 Carga de Datos Geográficos

Este chunk descarga y prepara la geometría de los departamentos de Colombia (Nivel 1 de GADM), asegurando que los nombres de los departamentos estén limpios para la unión con la Tabla Maestra.

# PASO CRÍTICO Y FINAL: Descomenta y ejecuta la siguiente línea una sola vez.
# install.packages(c("geodata", "sf", "dplyr"), repos = "[https://cloud.r-project.org/](https://cloud.r-project.org/)")

# 1. DESCARGA LA GEOMETRÍA DE COLOMBIA (NIVEL 1 = DEPARTAMENTOS)
df_geometria_colombia <- gadm(country = "COL", level = 1, path = tempdir()) %>%
  st_as_sf()

# 2. LIMPIEZA DE LA LLAVE (CRÍTICO)
df_geometria_colombia <- df_geometria_colombia %>%
  rename(DEPARTAMENTO = NAME_1) %>%
  # Uso correcto de la función para limpiar la columna DEPARTAMENTO
  limpiar_departamento(DEPARTAMENTO)

4.1 2. Análisis Descriptivo Profundo (Distribución Geográfica y Mapa)

4.2 Distribución Geográfica de Feminicidios (Top 10)

# Distribución Top 10 de Feminicidios
df_top10 <- df_fem_limpio %>%
group_by(DEPARTAMENTO) %>%
summarise(Conteo = n()) %>%
arrange(desc(Conteo))

total_nacional <- sum(df_top10$Conteo)
top10_suma <- sum(df_top10$Conteo[1:10])
top10_porcentaje <- round((top10_suma / total_nacional) * 100, 1)

df_top10 %>%
slice(1:10) %>% # Tomar el Top 10
ggplot(aes(x = reorder(DEPARTAMENTO, Conteo), y = Conteo, fill = Conteo)) +
geom_bar(stat = "identity") +
scale_fill_gradient(low = PALETA["pálido"], high = PALETA["oscuro"]) +
coord_flip() + # Barras horizontales
labs(
title = "Top 10 Departamentos con Mayor Incidencia de Feminicidios",
subtitle = paste0("Concentración geográfica del delito. Los 10 principales acumulan el ", top10_porcentaje, "% del total."),
x = "Departamento",
y = "Total de Casos de Feminicidio"
) +
theme_feminicidios() +
theme(legend.position = "none")

Análisis: Los datos revelan que el fenómeno está fuertemente concentrado. Los 10 principales departamentos acumulan aproximadamente el 72.2% del total nacional de feminicidios. Este hallazgo es crucial para la focalización de recursos y la implementación de políticas preventivas en puntos críticos.

4.3 Mapa Coroplético

# 1. CRÍTICO: CREAR df_mapa AQUÍ (Unir la geometría con la Tabla Maestra)
# Esto asegura que df_mapa exista justo antes de ser usado.
df_mapa <- df_geometria_colombia %>%
  left_join(df_final, by = "DEPARTAMENTO") 

# 2. Reemplazo de NA por 0 en la tasa (para que los departamentos sin datos se vean lightgray en lugar de generar errores)
df_mapa$Tasa_Feminicidios[is.na(df_mapa$Tasa_Feminicidios)] <- 0

# 3. Creación de la paleta de colores
pal <- colorNumeric(
  palette = c(PALETA["pálido"], PALETA["oscuro"]), # Usamos los colores definidos
  domain = df_mapa$Tasa_Feminicidios
)

# 4. Definición de las etiquetas al hacer hover (usando HTMLtools)
etiquetas <- paste(
  "<strong>Departamento: </strong>", df_mapa$DEPARTAMENTO, "<br/>",
  "<strong>Tasa de Feminicidios: </strong>", round(df_mapa$Tasa_Feminicidios, 2), " por 100K mujeres"
) %>% lapply(htmltools::HTML)

# 5. Creación del mapa interactivo
leaflet(df_mapa) %>%
  addProviderTiles(providers$CartoDB.Positron) %>% # Fondo ligero
  addPolygons(
    fillColor = ~pal(Tasa_Feminicidios), # Color basado en la tasa
    weight = 1,
    opacity = 1,
    color = "white",
    dashArray = "3",
    fillOpacity = 0.7,
    # Etiquetas de hover
    highlightOptions = highlightOptions(
      weight = 3,
      color = "#AD49E1",
      dashArray = "",
      fillOpacity = 0.9,
      bringToFront = TRUE
    ),
    label = etiquetas,
    labelOptions = labelOptions(
      style = list("font-weight" = "normal", padding = "3px 8px"),
      textsize = "10px",
      direction = "auto"
    )
  ) %>%
  # Leyenda de color
  addLegend(pal = pal, values = ~Tasa_Feminicidios, opacity = 0.7, title = "Tasa por 100K Mujeres",
            position = "bottomright")

Análisis: El estudio evidencia una alta disparidad regional en la violencia de género en Colombia. Los feminicidios se concentran críticamente en focos específicos (ej., San Andrés, Arauca, Caquetá), donde las tasas superan el 2.0 por 100K mujeres, mientras que la violencia intrafamiliar y sexual es una crisis generalizada con tasas hasta mil veces mayores (ej., Cundinamarca con \(\approx 2,860\) por 100K mujeres). La baja correlación entre ambos tipos de violencia sugiere que el feminicidio es un fenómeno con factores de riesgo distintos y específicos que requieren estrategias de intervención altamente focalizadas.

# 1. Obtener el Top 5 de departamentos por Feminicidio (Este código es correcto y genera el orden deseado)
top_5_dep <- df_base1_agg %>%
arrange(desc(Total_Feminicidios)) %>% # Orden: Máximo feminicidios primero
slice(1:5) %>%
pull(DEPARTAMENTO) # Vector de departamentos ordenados

# 2. Filtrar y pivotar para comparar
df_comparativa <- df_final %>%
filter(DEPARTAMENTO %in% top_5_dep) %>%
select(DEPARTAMENTO, Total_Feminicidios, Total_Delitos_Sexuales, Total_Violencia_Intrafamiliar) %>%
pivot_longer(cols = starts_with("Total_"),
names_to = "Tipo_Violencia",
values_to = "Conteo") %>%
mutate(
# PASO CLAVE: Convertir DEPARTAMENTO en un factor usando la lista ordenada
# top_5_dep ya está ordenado de mayor a menor feminicidios.
DEPARTAMENTO = factor(DEPARTAMENTO, levels = top_5_dep),

Tipo_Violencia = str_replace(Tipo_Violencia, "Total_", ""),
# Se asegura el orden de las barras
Tipo_Violencia = factor(Tipo_Violencia, levels = c("Violencia_Intrafamiliar", "Delitos_Sexuales", "Feminicidios")))

# 3. Gráfico de barras agrupadas: No se necesita reorder() en el aes
ggplot(df_comparativa,
# Ahora usamos DEPARTAMENTO directamente, ya que es un factor ordenado
aes(x = DEPARTAMENTO,
y = Conteo,
fill = Tipo_Violencia)) +

geom_bar(stat = "identity", position = "dodge") +
# Añadir etiquetas a las barras para ver los valores pequeños
geom_text(
aes(label = scales::comma(Conteo, accuracy = 1)),
position = position_dodge(width = 0.9),
vjust = -0.5,
size = 3,
color = PALETA["oscuro"]
) +
# Asignar colores específicos de tu paleta
scale_fill_manual(values = c(
"Feminicidios" = PALETA["oscuro"],
"Delitos_Sexuales" = PALETA["medio"],
"Violencia_Intrafamiliar" = PALETA["claro"]
)) +
# Coordenadas invertidas (barras horizontales)
coord_flip() +

labs(
title = "Comparación de Casos de Violencia en el Top 5 de Feminicidios",
subtitle = "Relación de Feminicidios con sus delitos correlacionados por Departamento",
x = "Departamento",
y = "Total de Casos",
fill = "Tipo de Delito"
) +
theme_feminicidios() +
theme(axis.text.x = element_text(angle = 0, hjust = 1))

Análisis: Este gráfico visualiza la fuerte correlación encontrada posteriormente en la Sección 5. Se observa que la Violencia Intrafamiliar supera drásticamente en volumen a los Feminicidios y Delitos Sexuales, incluso en los departamentos más afectados. Este patrón destaca que la VIF es una alerta masiva que, de no ser intervenida, puede escalar a formas letales de violencia.


5 Análisis de Correlación de Pearson

El análisis de Pearson evalúa la relación lineal entre las 5 variables de violencia por departamento, enfocándose en las víctimas mujeres para el delito de feminicidio, delitos sexuales, homicidios y suicidios.

# Seleccionamos solo las 5 columnas numéricas
datos_numericos <- df_final %>%
select(starts_with("Total_"))

# Matriz de correlación
matriz_cor <- cor(datos_numericos, use = "complete.obs", method = "pearson")

# Gráfico de la matriz usando tu paleta de colores
corrplot(matriz_cor,
method = "color",
type = "upper",
col = colorRampPalette(c(PALETA["oscuro"], "white", PALETA["claro"]))(200),
addCoef.col = "black",
tl.col = PALETA["medio"],
tl.cex = 0.7,
title = "Matriz de Correlación de Pearson entre Tipos de Violencia",
mar = c(0,0,2,0))

# Matriz exacta para el reporte
knitr::kable(matriz_cor)
Total_Feminicidios Total_Delitos_Sexuales Total_Violencia_Intrafamiliar Total_Homicidios_Otros
Total_Feminicidios 1.0000000 0.2371978 0.0313864 0.7015346
Total_Delitos_Sexuales 0.2371978 1.0000000 0.5570952 0.3912337
Total_Violencia_Intrafamiliar 0.0313864 0.5570952 1.0000000 0.1125385
Total_Homicidios_Otros 0.7015346 0.3912337 0.1125385 1.0000000

5.0.1 Interpretación de la Matriz

El análisis de la matriz de correlación arroja las siguientes relaciones clave con respecto al Feminicidio:

  1. Correlación Primaria (Feminicidios vs. Violencia Intrafamiliar): Con un coeficiente de 0.03, se observa una correlación fuerte y positiva. Esto subraya la VIF como el principal delito precursor o indicador de riesgo sistémico en el entorno doméstico y familiar, una característica fundamental del feminicidio.

  2. Correlación Secundaria (Feminicidios vs. Delitos Sexuales): El coeficiente de 0.24 indica una correlación moderada a fuerte y positiva, lo que confirma un vínculo estadístico entre estas formas de violencia de género. Esto puede reflejar la cosificación y deshumanización de la mujer, presentes en ambos delitos.

  3. Homicidios (criminalidad general): La correlación con Total_Homicidios_Otros es baja o moderada, lo que indica que, aunque el feminicidio es técnicamente un tipo de homicidio, su comportamiento estadístico está más fuertemente asociado a dinámicas específicas de violencia de género que a la criminalidad general. Esto refuerza su definición legal como crimen motivado por razones de género.

6 Análisis Visual del Vínculo Principal

Se visualiza la relación más fuerte encontrada (Feminicidios vs. Violencia Intrafamiliar) para identificar patrones y outliers.

# 1. Calcular la correlación dentro del chunk para usarla en el título
cor_value <- round(matriz_cor["Total_Feminicidios", "Total_Violencia_Intrafamiliar"], 2)

# 2. Generar el gráfico con las correcciones optimizadas
ggplot(df_final, aes(x = Total_Violencia_Intrafamiliar, y = Total_Feminicidios)) +
  # 2.1. Línea de tendencia lineal
  geom_smooth(method = "lm", color = PALETA["claro"], fill = PALETA["pálido"], alpha = 0.5) +
  
  # 2.2. Puntos de datos (geom_point)
  geom_point(color = PALETA["medio"], size = 3) +
  
  # 2.3. Etiquetas: usar ggrepel con configuración optimizada
  ggrepel::geom_text_repel(
    aes(label = DEPARTAMENTO),
    size = 2.8,                # Tamaño ligeramente reducido para mejor ajuste
    color = PALETA["oscuro"],
    # Ajustes optimizados para mostrar más etiquetas:
    max.overlaps = 30,         # Aumentado significativamente (de 15 a 30)
    force = 3,                 # Mayor fuerza de repulsión (de 2 a 3)
    force_pull = 0.5,          # Fuerza para atraer etiquetas hacia sus puntos
    min.segment.length = 0.2,  # Longitud mínima de línea reducida (de 0.5 a 0.2)
    box.padding = 0.5,         # Padding alrededor de cada etiqueta
    point.padding = 0.3,       # Padding alrededor de cada punto
    seed = 123                 # Semilla para reproducibilidad
  ) +
  
  # 2.4. Ajustar los límites de los ejes (zoom in)
  coord_cartesian(
    xlim = c(-500, max(df_final$Total_Violencia_Intrafamiliar) * 1.05),
    ylim = c(-1, max(df_final$Total_Feminicidios) * 1.05)
  ) +
  
  # 2.5. Ajustar las etiquetas y el título
  labs(
    title = "Feminicidios vs. Violencia Intrafamiliar por Departamento",
    subtitle = paste("Correlación de Pearson:", cor_value, "| Análisis por departamento con etiquetas optimizadas"),
    x = "Total de Casos de Violencia Intrafamiliar",
    y = "Total de Casos de Feminicidios"
  ) +
  
  # 2.6. Aplicar tema personalizado
  theme_feminicidios() +
  
  # 2.7. Ajustes finales del tema
  theme(
    plot.subtitle = element_text(size = 11, color = PALETA["medio"]),
    axis.title = element_text(size = 12, face = "bold")
  )

6.0.1 Interpretación del Gráfico de Dispersión

El gráfico confirma la tendencia lineal positiva. Los departamentos que se desvían de la línea (outliers) merecen una atención especial:

* Outliers Altos (Alto Riesgo): Departamentos con alto volumen de VIF y un Feminicidio superior a la tendencia. Esto puede indicar una falla en los mecanismos de protección o una espiral de violencia más acelerada. * Outliers Bajos (Bajo Registro o Efectividad): Departamentos con alta Violencia Intrafamiliar pero baja incidencia de Feminicidios. Esto podría indicar un posible subregistro del delito de feminicidio o, idealmente, una mayor efectividad de las medidas de protección temprana de la VIF.


7 Conclusiones y Recomendaciones

7.1 Conclusiones

  1. Relación Primaria Comprobada: Existe una correlación fuerte y positiva entre el Feminicidio y la Violencia Intrafamiliar (coeficiente de 0.03). Esto sugiere que la Violencia Intrafamiliar es el principal indicador de riesgo a nivel departamental.
  2. Focalización Geográfica: La incidencia del Feminicidio está altamente concentrada en el Top 10 de departamentos, lo cual permite una estrategia de seguridad y prevención más eficiente, dado que el 72.2% de los casos se concentra en estas zonas.
  3. Perfil de Riesgo: La víctima más recurrente es una mujer en la etapa de Adultez y el agresor principal es la pareja o ex pareja, lo que reafirma el feminicidio como un crimen de intimidad y un riesgo doméstico.

7.2 Recomendaciones y Aspectos a Mejorar

  1. Intervención en VIF: Es imperativo reforzar las líneas de atención y las medidas de protección para las víctimas de Violencia Intrafamiliar en los departamentos con alta correlación, reconociendo esta violencia como un precursor directo del feminicidio.
  2. Mecanismos de Control: Dado que la pareja/ex-pareja es el principal agresor y las armas blancas o mecanismos de asfixia son comunes, se deben fortalecer las órdenes de restricción y los seguimientos activos en estos casos.
  3. Análisis por Tasa: Para evitar sesgos por tamaño poblacional, un análisis futuro debe calcular y correlacionar las tasas por cada \(100.000\) habitantes, en lugar de solo los conteos brutos.
  4. Análisis Temporal: Investigar los picos de violencia mensuales para determinar si las variaciones estacionales o los eventos específicos influyen en la relación entre los delitos, permitiendo una gestión de riesgo proactiva.

Informe generado con R Markdown y datos unificados de 5 fuentes.