Introducción

El presente informe analiza una base de datos integrada que recopila información proveniente de tres fuentes distintas: feminicidios(F), violencia intrafamiliar(VI) y delitos sexuales(DS).

A lo largo del documento se presentan hallazgos descriptivos, visualizaciones, conteos clave y patrones temporales que permiten comprender mejor la frecuencia, distribución y contexto de los casos registrados. Además, se incluyen análisis comparativos que facilitan identificar tendencias que no serían visibles si cada base se estudiara por separado.

Resumen de la base de datos

summary(Feminicidios)
##  ARMAS_MEDIOS_VI    DEPARTAMENTO_VI    MUNICIPIO_VI       FECHA_HECHO_VI    
##  Length:216557      Length:216557      Length:216557      Length:216557     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##  MES_HECHO_VI       DIA_HECHO_VI        GENERO_VI        
##  Length:216557      Length:216557      Length:216557     
##  Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character  
##  AGRUPA_EDAD_PERSONA_VI CANTIDAD_VI        TIPO_DELITO       
##  Length:216557          Length:216557      Length:216557     
##  Class :character       Class :character   Class :character  
##  Mode  :character       Mode  :character   Mode  :character  
##  ARMAS_MEDIOS_DS    DEPARTAMENTO_DS    MUNICIPIO_DS       FECHA_HECHO_DS    
##  Length:216557      Length:216557      Length:216557      Length:216557     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##  MES_HECHO_DS       DIA_HECHO_DS        GENERO_DS        
##  Length:216557      Length:216557      Length:216557     
##  Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character  
##  AGRUPA_EDAD_PERSONA_DS  DELITO_DS         CANTIDAD_DS       
##  Length:216557          Length:216557      Length:216557     
##  Class :character       Class :character   Class :character  
##  Mode  :character       Mode  :character   Mode  :character  
##  AÑO_HECHO_F        MES_HECHO_F        DIA_HECHO_F        GRUPO_EDAD_VICTIMA_F
##  Length:216557      Length:216557      Length:216557      Length:216557       
##  Class :character   Class :character   Class :character   Class :character    
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character    
##  MAYOR_O_MENOS_F    CICLO_VITAL_F      SEXO_VICT_F        ESTADO_CIVIL_F    
##  Length:216557      Length:216557      Length:216557      Length:216557     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##   PAIS_NAC_F        ESCOLARIDAD_F      DEPT_HECHO_F       MUN_HECHO_F       
##  Length:216557      Length:216557      Length:216557      Length:216557     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##  ESCE_HECHO_F       CIRCUNSTANCIA_F    MECANISMO_CASUAL_F PRESUNTO_AGRESOR_F
##  Length:216557      Length:216557      Length:216557      Length:216557     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##   CANTIDAD_F       
##  Length:216557     
##  Class :character  
##  Mode  :character

Objetivo del proyecto

Identificar los patrones, tendencias y relaciones más relevantes entre los casos de feminicidios, violencia intrafamiliar y delitos sexuales a partir de la base de datos integrada, con el fin de reconocer factores comunes, particularidades y comportamientos significativos que contribuyan a una comprensión más completa del fenómeno.

Alcances y limitaciones

El análisis se basa en los registros disponibles en las tres bases suministradas, los cuales corresponden al periodo de Enero de 2024 a Septiembre de 2025. La información depende de la calidad del reporte inicial, por lo que puede contener vacíos, registros incompletos o variaciones en la clasificación de variables. Ninguno de los resultados debe interpretarse como cifras absolutas de ocurrencia, sino como tendencias dentro del conjunto de datos trabajado.

Metodología

Para la construcción de la base integrada se realizaron procesos de:

  1. Depuración y estandarización de variables.

  2. Unificación de categorías de edad, ciclo vital y tipo de violencia.

  3. Identificación y eliminación de registros duplicados.

  4. Integración final en un único dataset para análisis descriptivo.

Consultas y analisis

En esta sección se presentan los resultados del análisis aplicado a la base de datos integrada de feminicidios, violencia intrafamiliar y delitos sexuales. A través de diferentes consultas, visualizaciones y comparaciones, se examinan los patrones más relevantes del comportamiento delictivo en términos temporales, demográficos y tipológicos. Cada subsección desarrolla un aspecto particular del fenómeno, con el fin de identificar tendencias, concentraciones, variaciones entre categorías y posibles relaciones entre las variables disponibles. Este bloque constituye el núcleo del informe, ya que traduce los datos en hallazgos concretos que permiten una comprensión más profunda del contexto de violencia analizado.

Consulta 1

library(dplyr)
library(ggplot2)

consulta1 <- Feminicidios %>%
  filter(!is.na(GRUPO_EDAD_VICTIMA_F) & GRUPO_EDAD_VICTIMA_F != "") %>% 
  group_by(GRUPO_EDAD_VICTIMA_F) %>%
  summarise(Casos = n()) %>%
  mutate(Porcentaje = round((Casos / sum(Casos)) * 100, 1)) %>%
  arrange(desc(Casos)) %>%
  slice(1:5) %>%   
  mutate(Etiquetas = paste0(Casos, " casos (", Porcentaje, "%)"))

ggplot(consulta1, aes(x = "", y = Casos, fill = GRUPO_EDAD_VICTIMA_F)) +
  geom_bar(stat = "identity", width = 1, color = "white") +
  coord_polar("y") +
  geom_text(aes(label = Etiquetas),
            position = position_stack(vjust = 0.5),
            size = 4,
            color = "black") +
  labs(
    title = "Top 5 Grupos de Edad con Mayor Número de Víctimas",
    fill = "Grupo de edad"
  ) +
  theme_void() +
  theme(
    plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
    legend.position = "right"
  )

Para esta consulta se agruparon todos los registros en un grafico circular según el grupo de edad de la víctima (GRUPO_EDAD_VICTIMA_F) y se contó cuántos casos corresponden a cada categoría. Luego, los resultados se ordenaron de mayor a menor frecuencia y se seleccionaron los cinco grupos con más casos. Finalmente, se calculó el porcentaje de participación de cada uno respecto al total analizado.

Los cinco grupos de edad con mayor número de víctimas son:

25 a 29 años – 27 casos (17%)

Este grupo representa la mayor concentración de casos. El porcentaje se obtuvo dividiendo 27 casos entre el total de casos sumados en la consulta y multiplicando por 100.

20 a 24 años – 22 casos (13.8%)

El segundo grupo más afectado. Este rango incluye población principalmente joven adulta, coincidiendo con patrones observados en estudios de violencia basada en género.

30 a 34 años – 19 casos (11.9%)

Aparece como el tercer grupo más recurrente, mostrando que la incidencia permanece alta durante la adultez joven.

35 a 39 años – 18 casos (11.3%)

Representa una participación muy cercana al grupo anterior, indicando continuidad del riesgo en edades intermedias.

40 a 44 años – 16 casos (10.1%)

Aunque algo menor que los anteriores, sigue siendo un grupo con relevancia estadística importante.

CONCLUSION DEL ANALISIS

Los resultados muestran que los feminicidios afectan principalmente a mujeres entre los 20 y 39 años, correspondiendo a etapas de adultez temprana y media. En conjunto, estos cinco rangos de edad representan la mayor parte de los casos registrados, concentrando más del 60% del total.

Este patrón evidencia una vulnerabilidad marcada en mujeres jóvenes y adultas, lo cual es consistente con tendencias nacionales e internacionales sobre violencia feminicida.

Consulta 2

library(dplyr)
library(kableExtra)



vi <- Feminicidios %>%
  select(TIPO_DELITO,
         MES = MES_HECHO_VI,
         DIA = DIA_HECHO_VI) %>%
  mutate(ORIGEN = "VI")

ds <- Feminicidios %>%
  select(TIPO_DELITO,
         MES = MES_HECHO_DS,
         DIA = DIA_HECHO_DS) %>%
  mutate(ORIGEN = "DS")

f <- Feminicidios %>%
  select(TIPO_DELITO,
         MES = MES_HECHO_F,
         DIA = DIA_HECHO_F) %>%
  mutate(ORIGEN = "F")


datos_meses_dias <- bind_rows(vi, ds, f) %>%
  filter(!is.na(MES), MES != "",
         !is.na(DIA), DIA != "")


top_meses <- datos_meses_dias %>%
  count(TIPO_DELITO, MES) %>%
  group_by(TIPO_DELITO) %>%
  slice_max(n, n = 3) %>%
  rename(CASOS_MES = n)


top_dias <- datos_meses_dias %>%
  semi_join(top_meses, by = c("TIPO_DELITO", "MES")) %>%
  count(TIPO_DELITO, MES, DIA) %>%
  group_by(TIPO_DELITO, MES) %>%
  slice_max(n, n = 1) %>%
  rename(CASOS_DIA = n)


tabla_final <- top_meses %>%
  left_join(top_dias, by = c("TIPO_DELITO", "MES")) %>%
  arrange(TIPO_DELITO, desc(CASOS_MES))


tabla_final_formateada <- tabla_final %>%
  kbl(
    col.names = c("Tipo de Delito", "Mes", "Casos en el Mes",
                  "Día más frecuente", "Casos totales en ese Día"),
    caption = "Meses con mayor incidencia y sus días más críticos",
    align = "lcccc"
  ) %>%
  kable_classic(full_width = FALSE, html_font = "Roboto") %>%
  kable_styling(position = "center", font_size = 14) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#7d5fff")

tabla_final_formateada
Meses con mayor incidencia y sus días más críticos
Tipo de Delito Mes Casos en el Mes Día más frecuente Casos totales en ese Día
Delitos Sexuales AGOSTO 5400 VIERNES 980
Delitos Sexuales JULIO 5357 MARTES 1075
Delitos Sexuales ABRIL 5309 LUNES 964
Feminicidios ENERO 26 SÁBADO 6
Feminicidios ABRIL 24 SÁBADO 5
Feminicidios MARZO 20 DOMINGO 4
Feminicidios MARZO 20 JUEVES 4
Violencia Intrafamiliar JULIO 19328 DOMINGO 3170
Violencia Intrafamiliar AGOSTO 18836 DOMINGO 3784
Violencia Intrafamiliar SEPTIEMBRE 17567 LUNES 3335

En el análisis de los meses con mayor incidencia se observa que, para los tres tipos de delitos, existe una fuerte concentración de casos en días específicos de la semana. En delitos sexuales, los meses críticos registran en promedio 5.355 casos y sus días más frecuentes acumulan entre el 18% y el 20% del total mensual. En feminicidios, aunque el volumen es mucho menor, con un promedio de 23 casos al mes, los días críticos concentran cerca del 20% al 23%, lo que indica una distribución más irregular. En violencia intrafamiliar el volumen es mucho mayor, con más de 18.500 casos mensuales, y los domingos destacan como el día más crítico, concentrando hasta el 20% de los casos. Esto evidencia que, independientemente del delito, hay días que agrupan una proporción significativa de incidentes y que representan puntos clave para priorizar acciones de prevención y respuesta.

operaciones usadas:

Promedio de casos (5.355) = 5400+5357+5309/3

Porcentaje de dias=Casos totales en ese dia / Casos en el mes x 100

Correlacion de pearson

library(ggplot2)
library(reshape2)


corr_matrix <- matrix(
  c( 1.00, -0.2069, -0.2069,
    -0.2069, 1.00, 1.00,
    -0.2069, 1.00, 1.00),
  nrow = 3,
  byrow = TRUE
)

colnames(corr_matrix) <- c("Feminicidios", "Violencia Intrafamiliar", "Delitos Sexuales")
rownames(corr_matrix) <- c("Feminicidios", "Violencia Intrafamiliar", "Delitos Sexuales")


mCorr <- melt(corr_matrix)


ggplot(mCorr, aes(Var2, Var1, fill = value)) +
  geom_tile(color = "white") +
  scale_fill_gradient2(
    low = "#ff7675", 
    high = "#74b9ff", 
    mid = "white", 
    midpoint = 0,
    limits = c(-1, 1)
  ) +
  geom_text(aes(label = round(value, 2)), color = "black", size = 5) +
  labs(
    title = "Matriz de Correlación (Pearson)",
    x = "",
    y = ""
  ) +
  theme_minimal(base_size = 14) +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1),
    plot.title = element_text(face = "bold")
  )

La matriz de correlación evidencia que los feminicidios no se mueven en la misma dirección que los otros dos delitos: presentan una correlación negativa moderada de -0.21 tanto con violencia intrafamiliar como con delitos sexuales, lo que significa que cuando estos aumentan, los feminicidios tienden ligeramente a disminuir, y viceversa. Principalmente por la poca cantidad de datos registrados de estos. Por otro lado, delitos sexuales y violencia intrafamiliar muestran una correlación perfecta de 1, indicando que sus variaciones mensuales están completamente alineadas: cuando uno sube, el otro también lo hace en la misma magnitud. En conjunto, esto sugiere que estos dos delitos comparten dinámicas similares, mientras que los feminicidios se comportan de manera distinta dentro del mismo entorno social.