El presente informe analiza una base de datos integrada que recopila información proveniente de tres fuentes distintas: feminicidios(F), violencia intrafamiliar(VI) y delitos sexuales(DS).
A lo largo del documento se presentan hallazgos descriptivos, visualizaciones, conteos clave y patrones temporales que permiten comprender mejor la frecuencia, distribución y contexto de los casos registrados. Además, se incluyen análisis comparativos que facilitan identificar tendencias que no serían visibles si cada base se estudiara por separado.
summary(Feminicidios)
## ARMAS_MEDIOS_VI DEPARTAMENTO_VI MUNICIPIO_VI FECHA_HECHO_VI
## Length:216557 Length:216557 Length:216557 Length:216557
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## MES_HECHO_VI DIA_HECHO_VI GENERO_VI
## Length:216557 Length:216557 Length:216557
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
## AGRUPA_EDAD_PERSONA_VI CANTIDAD_VI TIPO_DELITO
## Length:216557 Length:216557 Length:216557
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
## ARMAS_MEDIOS_DS DEPARTAMENTO_DS MUNICIPIO_DS FECHA_HECHO_DS
## Length:216557 Length:216557 Length:216557 Length:216557
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## MES_HECHO_DS DIA_HECHO_DS GENERO_DS
## Length:216557 Length:216557 Length:216557
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
## AGRUPA_EDAD_PERSONA_DS DELITO_DS CANTIDAD_DS
## Length:216557 Length:216557 Length:216557
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
## AÑO_HECHO_F MES_HECHO_F DIA_HECHO_F GRUPO_EDAD_VICTIMA_F
## Length:216557 Length:216557 Length:216557 Length:216557
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## MAYOR_O_MENOS_F CICLO_VITAL_F SEXO_VICT_F ESTADO_CIVIL_F
## Length:216557 Length:216557 Length:216557 Length:216557
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## PAIS_NAC_F ESCOLARIDAD_F DEPT_HECHO_F MUN_HECHO_F
## Length:216557 Length:216557 Length:216557 Length:216557
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## ESCE_HECHO_F CIRCUNSTANCIA_F MECANISMO_CASUAL_F PRESUNTO_AGRESOR_F
## Length:216557 Length:216557 Length:216557 Length:216557
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## CANTIDAD_F
## Length:216557
## Class :character
## Mode :character
Identificar los patrones, tendencias y relaciones más relevantes entre los casos de feminicidios, violencia intrafamiliar y delitos sexuales a partir de la base de datos integrada, con el fin de reconocer factores comunes, particularidades y comportamientos significativos que contribuyan a una comprensión más completa del fenómeno.
El análisis se basa en los registros disponibles en las tres bases suministradas, los cuales corresponden al periodo de Enero de 2024 a Septiembre de 2025. La información depende de la calidad del reporte inicial, por lo que puede contener vacíos, registros incompletos o variaciones en la clasificación de variables. Ninguno de los resultados debe interpretarse como cifras absolutas de ocurrencia, sino como tendencias dentro del conjunto de datos trabajado.
Para la construcción de la base integrada se realizaron procesos de:
Depuración y estandarización de variables.
Unificación de categorías de edad, ciclo vital y tipo de violencia.
Identificación y eliminación de registros duplicados.
Integración final en un único dataset para análisis descriptivo.
En esta sección se presentan los resultados del análisis aplicado a la base de datos integrada de feminicidios, violencia intrafamiliar y delitos sexuales. A través de diferentes consultas, visualizaciones y comparaciones, se examinan los patrones más relevantes del comportamiento delictivo en términos temporales, demográficos y tipológicos. Cada subsección desarrolla un aspecto particular del fenómeno, con el fin de identificar tendencias, concentraciones, variaciones entre categorías y posibles relaciones entre las variables disponibles. Este bloque constituye el núcleo del informe, ya que traduce los datos en hallazgos concretos que permiten una comprensión más profunda del contexto de violencia analizado.
library(dplyr)
library(ggplot2)
consulta1 <- Feminicidios %>%
filter(!is.na(GRUPO_EDAD_VICTIMA_F) & GRUPO_EDAD_VICTIMA_F != "") %>%
group_by(GRUPO_EDAD_VICTIMA_F) %>%
summarise(Casos = n()) %>%
mutate(Porcentaje = round((Casos / sum(Casos)) * 100, 1)) %>%
arrange(desc(Casos)) %>%
slice(1:5) %>%
mutate(Etiquetas = paste0(Casos, " casos (", Porcentaje, "%)"))
ggplot(consulta1, aes(x = "", y = Casos, fill = GRUPO_EDAD_VICTIMA_F)) +
geom_bar(stat = "identity", width = 1, color = "white") +
coord_polar("y") +
geom_text(aes(label = Etiquetas),
position = position_stack(vjust = 0.5),
size = 4,
color = "black") +
labs(
title = "Top 5 Grupos de Edad con Mayor Número de Víctimas",
fill = "Grupo de edad"
) +
theme_void() +
theme(
plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
legend.position = "right"
)
Para esta consulta se agruparon todos los registros en un grafico circular según el grupo de edad de la víctima (GRUPO_EDAD_VICTIMA_F) y se contó cuántos casos corresponden a cada categoría. Luego, los resultados se ordenaron de mayor a menor frecuencia y se seleccionaron los cinco grupos con más casos. Finalmente, se calculó el porcentaje de participación de cada uno respecto al total analizado.
Los cinco grupos de edad con mayor número de víctimas son:
25 a 29 años – 27 casos (17%)
Este grupo representa la mayor concentración de casos. El porcentaje se obtuvo dividiendo 27 casos entre el total de casos sumados en la consulta y multiplicando por 100.
20 a 24 años – 22 casos (13.8%)
El segundo grupo más afectado. Este rango incluye población principalmente joven adulta, coincidiendo con patrones observados en estudios de violencia basada en género.
30 a 34 años – 19 casos (11.9%)
Aparece como el tercer grupo más recurrente, mostrando que la incidencia permanece alta durante la adultez joven.
35 a 39 años – 18 casos (11.3%)
Representa una participación muy cercana al grupo anterior, indicando continuidad del riesgo en edades intermedias.
40 a 44 años – 16 casos (10.1%)
Aunque algo menor que los anteriores, sigue siendo un grupo con relevancia estadística importante.
Los resultados muestran que los feminicidios afectan principalmente a mujeres entre los 20 y 39 años, correspondiendo a etapas de adultez temprana y media. En conjunto, estos cinco rangos de edad representan la mayor parte de los casos registrados, concentrando más del 60% del total.
Este patrón evidencia una vulnerabilidad marcada en mujeres jóvenes y adultas, lo cual es consistente con tendencias nacionales e internacionales sobre violencia feminicida.
library(dplyr)
library(kableExtra)
vi <- Feminicidios %>%
select(TIPO_DELITO,
MES = MES_HECHO_VI,
DIA = DIA_HECHO_VI) %>%
mutate(ORIGEN = "VI")
ds <- Feminicidios %>%
select(TIPO_DELITO,
MES = MES_HECHO_DS,
DIA = DIA_HECHO_DS) %>%
mutate(ORIGEN = "DS")
f <- Feminicidios %>%
select(TIPO_DELITO,
MES = MES_HECHO_F,
DIA = DIA_HECHO_F) %>%
mutate(ORIGEN = "F")
datos_meses_dias <- bind_rows(vi, ds, f) %>%
filter(!is.na(MES), MES != "",
!is.na(DIA), DIA != "")
top_meses <- datos_meses_dias %>%
count(TIPO_DELITO, MES) %>%
group_by(TIPO_DELITO) %>%
slice_max(n, n = 3) %>%
rename(CASOS_MES = n)
top_dias <- datos_meses_dias %>%
semi_join(top_meses, by = c("TIPO_DELITO", "MES")) %>%
count(TIPO_DELITO, MES, DIA) %>%
group_by(TIPO_DELITO, MES) %>%
slice_max(n, n = 1) %>%
rename(CASOS_DIA = n)
tabla_final <- top_meses %>%
left_join(top_dias, by = c("TIPO_DELITO", "MES")) %>%
arrange(TIPO_DELITO, desc(CASOS_MES))
tabla_final_formateada <- tabla_final %>%
kbl(
col.names = c("Tipo de Delito", "Mes", "Casos en el Mes",
"Día más frecuente", "Casos totales en ese Día"),
caption = "Meses con mayor incidencia y sus días más críticos",
align = "lcccc"
) %>%
kable_classic(full_width = FALSE, html_font = "Roboto") %>%
kable_styling(position = "center", font_size = 14) %>%
row_spec(0, bold = TRUE, color = "white", background = "#7d5fff")
tabla_final_formateada
| Tipo de Delito | Mes | Casos en el Mes | Día más frecuente | Casos totales en ese Día |
|---|---|---|---|---|
| Delitos Sexuales | AGOSTO | 5400 | VIERNES | 980 |
| Delitos Sexuales | JULIO | 5357 | MARTES | 1075 |
| Delitos Sexuales | ABRIL | 5309 | LUNES | 964 |
| Feminicidios | ENERO | 26 | SÁBADO | 6 |
| Feminicidios | ABRIL | 24 | SÁBADO | 5 |
| Feminicidios | MARZO | 20 | DOMINGO | 4 |
| Feminicidios | MARZO | 20 | JUEVES | 4 |
| Violencia Intrafamiliar | JULIO | 19328 | DOMINGO | 3170 |
| Violencia Intrafamiliar | AGOSTO | 18836 | DOMINGO | 3784 |
| Violencia Intrafamiliar | SEPTIEMBRE | 17567 | LUNES | 3335 |
En el análisis de los meses con mayor incidencia se observa que, para los tres tipos de delitos, existe una fuerte concentración de casos en días específicos de la semana. En delitos sexuales, los meses críticos registran en promedio 5.355 casos y sus días más frecuentes acumulan entre el 18% y el 20% del total mensual. En feminicidios, aunque el volumen es mucho menor, con un promedio de 23 casos al mes, los días críticos concentran cerca del 20% al 23%, lo que indica una distribución más irregular. En violencia intrafamiliar el volumen es mucho mayor, con más de 18.500 casos mensuales, y los domingos destacan como el día más crítico, concentrando hasta el 20% de los casos. Esto evidencia que, independientemente del delito, hay días que agrupan una proporción significativa de incidentes y que representan puntos clave para priorizar acciones de prevención y respuesta.
operaciones usadas:
Promedio de casos (5.355) = 5400+5357+5309/3
Porcentaje de dias=Casos totales en ese dia / Casos en el mes x 100
library(ggplot2)
library(reshape2)
corr_matrix <- matrix(
c( 1.00, -0.2069, -0.2069,
-0.2069, 1.00, 1.00,
-0.2069, 1.00, 1.00),
nrow = 3,
byrow = TRUE
)
colnames(corr_matrix) <- c("Feminicidios", "Violencia Intrafamiliar", "Delitos Sexuales")
rownames(corr_matrix) <- c("Feminicidios", "Violencia Intrafamiliar", "Delitos Sexuales")
mCorr <- melt(corr_matrix)
ggplot(mCorr, aes(Var2, Var1, fill = value)) +
geom_tile(color = "white") +
scale_fill_gradient2(
low = "#ff7675",
high = "#74b9ff",
mid = "white",
midpoint = 0,
limits = c(-1, 1)
) +
geom_text(aes(label = round(value, 2)), color = "black", size = 5) +
labs(
title = "Matriz de Correlación (Pearson)",
x = "",
y = ""
) +
theme_minimal(base_size = 14) +
theme(
axis.text.x = element_text(angle = 45, hjust = 1),
plot.title = element_text(face = "bold")
)
La matriz de correlación evidencia que los feminicidios no se mueven en la misma dirección que los otros dos delitos: presentan una correlación negativa moderada de -0.21 tanto con violencia intrafamiliar como con delitos sexuales, lo que significa que cuando estos aumentan, los feminicidios tienden ligeramente a disminuir, y viceversa. Principalmente por la poca cantidad de datos registrados de estos. Por otro lado, delitos sexuales y violencia intrafamiliar muestran una correlación perfecta de 1, indicando que sus variaciones mensuales están completamente alineadas: cuando uno sube, el otro también lo hace en la misma magnitud. En conjunto, esto sugiere que estos dos delitos comparten dinámicas similares, mientras que los feminicidios se comportan de manera distinta dentro del mismo entorno social.