SENA - Centro Colombo Alemán
Ficha: 3233892
Instructor: Miguel Olivares
Aprendiz: Jesus David Utria Acero
# Cargar librerías
library(readxl)
library(dplyr)
library(ggplot2)
library(tidyr)
library(stringr)
library(knitr)
library(kableExtra)
library(forcats)
library(scales)
# Cargar datos
delitos_sexuales <- read_excel("delitos sexuales.xlsx")
FEMINICIDIO <- read_excel("FEMINICIDIO.xlsx")
violencia_intrafamiliar <- read_excel("violencia intrafamiliar.xlsx")
# Colores
color_critico <- "#48192E"
color_medio <- "#957083"
color_bajo <- "#C59C79"
color_texto <- "#281822"
# Tema uniforme para todos los gráficos
tema_personalizado <- theme_minimal(base_size = 14, base_family = "serif") +
theme(
plot.title = element_text(size = 18, face = "bold", color = color_critico, hjust = 0.5, margin = margin(b = 15)),
plot.subtitle = element_text(size = 13, color = color_texto, hjust = 0.5, face = "italic", margin = margin(b = 10)),
axis.title = element_text(size = 13, face = "bold", color = color_texto),
axis.text = element_text(size = 11, color = color_texto),
legend.title = element_text(size = 12, face = "bold", color = color_texto),
legend.text = element_text(size = 11, color = color_texto),
legend.background = element_rect(fill = color_bajo, color = color_texto, size = 0.5),
panel.grid.major = element_line(color = color_medio, linetype = "dotted", size = 0.3),
panel.grid.minor = element_blank(),
plot.background = element_rect(fill = color_bajo, color = color_texto, size = 1),
panel.background = element_rect(fill = color_bajo, color = NA),
plot.margin = margin(20, 20, 20, 20)
)El presente informe técnico tiene como objetivo principal identificar y cuantificar los patrones geográficos, demográficos y tipológicos que definen la incidencia de los delitos sexuales y la violencia letal de género (feminicidio) en Colombia, basándose estrictamente en las cifras de alta concentración y reporte.
Este estudio se enfoca en desentrañar la asimetría de la violencia a través de las siguientes dimensiones:
Distribución Geográfica: Cuantificación de la desproporcionalidad de casos entre los departamentos y municipios (con énfasis en el Distrito Capital).
Tipología Criminal: Identificación del delito sexual más frecuente (Art. 209).
Perfiles de la Víctima: Análisis de la vulnerabilidad por género (predominio femenino) y edad (impacto en menores y adultos).
Contexto de Letalidad: Evaluación de los patrones geográficos y las modalidades de ejecución del feminicidio (asfixia y arma de fuego).
Los resultados obtenidos son cruciales para la asignación estratégica de recursos y la formulación de políticas públicas, ya que demuestran una disparidad crítica. El análisis concluye que la intervención más urgente debe centrarse en la mitigación de la concentración masiva de delitos sexuales en Bogotá D.C., mientras se atiende simultáneamente el riesgo letal del feminicidio en múltiples centros urbanos con un enfoque en la mujer joven adulta.
El gráfico muestra los Top 5 Departamentos con más casos de delitos sexuales en un período no especificado.
Liderazgo Clave: El departamento de Cundinamarca presenta la cifra más alta con 19.533 casos, lo que representa una incidencia significativamente mayor que el resto.
Segundo Nivel: Antioquia ocupa el segundo lugar con 7.816 casos, una cifra sustancial, pero que es menos de la mitad de los casos registrados en Cundinamarca.
Disminución Marcada: Existe una caída notable en la cantidad de casos entre el segundo y tercer departamento (Valle con 4.415), y la diferencia se reduce considerablemente en los últimos tres puestos.
Concentración en el Top: Los datos sugieren una fuerte concentración de casos en los dos primeros departamentos, ya que Cundinamarca (19.533) y Antioquia (7.816) suman un total de 27.349 casos, lo que es significativamente mayor que la suma de los tres departamentos restantes (Valle, Santander, Tolima) que es de 8.739 casos.
library(dplyr)
library(knitr)
library(kableExtra)
# --- Calcular top 5 departamentos ---
top_deptos <- delitos_sexuales %>%
group_by(DEPARTAMENTO) %>%
summarise(Total_casos = sum(CANTIDAD, na.rm = TRUE)) %>%
arrange(desc(Total_casos)) %>%
head(5)
# --- Caption limpio (UTF-8) ---
caption_utf8 <- iconv("Top 5 Departamentos con más casos de delitos sexuales", from = "latin1", to = "UTF-8")
# --- Crear tabla con kableExtra ---
top_deptos %>%
kable(
col.names = c("Departamento", "Total de Casos"),
caption = caption_utf8,
format.args = list(big.mark = ","),
align = c("l", "r") # Izquierda para texto, derecha para números
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed", "responsive"),
full_width = FALSE,
position = "center",
font_size = 14
) %>%
row_spec(0, bold = TRUE, color = "#F7E6A9", background = "#48192E") %>%
row_spec(1:5, bold = TRUE, background = "#957083", color = "#281822")| Departamento | Total de Casos |
|---|---|
| CUNDINAMARCA | 19,533 |
| ANTIOQUIA | 7,816 |
| VALLE | 4,415 |
| SANTANDER | 2,191 |
| TOLIMA | 2,133 |
Conclusión Rápida
Los datos indican que la mayor concentración de casos reportados en el top 5 se encuentra en Cundinamarca, requiriendo una atención y análisis de variables socioeconómicas y demográficas específicos para este departamento que puedan explicar esta disparidad tan alta.
El análisis de la distribución de casos reportados en los ocho departamentos principales revela una disparidad significativa en la concentración de delitos. El departamento de Cundinamarca domina el conjunto de datos, registrando un volumen de casos que supera ampliamente la suma de varios de los departamentos restantes. Este patrón sugiere un sesgo considerable en la distribución, con Cundinamarca actuando como un valor atípico (outlier) primario dentro de este Top 8.
delitos_sexuales %>%
group_by(DEPARTAMENTO) %>%
summarise(Total_casos = sum(CANTIDAD, na.rm = TRUE)) %>%
arrange(desc(Total_casos)) %>%
slice_head(n = 8) %>%
ggplot(aes(x = reorder(DEPARTAMENTO, Total_casos), y = Total_casos, fill = Total_casos)) +
geom_col(alpha = 0.9) +
geom_text(
aes(label = format(Total_casos, big.mark = ",")),
color = "#F7E6A9",
size = 4.5,
fontface = "bold",
hjust = 1.2
) +
scale_fill_gradientn(colors = c(color_bajo, color_medio, color_critico)) +
coord_flip() +
labs(
title = "Top 8 Departamentos con más Casos de Delitos Sexuales",
subtitle = "Cantidad total de casos reportados (críticos en tono oscuro)",
x = NULL,
y = "Número de Casos"
) +
tema_personalizado +
theme(legend.position = "none")La evidencia empírica dentro de este conjunto de datos indica que la problemática de los delitos sexuales está altamente centralizada en Cundinamarca.
Determinar el grado de concentración de los casos de delitos sexuales a nivel municipal dentro de los departamentos con mayor reporte.
Cundinamarca lidera con 19.533 casos totales.
El volumen de casos en Cundinamarca equivale a aproximadamente el 50.00% de la suma total del Top 8 departamentos (39.070 casos).
Disparidad de Casos: Existe una disparidad extrema en el número de casos. Bogotá D.C. (16,551) tiene casi 5 veces más casos que Medellín (3,489), y su total es más de 7 veces la suma de Cali e Ibagué.
Dependencia Funcional: El campo Departamento está funcionalmente determinado por el campo Municipio (es decir, un municipio siempre pertenece al mismo departamento en este contexto). Esto es una propiedad estándar en el diseño de bases de datos relacionales.
library(dplyr)
library(knitr)
library(kableExtra)
# --- Top 4 municipios con más casos de delitos sexuales ---
top_municipios <- delitos_sexuales %>%
group_by(MUNICIPIO, DEPARTAMENTO) %>%
summarise(Total_casos = sum(CANTIDAD, na.rm = TRUE), .groups = "drop") %>%
arrange(desc(Total_casos)) %>%
slice_head(n = 4)
# --- Caption en UTF-8 para evitar errores ---
caption_utf8 <- iconv("Top 4 Municipios con más casos de delitos sexuales", from = "latin1", to = "UTF-8")
# --- Crear tabla con kableExtra ---
top_municipios %>%
kable(
col.names = c("Municipio", "Departamento", "Total de Casos"),
caption = caption_utf8,
format.args = list(big.mark = ","),
align = c("l", "l", "r") # Izquierda para texto, derecha para números
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed", "responsive"),
full_width = FALSE,
position = "center",
font_size = 14
) %>%
row_spec(0, bold = TRUE, color = "#F7E6A9", background = "#48192E") %>% # Encabezado
row_spec(1:4, bold = TRUE, background = "#957083", color = "#281822") # Filas del top 4| Municipio | Departamento | Total de Casos |
|---|---|---|
| Bogotá D.C. (CT) | CUNDINAMARCA | 16,551 |
| Medellín (CT) | ANTIOQUIA | 3,489 |
| Cali (CT) | VALLE | 2,118 |
| Ibagué (CT) | TOLIMA | 947 |
El análisis confirma que la alta incidencia de casos en el departamento de Cundinamarca se debe primariamente a la concentración urbana, dado que Bogotá D.C. reporta el 84.73% de la totalidad de casos departamentales.
En contraste, los departamentos de Antioquia, Valle y Tolima presentan un patrón de concentración más distribuido, donde sus municipios capitales representan solo entre el 44% y 48% del total departamental.
Por lo tanto, la explicación para la posición atípica de Cundinamarca es la inclusión de los datos de su capital, Bogotá D.C. (entidad con estatus de distrito capital), lo que infla el dato departamental en comparación con los demás departamentos. Esto es crucial para la interpretación de las series de tiempo y la asignación de recursos.
Dominio de Bogotá D.C.: Bogotá D.C. presenta una cifra de casos abrumadoramente superior (16,551) en comparación con los otros tres municipios. Esto indica una distribución altamente asimétrica o sesgada de los casos, donde la capital concentra la mayor parte.
top_municipios %>%
head(5) %>%
ggplot(aes(x = reorder(MUNICIPIO, Total_casos), y = Total_casos, fill = Total_casos)) +
geom_col(alpha = 0.9) +
geom_text(
aes(label = format(Total_casos, big.mark = ",")),
color = "#F7E6A9",
size = 5,
fontface = "bold",
hjust = 1.2
) +
scale_fill_gradientn(colors = c(color_bajo, color_medio, color_critico)) +
coord_flip() +
labs(
title = "Top 4 Municipios con más Casos",
subtitle = "Distribución por municipio ",
x = NULL,
y = "Número de Casos"
) +
tema_personalizado +
theme(legend.position = "none")El gráfico es un ejemplo de visualización de datos efectiva para una distribución de frecuencia. Muestra que, dentro del conjunto de los 4 municipios principales, Bogotá D.C. es el claro outlier (valor atípico o dominante) en cuanto al número de casos, con una magnitud que empequeñece a los otros tres. La elección del gráfico de barras horizontales es la más adecuada para esta comparación de magnitudes.
El análisis del Top 5 de tipos de delitos sexuales revela una fuerte prevalencia de crímenes contra menores de 14 años, lo cual establece el principal foco de la problemática.
Predominio de Crímenes contra Menores: Los dos delitos con mayor frecuencia (Artículos 209 y 208) se dirigen específicamente a menores de 14 años.
Liderazgo de “Actos Sexuales con Menor”: El Artículo 209 (“Actos sexuales con menor de 14 años”) es el delito más reportado con 19.365 casos.
Peso Total de Violencia Sexual: La suma de los cinco tipos de delitos listados asciende a 39.733 casos (\(19.365 + 9.8 + 7.896 + 6.675 + 5.821 = 39.766.8\) - Ajustando la cifra atípica de 9,8).
library(dplyr)
library(knitr)
library(kableExtra)
# Top 5 tipos de delito sexual
top5_delitos <- delitos_sexuales %>%
group_by(DELITO) %>%
summarise(Total_casos = sum(CANTIDAD, na.rm = TRUE)) %>%
arrange(desc(Total_casos)) %>%
slice_head(n = 5) # <-- top 5
# Tabla con kable
top5_delitos %>%
kable(
col.names = c("Tipo de Delito", "Total de Casos"),
caption = "Top 5 tipos de delitos sexuales",
format.args = list(big.mark = ",")
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed", "responsive"),
full_width = FALSE,
position = "center",
font_size = 14
) %>%
row_spec(0, bold = TRUE, color = "#F7E6A9", background = "#48192E") %>%
row_spec(1:5, bold = TRUE, background = "#957083", color = "#281822")| Tipo de Delito | Total de Casos |
|---|---|
| ARTÍCULO 209. ACTOS SEXUALES CON MENOR DE 14 AÑOS | 19,365 |
| ARTÍCULO 208. ACCESO CARNAL ABUSIVO CON MENOR DE 14 AÑOS | 9,846 |
| ARTÍCULO 205. ACCESO CARNAL VIOLENTO | 7,896 |
| ARTÍCULO 206. ACTO SEXUAL VIOLENTO | 6,675 |
| ARTÍCULO 210 A. ACOSO SEXUAL | 5,821 |
El número de casos del delito principal (Art. 209, con 19.365) es casi idéntico al total de casos departamentales de Cundinamarca (19.533). Esto sugiere una fuerte correlación directa entre la alta incidencia reportada en Bogotá D.C. y el volumen de casos de “Actos sexuales con menor de 14 años”.
En consecuencia, cualquier estrategia de intervención y asignación de recursos debe priorizar la mitigación de los delitos contra menores de 14 años, focalizando los esfuerzos en el Distrito Capital de Bogotá.
El análisis de la distribución por género de la víctima establece un claro patrón de vulnerabilidad:
Predominio Femenino: El género femenino es el más afectado, con 45.332 casos reportados.
Disparidad de Género: Los casos de víctimas femeninas superan a los casos de víctimas masculinas (9.999 casos) en una proporción de aproximadamente 4.5 a 1.
Total de Casos Globales: El total de casos en el gráfico es de 56.327 (\(45.332 + 9.999 + 996\)).
delitos_sexuales %>%
mutate(GENERO = ifelse(is.na(GENERO) | GENERO == "N/A", "No informado", GENERO)) %>%
group_by(GENERO) %>%
summarise(Total_casos = sum(CANTIDAD, na.rm = TRUE)) %>%
ggplot(aes(x = reorder(GENERO, Total_casos), y = Total_casos, fill = GENERO)) +
geom_col(alpha = 0.9, show.legend = FALSE) +
geom_text(
aes(label = format(Total_casos, big.mark = ",")),
vjust = -0.5,
size = 5,
fontface = "bold",
color = color_critico
) +
scale_fill_manual(values = c(color_critico, color_medio, color_bajo)) +
scale_y_continuous(labels = comma, expand = expansion(mult = c(0, 0.15))) +
labs(
title = "Distribución de Casos por Género",
subtitle = "Total de casos reportados según género de la víctima",
x = NULL,
y = "Número de Casos"
) +
tema_personalizadoLos datos analizados convergen para definir un perfil de riesgo altamente específico y una focalización geográfica ineludible:
Perfil de la Víctima de Mayor Riesgo: La víctima más recurrente en los reportes es femenina y es objeto de delitos tipificados como “Actos sexuales con menor de 14 años” (Art. 209).
Eje de Intervención: El punto neurálgico para la intervención y la asignación de recursos es la aglomeración urbana de Bogotá D.C., la cual, debido a su alto factor de concentración, infla la estadística departamental y nacional.
Relación de Proporcionalidad: Existe una correlación aparente y directa entre el volumen de casos en Bogotá D.C. (16.551) y el volumen del delito principal (Art. 209, con 19.365), ambos siendo las cifras más altas en sus respectivas categorías, lo que sugiere que la mayoría de los casos reportados en la capital son de esta naturaleza, y que las víctimas en Bogotá D.C. son predominantemente femeninas.
El análisis de la distribución de casos por grupo de edad establece la última pieza clave del perfil de la víctima:
Grupo con Mayor Incidencia: El grupo de Adultos es el que registra la mayor cantidad de casos con 30.317.
Incidencia en Menores (Menores y Adolescentes): La suma de los casos en los grupos de Menores (12.581) y Adolescentes (12.792) totaliza 25.373 casos.
Proporción: Los casos en el grupo de Adultos superan por poco a la suma de los grupos de Menores y Adolescentes, pero la incidencia en la población vulnerable (menores y adolescentes) es sustancialmente alta (44.6% del total informado por edad).
delitos_sexuales %>%
mutate(AGRUPA_EDAD_PERSONA = ifelse(is.na(AGRUPA_EDAD_PERSONA) | AGRUPA_EDAD_PERSONA == "N/A",
"No informado", AGRUPA_EDAD_PERSONA)) %>%
group_by(AGRUPA_EDAD_PERSONA) %>%
summarise(Total_casos = sum(CANTIDAD, na.rm = TRUE)) %>%
arrange(desc(Total_casos)) %>%
ggplot(aes(x = reorder(AGRUPA_EDAD_PERSONA, Total_casos), y = Total_casos, fill = Total_casos)) +
geom_col(alpha = 0.9) +
geom_text(
aes(label = format(Total_casos, big.mark = ",")),
vjust = -0.5,
size = 4,
fontface = "bold",
color = color_critico
) +
scale_fill_gradientn(colors = c(color_bajo, color_medio, color_critico)) +
scale_y_continuous(labels = comma, expand = expansion(mult = c(0, 0.15))) +
labs(
title = "Distribución de Casos por Grupo de Edad",
subtitle = "Víctimas según rango etario - grupos más afectados en Blackberry",
x = NULL,
y = "Número de Casos"
) +
tema_personalizado +
theme(
legend.position = "none",
axis.text.x = element_text(angle = 45, hjust = 1)
)El análisis de todos los datos converge en la definición de dos perfiles de riesgo principales y una clara prioridad geográfica:
Perfil de la Víctima 1 (Tipo de Delito): La alta incidencia del Artículo 209 (19.365 casos) sugiere una crisis de delitos sexuales que afecta primordialmente a menores de 14 años.
Perfil de la Víctima 2 (Género y Edad): A pesar de la alta incidencia de delitos contra menores, el mayor volumen de casos se reporta en el grupo de Adultos (30.317) y es abrumadoramente de género femenino (45.332). Esta disparidad indica que la mujer adulta es la víctima más frecuente en términos absolutos, mientras que la mujer menor de edad es el foco de la tipología criminal más común.
Prioridad de Intervención: La acción más efectiva en términos de reducción de cifras debe centrarse en la población femenina (cubriendo tanto menores como adultas) y debe ejecutarse con prioridad estratégica en el Distrito Capital de Bogotá, dada su altísima concentración de casos (16.551).
El Plan de Intervención debe ser dual: uno enfocado en la prevención de la explotación sexual infantil (Art. 209) y otro enfocado en la protección de la mujer adulta contra delitos como el acceso carnal violento y el acoso sexual (Artículos 205, 206 y 210 A).
Objetivo: Consolidar las conclusiones técnicas obtenidas del análisis de distribución geográfica, tipología criminal, y perfil demográfico (género y edad) de las víctimas de delitos sexuales, e incluir el contexto de la modalidad de feminicidio.
Concentración Geográfica (Eje Central): El Distrito Capital de Bogotá D.C. es el epicentro de la problemática. Sus 16.551 casos concentran el 84.73% del total de Cundinamarca, confirmando que la alta cifra departamental se debe a la capital y no a una distribución uniforme.
Concentración Tipológica (Delito Primario): El tipo de delito con mayor registro es el Artículo 209 (Actos sexuales con menor de 14 años) con 19.365 casos, lo que establece la vulnerabilidad de la niñez como el foco criminal más prevalente
Género: La mujer es el grupo más afectado, representando 45.332 casos, una proporción de 4.5 a 1 respecto al género masculino.
Edad: Aunque el grupo de Adultos (30.317) registra el volumen más alto, la suma de Menores y Adolescentes (25.373) establece que casi la mitad de las víctimas reportadas son menores de edad, lo cual es coherente con el liderazgo del Art. 209.
El análisis de la modalidad de feminicidio indica que la violencia letal contra la mujer es ejecutada con métodos que buscan la alta letalidad: Generadores de Asfixia (39.7%) y Proyectil de Arma de Fuego (24.8%) son las modalidades predominantes.
library(ggplot2)
library(dplyr)
# Top 4 armas usadas en FEMINICIDIO
top4_armas <- FEMINICIDIO %>%
group_by(ARMA_USADA) %>%
summarise(Total_casos = sum(CANTIDAD, na.rm = TRUE)) %>%
arrange(desc(Total_casos)) %>%
slice_head(n = 4) %>% # solo los 4 primeros
ungroup() %>%
mutate(
Porcentaje = Total_casos / sum(Total_casos) * 100,
Etiqueta = paste0(round(Porcentaje, 1), "%\n(", format(Total_casos, big.mark = ","), ")")
)
# Gráfico circular
ggplot(top4_armas, aes(x = 1, y = Total_casos, fill = ARMA_USADA)) +
geom_col(color = color_texto, size = 1, width = 1) +
coord_polar(theta = "y") +
geom_text(
aes(label = Etiqueta),
position = position_stack(vjust = 0.5),
color = "#F7E6A9",
size = 5,
fontface = "bold"
) +
scale_fill_manual(values = c(color_critico, color_medio, color_bajo, "#6C5141")) +
labs(
title = "Top 4 Armas Usadas en Feminicidio",
subtitle = "Porcentaje y cantidad de casos",
fill = "Arma usada"
) +
tema_personalizado +
theme(
axis.title = element_blank(),
axis.text = element_blank(),
axis.ticks = element_blank(),
panel.grid = element_blank(),
legend.position = "right"
)La evidencia técnica exige una intervención de alta intensidad centrada en Bogotá D.C., priorizando la protección de la mujer y la niñez contra delitos sexuales (Art. 209) e implementando medidas de seguridad que aborden las modalidades de violencia letal identificadas en el feminicidio (asfixia y armas de fuego).
Objetivo: Sintetizar y articular los hallazgos críticos de la violencia sexual y de género basados en la distribución geográfica, tipología, y perfil de la víctima.
Género: La mujer es la población más vulnerable, registrando 45.332 casos de delitos sexuales, lo que es 4.5 veces la cifra reportada para el género masculino. 2. Tipología y Edad:
Foco en la Niñez: El delito más frecuente es el Artículo 209 (Actos sexuales con menor de 14 años) con 19.365 casos.
Alto Volumen Adulto: Aunque el foco está en la niñez, el mayor volumen absoluto de víctimas (30.317) se encuentra en el grupo de Adultos, lo que indica que la violencia sexual afecta masivamente a mujeres de todas las edades.
femi_mun_top5 <- FEMINICIDIO %>%
group_by(MUN_HECHO) %>%
summarise(Total = sum(CANTIDAD, na.rm = TRUE)) %>%
arrange(desc(Total)) %>%
slice_head(n = 3)
ggplot(femi_mun_top5, aes(x = reorder(MUN_HECHO, Total), y = Total, fill = Total)) +
geom_col(alpha = 0.9) +
geom_text(
aes(label = Total),
hjust = 1.2,
color = "#F7E6A9",
size = 5,
fontface = "bold"
) +
scale_fill_gradientn(colors = c(color_bajo, color_medio, color_critico)) +
coord_flip() +
labs(
title = "Top 3 Municipios con mas Feminicidios",
subtitle = "Casos totales por municipio - valores críticos resaltados",
x = NULL,
y = "Número de Casos"
) +
tema_personalizado +
theme(legend.position = "none")La evidencia técnica exige una respuesta diferenciada basada en la naturaleza del delito:
Estrategia Central (Delitos Sexuales): La principal asignación de recursos para la prevención del delito sexual debe ser dirigida a Bogotá D.C. La intervención debe tener un enfoque de género y protección a la niñez debido a la prevalencia del Art. 209 y la alta afectación femenina.
Estrategia Focalizada (Feminicidio): La respuesta a la violencia letal debe ser implementada simultáneamente en Bogotá D.C., Medellín y Soledad. Las políticas de seguridad deben considerar los métodos de ejecución identificados (asfixia y armas de fuego) para implementar medidas de control que mitiguen la letalidad en los actos de violencia de género.
El conjunto de datos de delitos sexuales presenta una distribución altamente asimétrica (sesgada).
Punto de Foco: La problemática se centra en el Distrito Capital de Bogotá D.C..
Magnitud: Bogotá D.C. registra 16.551 casos, lo que representa el 84.73% del total departamental de Cundinamarca.
Disparidad Urbana: La concentración en Bogotá D.C. es tal que su cifra (\(16.551\)) supera la suma de los tres municipios siguientes (Medellín, Cali, Ibagué), los cuales suman solo \(6.554\) casos. Esto confirma que el principal desafío en el reporte de delitos sexuales es un fenómeno urbano masivo en la capital.
Los datos definen dos ejes de vulnerabilidad:
Género: La mujer es el objetivo principal, con 45.332 casos. Esta cifra es aproximadamente 4.5 veces mayor que la del género masculino (\(9.999\) casos).
Edad y Tipología (Delito Sexual):
Foco Criminal: El delito más reportado es el Artículo 209 (Actos sexuales con menor de 14 años) con 19.365 casos.
Volumen de Casos: El mayor volumen absoluto de casos se registra en el grupo de Adultos (\(30.317\)). La alta cifra del Art. 209, sin embargo, demuestra que la niñez es la población más afectada por la tipología criminal más frecuente.
El feminicidio establece un perfil de riesgo diferente, centrado en la letalidad y distribución geográfica.
Modalidad de Ejecución: La violencia letal es ejecutada con alta intencionalidad. Las dos modalidades predominantes son Generadores de Asfixia (39.7% / 56 casos) y Proyectil de Arma de Fuego (24.8% / 35 casos). 2. Distribución Geográfica (Feminicidio): A diferencia de los delitos sexuales, el riesgo letal está distribuido de forma más uniforme en los principales centros urbanos, con Soledad, Medellín y Bogotá D.C. empatando con 9 casos cada uno en el Top 3.
Edad de la Víctima (Feminicidio): El riesgo letal se concentra en mujeres jóvenes adultas, específicamente en los grupos de 25 a 29 años (27 casos) y 20 a 24 años (22 casos).
femi_edad_top5 <- FEMINICIDIO %>%
group_by(GRUPO_EDAD_VICTIMA) %>%
summarise(Total = sum(CANTIDAD, na.rm = TRUE)) %>%
arrange(desc(Total)) %>%
slice_head(n = 5)
ggplot(femi_edad_top5, aes(x = reorder(GRUPO_EDAD_VICTIMA, Total), y = Total, fill = Total)) +
geom_col(alpha = 0.9) +
geom_text(
aes(label = Total),
vjust = -0.5,
size = 5,
fontface = "bold",
color = color_critico
) +
scale_fill_gradientn(colors = c(color_bajo, color_medio, color_critico)) +
scale_y_continuous(expand = expansion(mult = c(0, 0.15))) +
labs(
title = "Top 5 Grupos de Edad con más Feminicidios",
subtitle = "Distribución etaria de las víctimas - grupos más vulnerables en Blackberry",
x = "Grupo de Edad",
y = "Número de Casos"
) +
tema_personalizado +
theme(
legend.position = "none",
axis.text.x = element_text(angle = 45, hjust = 1)
)El análisis técnico confirma la necesidad de una estrategia de seguridad dual:
Intervención de Escala: Prioridad en Bogotá D.C. para la prevención del delito sexual masivo, enfocada en la protección a la niñez (por tipología) y a la mujer adulta (por volumen).
Intervención Táctica: Respuesta inmediata en Soledad, Medellín, y Bogotá D.C. para mitigar la violencia letal, enfocándose en el perfil de la víctima joven adulta y el control de las modalidades de alta letalidad (asfixia y armas de fuego).mos de alerta temprana y control de armas en los tres principales focos de feminicidio.
library(dplyr)
# Total de delitos sexuales por departamento
delitos_depto <- delitos_sexuales %>%
group_by(DEPARTAMENTO) %>%
summarise(Total_delitos_sexuales = sum(CANTIDAD, na.rm = TRUE))
# Total de feminicidios por departamento
feminicidios_depto <- FEMINICIDIO %>%
group_by(DEPT_HECHO) %>%
summarise(Total_feminicidios = sum(CANTIDAD, na.rm = TRUE))
# Unir por departamento
correlacion_df <- merge(delitos_depto, feminicidios_depto,
by.x = "DEPARTAMENTO", by.y = "DEPT_HECHO",
all = TRUE)
# Reemplazar NA por 0
correlacion_df[is.na(correlacion_df)] <- 0
# Calcular correlación de Pearson
correlacion_resultado <- cor(correlacion_df$Total_delitos_sexuales,
correlacion_df$Total_feminicidios, method = "pearson")Correlación Débil Positiva: El coeficiente de Pearson de \(r = 0.21\) es un valor bajo y positivo.
Positivo significa que, a medida que el número de Delitos Sexuales aumenta, el número de Feminicidios tiende ligeramente a aumentar.
Bajo (\(|r| < 0.3\) ) indica que la relación es débil. En términos de modelado predictivo, el Total de Delitos Sexuales explica muy poco la variabilidad del Total de Feminicidios.
La mayoría de los departamentos se agrupan en la zona de bajo Total de Delitos Sexuales (cercano a 0) y bajo Total de Feminicidios (cercano a 5-10).
Se observan algunos valores atípicos (Outliers) que distorsionan el modelo de regresión:
Cundinamarca: Presenta un número extremadamente alto de Delitos Sexuales (cercano a 20,000) pero un número moderado de Feminicidios (cercano a 6). Este punto “jala” la línea de tendencia hacia la derecha, pero tiene un bajo impacto en la correlación del conjunto de datos debido a su posición vertical.
Atlántico / La Guajira (LE DEL CAUCA): Muestran valores de Feminicidios relativamente altos (cercanos a 20) a pesar de tener un número muy bajo de Delitos Sexuales. Estos puntos incrementan la varianza en el eje Y para la parte izquierda del gráfico.
library(ggplot2)
# Usar el dataframe que ya unimos y limpiamos
# correlacion_df: columnas DEPARTAMENTO, Total_delitos_sexuales, Total_feminicidios
ggplot(correlacion_df, aes(x = Total_delitos_sexuales, y = Total_feminicidios, label = DEPARTAMENTO)) +
geom_point(color = color_critico, size = 4, alpha = 0.7) +
geom_smooth(method = "lm", se = FALSE, color = color_medio, linetype = "dashed", size = 1) +
geom_text(aes(label=DEPARTAMENTO), hjust = 0.5, vjust = -1.2, size = 3.5, check_overlap = TRUE) +
labs(
title = "Correlación entre Delitos Sexuales y Feminicidios por Departamento",
subtitle = paste0("Coeficiente de correlación de Pearson: ", round(correlacion_resultado, 2)),
x = "Total de Delitos Sexuales",
y = "Total de Feminicidios"
) +
tema_personalizado +
theme(
plot.title = element_text(color = color_critico, size = 18, face = "bold"),
plot.subtitle = element_text(color = color_texto, size = 13, face = "italic"),
axis.title = element_text(size = 13, face = "bold"),
axis.text = element_text(size = 11)
)Como técnico en sistemas o analista de datos, mi conclusión es la siguiente:
El modelo de correlación lineal basado únicamente en el Total de Delitos Sexuales es un pobre predictor para el Total de Feminicidios a nivel departamental.
Aunque existe una correlación positiva extremadamente débil (\(r=0.21\) ), esta es estadísticamente irrelevante para establecer una relación causal o para construir un modelo de Machine Learning que prediga los Feminicidios basándose solo en los Delitos Sexuales.
La variabilidad en los Feminicidios (eje Y) está fuertemente influenciada por otras variables ocultas o factores contextuales que no están capturados en este dataset (por ejemplo, densidad poblacional, índices socioeconómicos, calidad de reportes, estrategias de seguridad local, etc.).
Este análisis de datos revela patrones críticos en la violencia de género en Colombia que requieren atención inmediata:
A. Concentración Geográfica Asimétrica: Los delitos sexuales muestran una concentración significativa y desproporcionada en el Distrito Capital de Bogotá D.C..
B. Afectación Diferenciada por Género y Tipología: Existe una clara afectación que define el perfil de la víctima principal.
Género: La mujer es el grupo más afectado con 45.332 casos reportados, representando 4.5 veces más que el género masculino.
Tipología Criminal: El delito con mayor incidencia es el Artículo 209 (Actos sexuales con menor de 14 años) con 19.365 casos. Esto establece la niñez como el principal foco de la tipología criminal más frecuente.
C. Patrones Geográficos Específicos de Riesgo Letal: Los feminicidios presentan patrones geográficos, etarios y de modalidad de ejecución que requieren intervenciones focalizadas.
Geografía de Riesgo: El riesgo de feminicidio se distribuye de manera uniforme entre Soledad, Medellín y Bogotá D.C. (9 casos cada uno).
Edad de Riesgo: La víctima más vulnerable a la violencia letal se encuentra en los grupos de 25 a 29 años y 20 a 24 años.
Modalidad: La letalidad es alta, con Generadores de Asfixia (39.7%) y Proyectil de Arma de Fuego (24.8%) como las armas más utilizadas.
Prevención Territorializada de Máxima Prioridad
Focalización: Fortalecer las políticas de prevención y asignar la mayor cantidad de recursos a Bogotá D.C. para mitigar la alta incidencia de delitos sexuales.
Respuesta Letal: Implementar políticas de control de violencia letal de forma equitativa y urgente en Soledad, Medellín y Bogotá D.C., dada su igualitaria concentración de feminicidios.
Protección de Grupos Vulnerables (Doble Enfoque)
Niñez (Tipología): Implementar programas de prevención específicos para el delito Artículo 209, dada su prevalencia.
Mujeres Jóvenes Adultas (Feminicidio): Diseñar planes de acción y sistemas de alerta temprana dirigidos a los grupos de edad con mayor riesgo de feminicidio (20 a 29 años).
Mejora de Datos y Articulación
Mejorar los sistemas de registro de casos para estandarizar la recolección, permitiendo distinguir claramente entre la incidencia real y la alta propensión al reporte en centros urbanos.
Cruzar variables demográficas para el feminicidio (ej. relación víctima-victimario) para mejorar la eficacia de las órdenes de protección.
Sensibilización y Control Táctico
Desarrollar campañas de sensibilización con enfoque de género y protección de la niñez.
Implementar controles y protocolos de seguridad específicos contra las modalidades de alta letalidad identificadas en el feminicidio (asfixia y armas de fuego).
Informe generado el 8/12/2025
Análisis realizado por Jesus Utria
SENA-COLOMBO ALEMÁN