Introducción

Este trabajo presenta información sobre los presuntos homicidios ocurridos en Colombia entre los años 2015 y 2023, registrados por el Instituto Nacional de Medicina Legal y Ciencias Forenses. Su objetivo es exponer el avance de una investigación centrada en el análisis de la violencia homicida en el país durante este período. El estudio de este fenómeno es de gran relevancia, ya que los homicidios representan una de las principales problemáticas en Colombia, afectando la seguridad, la estabilidad social y el respeto por la vida, pilar fundamental de cualquier democracia. Este documento se estructura de la siguiente manera: en primer lugar, se describe el conjunto de datos trabajado, incluyendo el tamaño de la muestra y el número de variables. Posteriormente, se presentan las características de cada variable, diferenciando entre cuantitativas y cualitativas, junto con sus escalas y unidades de medición. A continuación, se lleva a cabo un proceso de limpieza y preprocesamiento de los datos para corregir posibles inconsistencias o información faltante. Luego, se exponen las estadísticas descriptivas mediante indicadores de tendencia central, dispersión y posición, organizadas en una tabla de referencia. Finalmente, se presentan gráficos elaborados con herramientas como ggplot en R y Excel, con el objetivo de ofrecer una visión clara y estructurada de los homicidios en Colombia en el período de estudio. Los datos fueron encontrados en datos abiertos Colombia y el tamaño de la muestra es 111263 x 35. Es una muestra bastante amplia, no obstante, para simplificar el trabajo se escogieron ocho variables que considero que son las más importantes, las cuales son las siguientes con su respectiva descripción: Variable Tipo Escala de medición Unidad de medición Ciclo vital Cualitativa ordinal Ordinal No aplica Sexo de la víctima Cualitativa nominal Nominal No aplica Escolaridad Cualitativa ordinal Ordinal No aplica Mes del hecho Cualitativa nominal Nominal No aplica Día del hecho Cuantitativa discreta Razón Días Departamento Cualitativa nominal Nominal No aplica Mecanismo causal Cualitativa nominal Nominal No aplica Estado civil Cualitativa nominal Nominal No aplica

A continuación, se muestra las gráficas obtenidas y su posible explicación, con algunas medidas de tendencia central y de dispersión:”

library(ggplot2)
a <- read.csv("C:\\Users\\Elías\\Documents\\Elías\\U\\Semestre IX\\Teoría de probabilidad\\Presuntos_Homicidios._Colombia__2015_a_2023._Cifras_definitivas_20250209.csv",stringsAsFactors = TRUE)
Varible Tipo Escala de medición Unidad de medición
Ciclo Vital Cualitativa ordinal Ordinal No aplica
Sexo de la víctima Cualitativa nominal Nominal No aplica
Escolaridad Cualitativa ordinal Ordinal No aplica
Mes del hecho Cualitativa nominal Nominal No aplica
Día del hecho Cuantitativa discreta Razón Días
Departamento Cualitativa nominal Nominal No aplica
Mecanismo causal Cualitativa nominal Nominal No aplica
Estado civil Cualitativa nominal Nominal No aplica

A continuación, se muestra las gráficas obtenidas y su posible explicación, con algunas medidas de tendencia central y de dispersión:

1. Ciclo vital

Rangos de edad Xi Ciclo vital Homicidios (ni) Ni fi Fi
[0-5] 2,5 Primera infancia 563 563 0,00506008 0,00506008
[6-11] 8,5 Infancia 133 696 0,00119537 0,00625545
[12-17] 14,5 Adolescencia 5651 6347 0,05078957 0,05704502
[18-28] 23 Juventud 45378 51725 0,40784448 0,4648895
[29-59] 44 Adultez 54505 106230 0,48987534 0,95476484
60+ 60 Adulto mayor 5008 11238 0,04501047 0,99977531
Por determinar 10 Por determinar 25 111263 0,00022469 1
 ggplot(a, aes(x = Ciclo.Vital)) +
  geom_bar(fill = "steelblue") +  # Color de las barras
  labs(x = "Rango de edad", y = "Asesinatos", title = "Gráfica 1") +
  theme_minimal()+
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")

De los datos suministrados de la tabla 1 se obtienen los siguientes datos:

Medida
Mediana 32,66
Media 34,3970727
Desviación estándar 12,40348493
Coeficiente de variación 36%

Los datos de tendencia central muestran una mediana de 32,66 años, lo que indica que la mayoría de los casos se encuentran en la etapa de adultez. La media, de aproximadamente 34,39 años, representa el promedio de edad en los homicidios analizados. La comparación entre la media y la mediana sugiere una asimetría positiva en la distribución de los datos. Además, la desviación estándar es de 12,4, con un coeficiente de variación del 36%, lo que refleja una variabilidad moderada en las edades registradas. El diagrama de cajas, presentado en la imagen 1, confirma la asimetría positiva y muestra que la mayoría de los datos se concentran en el tercer cuartil, además de evidenciar la presencia de varios valores atípicos.

2. Sexo de la víctima

table(a$Sexo.de.la.victima)
## 
##        Hombre Indeterminado         Mujer 
##        102174            93          8996
install.packages(library(knitr))
## Warning: packages 'knitr', 'ggplot2', 'stats', 'graphics', 'grDevices',
## 'utils', 'datasets', 'methods', 'base' are in use and will not be installed
categorias = c("Hombre", "Indeterminado","Mujer")
freq = c(102174, 93,8996)
df= data.frame(categorias, freq)
ggplot(df,aes(x="",y=freq, fill=categorias))+
  geom_bar(stat = "identity",color="white")+
  coord_polar(theta="y")

En la gráfica 2 se observa que la mayoría de los datos están concentrados en los hombres aproximadamente con un 92%, un 8% las mujeres y los homicidios que no se les pudo determinar el sexo, es decir los indeterminados no representan ni el 1% de los casos.

3. Escolaridad

table(a$Escolaridad)
## 
##                       Doctorado o equivalente 
##                                             5 
##                     Educación básica primaria 
##                                         35496 
## Educación básica secundaria o secundaria baja 
##                                         16316 
##      Educación inicial y educación preescolar 
##                                         13343 
##             Educación media o secundaria alta 
##                                         17003 
##   Educación técnica profesional y tecnológica 
##                                          2398 
##       Especialización, maestría o equivalente 
##                                            13 
##       Especialización, Maestría o equivalente 
##                                            16 
##                               Sin escolaridad 
##                                          3122 
##                               Sin información 
##                                         19760 
##                               Sin Información 
##                                          3708 
##                                 Universitario 
##                                            83
ggplot(a, aes(x = Escolaridad)) +
  geom_bar(fill = "red") +  # Color de las barras
  labs(x = "Nivel de educación", y = "Asesinatos", title = "Gráfica 3") +
  theme_minimal()+
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")

La gráfica 3 nos muestra que la mayoría de los homicidios se encuentran en la educación básica primaria, y en los datos con menor peso se encuentran en la variable otros y sin información.

4. Mes del hecho

table(a$Mes.del.hecho)
## 
##           Abril          Agosto       Diciembre           Enero         Febrero 
##            8664            9395           10494            9568            8283 
##           Julio           Junio           Marzo            Mayo       Noviembre 
##            9533            9275            8953            9629            9068 
##         Octubre      Septiembre Sin Información 
##            9167            9000             234
ggplot(a, aes(x = Mes.del.hecho)) +
  geom_bar(fill = "steelblue") +  # Color de las barras
  labs(x = "Mes del hecho", y = "Asesinatos", title = "Gráfica 4") +
  theme_minimal()+
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")

En la gráfica 4 se observa que diciembre es el mes con mayor incidencia de homicidios, con aproximadamente un 9% de los casos. Sin embargo, la categoría otros agrupan los seis meses restantes, representando alrededor del 47% de los datos. Esto indica que los homicidios no se concentran de manera significativa en un solo mes, y aunque diciembre presenta la cifra más alta, la diferencia con los demás meses no es abismal.

5. Día del hecho

table(a$Dia.del.hecho)
## 
##         Domingo          Jueves           Lunes          Martes       Miércoles 
##           23263           13535           15302           13285           13197 
##          Sábado Sin Información         Viernes 
##           17924             234           14523
ggplot(a, aes(x = Dia.del.hecho)) +
  geom_bar(fill = "steelblue") +  # Color de las barras
  labs(x = "Día del hecho", y = "Asesinatos", title = "Gráfica 5") +
  theme_minimal()

La gráfica 5 muestra que la mayor concentración de homicidios ocurrió durante el fin de semana, con un incremento significativo los sábados y domingos. En contraste, el martes fue el día con menor incidencia. Esto sugiere que los fines de semana fueron el periodo de mayor riesgo para estos eventos. Aunque los días laborables registraron una menor cantidad de casos en comparación con el fin de semana, cada uno de ellos presentó una incidencia superior al 10%, lo que indica que, si bien la concentración es menor, la violencia letal no desaparece en estos días y sigue siendo un factor relevante para considerar.

6. Departamento

table(a$Departamento.del.hecho.DANE)
## 
##                                                 Amazonas 
##                                                      137 
##                                                Antioquia 
##                                                    17133 
##                                                   Arauca 
##                                                     1471 
## Archipiélago de San Andrés, Providencia y Santa Catalina 
##                                                      246 
##                                                Atlántico 
##                                                     5642 
##                                             Bogotá, D.C. 
##                                                    10412 
##                                                  Bolívar 
##                                                     4192 
##                                                   Boyacá 
##                                                      796 
##                                                   Caldas 
##                                                     1570 
##                                                  Caquetá 
##                                                     1451 
##                                                 Casanare 
##                                                      681 
##                                                    Cauca 
##                                                     5409 
##                                                    Cesar 
##                                                     2380 
##                                                    Chocó 
##                                                     1647 
##                                                  Córdoba 
##                                                     2363 
##                                             Cundinamarca 
##                                                     3755 
##                                                  Guainía 
##                                                       39 
##                                                 Guaviare 
##                                                      306 
##                                                    Huila 
##                                                     2378 
##                                               La Guajira 
##                                                     1753 
##                                                Magdalena 
##                                                     2802 
##                                                     Meta 
##                                                     2523 
##                                                   Nariño 
##                                                     3301 
##                                       Norte de Santander 
##                                                     4899 
##                                                 Putumayo 
##                                                     1523 
##                                                  Quindío 
##                                                     1841 
##                                                Risaralda 
##                                                     2245 
##                                                Santander 
##                                                     2850 
##                                          Sin información 
##                                                       95 
##                                                    Sucre 
##                                                     1553 
##                                                   Tolima 
##                                                     2588 
##                                          Valle del Cauca 
##                                                    21124 
##                                                   Vaupés 
##                                                       18 
##                                                  Vichada 
##                                                      140
ggplot(a, aes(x = Departamento.del.hecho.DANE)) +
  geom_bar(fill = "steelblue") +  # Color de las barras
  labs(x = "Departamentos", y = "Asesinatos", title = "Gráfica 6") +
  theme_minimal()+
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")

La gráfica 6 nos dice que el departamento con mayor concentración de datos es el Valle del Cauca y luego lo sigue Antioquia. Los datos de la imagen 7 nos dicen que 6 departamentos poseen cerca del 59% de los datos y el resto de los departamentos poseen cerca del 41% de los casos.

7. Mecanismo causal

table(a$Mecanismo.Causal)
## 
## Agente o mecanismo explosivo                     Caústico 
##                          640                            4 
##                  Contundente                     Cortante 
##                         3287                          483 
##            corto contundente            Corto contundente 
##                            1                         2391 
##               Corto punzante                    Eléctrico 
##                        19406                           11 
##             Extrangulamiento       Generadores de asfixia 
##                            2                         2251 
## Mecanismo o agente explosivo                         Otro 
##                          142                           30 
##               Por determinar   Proyectil de arma de fuego 
##                          256                        81790 
##   Proyectil de Arma de Fuego                     Punzante 
##                           11                          249 
##                      Térmico                       Tóxico 
##                          146                          163
ggplot(a, aes(x = Mecanismo.Causal)) +
  geom_bar(fill = "steelblue") +  # Color de las barras
  labs(x = "Mecanismo causal", y = "Asesinatos", title = "Gráfica 7") +
  theme_minimal()+
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")

La tabla numero 6 nos dicen que los datos se encuentran mayormente concentrados en proyectil de arma de fuego representando aproximadamente del 73% de los datos, luego le siguen las armas cortopunzantes.

8. Estado civil

table(a$Estado.Civil)
## 
##                  Casado(a)                  No aplica 
##                       6317                        640 
## Separado(a), divorciado(a)            Sin información 
##                       2497                      18008 
##                 Soltero(a)                Unión libre 
##                      48907                      34315 
##                Unión Libre                   Viudo(a) 
##                          1                        578
ggplot(a, aes(x = Estado.Civil)) +
  geom_bar(fill = "steelblue") +  # Color de las barras
  labs(x = "Estado civil", y = "Asesinatos", title = "Gráfica 8") +
  theme_minimal()+
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")

La mayoría de los homicidios analizados corresponden a personas solteras, quienes representan más del 43% del total de casos. Les siguen aquellas en unión libre, con una incidencia superior al 30%. En conjunto, estas dos categorías agrupan más del 70% de los casos, lo que sugiere que el estado civil podría estar relacionado con ciertos factores de vulnerabilidad. Es posible que las personas solteras y en unión libre estén más expuestas a situaciones de riesgo, ya sea por mayor participación en actividades sociales, menor estabilidad económica o ausencia de redes de apoyo familiar sólidas. Pero solo son suposiciones.

Conclusiones

El análisis de los homicidios en Colombia entre 2015 y 2023 evidencia la magnitud y distribución de este fenómeno en el país. La mayoría de los casos afectan a personas en etapa de adultez, principalmente hombres, con niveles de escolaridad bajos y en condición de soltería o unión libre. Además, la violencia homicida muestra una mayor concentración en ciertos departamentos como Valle del Cauca y Antioquia, y un patrón recurrente en fines de semana y el mes de diciembre, aunque sin una diferencia abrumadora respecto a otros periodos. La principal causa identificada es el uso de armas de fuego, lo que subraya la necesidad de medidas específicas para el control de este tipo de armamento. Estos hallazgos confirman que el problema de los homicidios en Colombia no solo es estructural, sino que está vinculado a factores sociales, económicos y regionales.