Este trabajo presenta información sobre los presuntos homicidios ocurridos en Colombia entre los años 2015 y 2023, registrados por el Instituto Nacional de Medicina Legal y Ciencias Forenses. Su objetivo es exponer el avance de una investigación centrada en el análisis de la violencia homicida en el país durante este período. El estudio de este fenómeno es de gran relevancia, ya que los homicidios representan una de las principales problemáticas en Colombia, afectando la seguridad, la estabilidad social y el respeto por la vida, pilar fundamental de cualquier democracia. Este documento se estructura de la siguiente manera: en primer lugar, se describe el conjunto de datos trabajado, incluyendo el tamaño de la muestra y el número de variables. Posteriormente, se presentan las características de cada variable, diferenciando entre cuantitativas y cualitativas, junto con sus escalas y unidades de medición. A continuación, se lleva a cabo un proceso de limpieza y preprocesamiento de los datos para corregir posibles inconsistencias o información faltante. Luego, se exponen las estadísticas descriptivas mediante indicadores de tendencia central, dispersión y posición, organizadas en una tabla de referencia. Finalmente, se presentan gráficos elaborados con herramientas como ggplot en R y Excel, con el objetivo de ofrecer una visión clara y estructurada de los homicidios en Colombia en el período de estudio. Los datos fueron encontrados en datos abiertos Colombia y el tamaño de la muestra es 111263 x 35. Es una muestra bastante amplia, no obstante, para simplificar el trabajo se escogieron ocho variables que considero que son las más importantes, las cuales son las siguientes con su respectiva descripción: Variable Tipo Escala de medición Unidad de medición Ciclo vital Cualitativa ordinal Ordinal No aplica Sexo de la víctima Cualitativa nominal Nominal No aplica Escolaridad Cualitativa ordinal Ordinal No aplica Mes del hecho Cualitativa nominal Nominal No aplica Día del hecho Cuantitativa discreta Razón Días Departamento Cualitativa nominal Nominal No aplica Mecanismo causal Cualitativa nominal Nominal No aplica Estado civil Cualitativa nominal Nominal No aplica
A continuación, se muestra las gráficas obtenidas y su posible explicación, con algunas medidas de tendencia central y de dispersión:”
library(ggplot2)
a <- read.csv("C:\\Users\\Elías\\Documents\\Elías\\U\\Semestre IX\\Teoría de probabilidad\\Presuntos_Homicidios._Colombia__2015_a_2023._Cifras_definitivas_20250209.csv",stringsAsFactors = TRUE)
| Varible | Tipo | Escala de medición | Unidad de medición |
|---|---|---|---|
| Ciclo Vital | Cualitativa ordinal | Ordinal | No aplica |
| Sexo de la víctima | Cualitativa nominal | Nominal | No aplica |
| Escolaridad | Cualitativa ordinal | Ordinal | No aplica |
| Mes del hecho | Cualitativa nominal | Nominal | No aplica |
| Día del hecho | Cuantitativa discreta | Razón | Días |
| Departamento | Cualitativa nominal | Nominal | No aplica |
| Mecanismo causal | Cualitativa nominal | Nominal | No aplica |
| Estado civil | Cualitativa nominal | Nominal | No aplica |
A continuación, se muestra las gráficas obtenidas y su posible explicación, con algunas medidas de tendencia central y de dispersión:
| Rangos de edad | Xi | Ciclo vital | Homicidios (ni) | Ni | fi | Fi |
|---|---|---|---|---|---|---|
| [0-5] | 2,5 | Primera infancia | 563 | 563 | 0,00506008 | 0,00506008 |
| [6-11] | 8,5 | Infancia | 133 | 696 | 0,00119537 | 0,00625545 |
| [12-17] | 14,5 | Adolescencia | 5651 | 6347 | 0,05078957 | 0,05704502 |
| [18-28] | 23 | Juventud | 45378 | 51725 | 0,40784448 | 0,4648895 |
| [29-59] | 44 | Adultez | 54505 | 106230 | 0,48987534 | 0,95476484 |
| 60+ | 60 | Adulto mayor | 5008 | 11238 | 0,04501047 | 0,99977531 |
| Por determinar | 10 | Por determinar | 25 | 111263 | 0,00022469 | 1 |
ggplot(a, aes(x = Ciclo.Vital)) +
geom_bar(fill = "steelblue") + # Color de las barras
labs(x = "Rango de edad", y = "Asesinatos", title = "Gráfica 1") +
theme_minimal()+
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")
De los datos suministrados de la tabla 1 se obtienen los siguientes datos:
| Medida | |
|---|---|
| Mediana | 32,66 |
| Media | 34,3970727 |
| Desviación estándar | 12,40348493 |
| Coeficiente de variación | 36% |
Los datos de tendencia central muestran una mediana de 32,66 años, lo que indica que la mayoría de los casos se encuentran en la etapa de adultez. La media, de aproximadamente 34,39 años, representa el promedio de edad en los homicidios analizados. La comparación entre la media y la mediana sugiere una asimetría positiva en la distribución de los datos. Además, la desviación estándar es de 12,4, con un coeficiente de variación del 36%, lo que refleja una variabilidad moderada en las edades registradas. El diagrama de cajas, presentado en la imagen 1, confirma la asimetría positiva y muestra que la mayoría de los datos se concentran en el tercer cuartil, además de evidenciar la presencia de varios valores atípicos.
table(a$Sexo.de.la.victima)
##
## Hombre Indeterminado Mujer
## 102174 93 8996
install.packages(library(knitr))
## Warning: packages 'knitr', 'ggplot2', 'stats', 'graphics', 'grDevices',
## 'utils', 'datasets', 'methods', 'base' are in use and will not be installed
categorias = c("Hombre", "Indeterminado","Mujer")
freq = c(102174, 93,8996)
df= data.frame(categorias, freq)
ggplot(df,aes(x="",y=freq, fill=categorias))+
geom_bar(stat = "identity",color="white")+
coord_polar(theta="y")
En la gráfica 2 se observa que la mayoría de los datos están concentrados en los hombres aproximadamente con un 92%, un 8% las mujeres y los homicidios que no se les pudo determinar el sexo, es decir los indeterminados no representan ni el 1% de los casos.
table(a$Escolaridad)
##
## Doctorado o equivalente
## 5
## Educación básica primaria
## 35496
## Educación básica secundaria o secundaria baja
## 16316
## Educación inicial y educación preescolar
## 13343
## Educación media o secundaria alta
## 17003
## Educación técnica profesional y tecnológica
## 2398
## Especialización, maestría o equivalente
## 13
## Especialización, Maestría o equivalente
## 16
## Sin escolaridad
## 3122
## Sin información
## 19760
## Sin Información
## 3708
## Universitario
## 83
ggplot(a, aes(x = Escolaridad)) +
geom_bar(fill = "red") + # Color de las barras
labs(x = "Nivel de educación", y = "Asesinatos", title = "Gráfica 3") +
theme_minimal()+
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")
La gráfica 3 nos muestra que la mayoría de los homicidios se encuentran en la educación básica primaria, y en los datos con menor peso se encuentran en la variable otros y sin información.
table(a$Mes.del.hecho)
##
## Abril Agosto Diciembre Enero Febrero
## 8664 9395 10494 9568 8283
## Julio Junio Marzo Mayo Noviembre
## 9533 9275 8953 9629 9068
## Octubre Septiembre Sin Información
## 9167 9000 234
ggplot(a, aes(x = Mes.del.hecho)) +
geom_bar(fill = "steelblue") + # Color de las barras
labs(x = "Mes del hecho", y = "Asesinatos", title = "Gráfica 4") +
theme_minimal()+
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")
En la gráfica 4 se observa que diciembre es el mes con mayor incidencia de homicidios, con aproximadamente un 9% de los casos. Sin embargo, la categoría otros agrupan los seis meses restantes, representando alrededor del 47% de los datos. Esto indica que los homicidios no se concentran de manera significativa en un solo mes, y aunque diciembre presenta la cifra más alta, la diferencia con los demás meses no es abismal.
table(a$Dia.del.hecho)
##
## Domingo Jueves Lunes Martes Miércoles
## 23263 13535 15302 13285 13197
## Sábado Sin Información Viernes
## 17924 234 14523
ggplot(a, aes(x = Dia.del.hecho)) +
geom_bar(fill = "steelblue") + # Color de las barras
labs(x = "Día del hecho", y = "Asesinatos", title = "Gráfica 5") +
theme_minimal()
La gráfica 5 muestra que la mayor concentración de homicidios ocurrió durante el fin de semana, con un incremento significativo los sábados y domingos. En contraste, el martes fue el día con menor incidencia. Esto sugiere que los fines de semana fueron el periodo de mayor riesgo para estos eventos. Aunque los días laborables registraron una menor cantidad de casos en comparación con el fin de semana, cada uno de ellos presentó una incidencia superior al 10%, lo que indica que, si bien la concentración es menor, la violencia letal no desaparece en estos días y sigue siendo un factor relevante para considerar.
table(a$Departamento.del.hecho.DANE)
##
## Amazonas
## 137
## Antioquia
## 17133
## Arauca
## 1471
## Archipiélago de San Andrés, Providencia y Santa Catalina
## 246
## Atlántico
## 5642
## Bogotá, D.C.
## 10412
## Bolívar
## 4192
## Boyacá
## 796
## Caldas
## 1570
## Caquetá
## 1451
## Casanare
## 681
## Cauca
## 5409
## Cesar
## 2380
## Chocó
## 1647
## Córdoba
## 2363
## Cundinamarca
## 3755
## Guainía
## 39
## Guaviare
## 306
## Huila
## 2378
## La Guajira
## 1753
## Magdalena
## 2802
## Meta
## 2523
## Nariño
## 3301
## Norte de Santander
## 4899
## Putumayo
## 1523
## Quindío
## 1841
## Risaralda
## 2245
## Santander
## 2850
## Sin información
## 95
## Sucre
## 1553
## Tolima
## 2588
## Valle del Cauca
## 21124
## Vaupés
## 18
## Vichada
## 140
ggplot(a, aes(x = Departamento.del.hecho.DANE)) +
geom_bar(fill = "steelblue") + # Color de las barras
labs(x = "Departamentos", y = "Asesinatos", title = "Gráfica 6") +
theme_minimal()+
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")
La gráfica 6 nos dice que el departamento con mayor concentración de datos es el Valle del Cauca y luego lo sigue Antioquia. Los datos de la imagen 7 nos dicen que 6 departamentos poseen cerca del 59% de los datos y el resto de los departamentos poseen cerca del 41% de los casos.
table(a$Mecanismo.Causal)
##
## Agente o mecanismo explosivo Caústico
## 640 4
## Contundente Cortante
## 3287 483
## corto contundente Corto contundente
## 1 2391
## Corto punzante Eléctrico
## 19406 11
## Extrangulamiento Generadores de asfixia
## 2 2251
## Mecanismo o agente explosivo Otro
## 142 30
## Por determinar Proyectil de arma de fuego
## 256 81790
## Proyectil de Arma de Fuego Punzante
## 11 249
## Térmico Tóxico
## 146 163
ggplot(a, aes(x = Mecanismo.Causal)) +
geom_bar(fill = "steelblue") + # Color de las barras
labs(x = "Mecanismo causal", y = "Asesinatos", title = "Gráfica 7") +
theme_minimal()+
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")
La tabla numero 6 nos dicen que los datos se encuentran mayormente concentrados en proyectil de arma de fuego representando aproximadamente del 73% de los datos, luego le siguen las armas cortopunzantes.
table(a$Estado.Civil)
##
## Casado(a) No aplica
## 6317 640
## Separado(a), divorciado(a) Sin información
## 2497 18008
## Soltero(a) Unión libre
## 48907 34315
## Unión Libre Viudo(a)
## 1 578
ggplot(a, aes(x = Estado.Civil)) +
geom_bar(fill = "steelblue") + # Color de las barras
labs(x = "Estado civil", y = "Asesinatos", title = "Gráfica 8") +
theme_minimal()+
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1, size = 8), legend.position="none")
La mayoría de los homicidios analizados corresponden a personas solteras, quienes representan más del 43% del total de casos. Les siguen aquellas en unión libre, con una incidencia superior al 30%. En conjunto, estas dos categorías agrupan más del 70% de los casos, lo que sugiere que el estado civil podría estar relacionado con ciertos factores de vulnerabilidad. Es posible que las personas solteras y en unión libre estén más expuestas a situaciones de riesgo, ya sea por mayor participación en actividades sociales, menor estabilidad económica o ausencia de redes de apoyo familiar sólidas. Pero solo son suposiciones.
El análisis de los homicidios en Colombia entre 2015 y 2023 evidencia la magnitud y distribución de este fenómeno en el país. La mayoría de los casos afectan a personas en etapa de adultez, principalmente hombres, con niveles de escolaridad bajos y en condición de soltería o unión libre. Además, la violencia homicida muestra una mayor concentración en ciertos departamentos como Valle del Cauca y Antioquia, y un patrón recurrente en fines de semana y el mes de diciembre, aunque sin una diferencia abrumadora respecto a otros periodos. La principal causa identificada es el uso de armas de fuego, lo que subraya la necesidad de medidas específicas para el control de este tipo de armamento. Estos hallazgos confirman que el problema de los homicidios en Colombia no solo es estructural, sino que está vinculado a factores sociales, económicos y regionales.