Introducción

Este proyecto se enfoca en analizar las conductas suicidas en las distintas localidades de Bogotá, D.C., teniendo en cuenta la clasificación de la conducta suicida, el número de casos por conducta y la población de cada localidad. Nuestra meta es proporcionar una comprensión más profunda de este problema y contribuir a estrategias de prevención y apoyo más efectivas para mejorar la salud mental en la ciudad.

Los datos son obtenidos de “DATOS ABIERTOS BOGOTÁ”, una plataforma de datos abiertos a nivel distrital.

A continuación el link de la página:

https://datosabiertos.bogota.gov.co/dataset/tasa-de-suicidio-en-bogota-d-c/resource/555a3bea-e358-4e77-be49-7b448774324b

Objetivo general

Este proyecto tiene el objetivo de caracterizar los datos de los eventos de conducta suicida en las diferentes localidades de Bogotá, D.C.

Objetivos específicos

● Identificar dependiendo de cada variable que tipos de conducta suicida son más comunes en las diferentes localidades de Bogotá.

● Caracterizar los comportamientos y tendencias suicidas con tasas más altas según la población y la localidad de Bogotá.

● Mediante la identificación y análisis de datos, poder obtener información relevante para buscar alternativas que le puedan dar solución al problema identificado.

Indicadores estadisticos

Casos

Los indicadores estadísticos para “Casos” muestran que, en promedio, se registraron 565 casos por localidad en total. Sin embargo, se puede observar que la distribución de los casos no es simétrica y presenta un sesgo positivo, lo que indica que hay localidades con números de casos muy altos. Esto se confirma con el valor de la desviación estándar que en n este caso es alta, lo que indica que hay localidades con números de casos muy altos, que influyen en la media, pero que no son representativos de la mayoría de las localidades. Por último, la mayor localidad presentó 3482 casos y la menor 1 caso. Esto indica que hay una gran diferencia entre los casos registrados en las diferentes localidades.

Población

Los datos de “Población” son los datos de la cantidad de habitantes de cada una de las localidades de Bogotá (no son una muestra). Con respecto a esta variable se puede decir que la distribución por localidad difiere, como es evidente hay localidades que tienen mayor población que otras, esto se sabe porque la media y la mediana difieren un poco, adicional a esto, el máximo y el mínimo si están muy alejados, por lo que va a haber localidades con poca población y otras con mucha población, adicional esto se complementa con el cálculo de la desviación estándar y la varianza, que muestran que hay dispersión de datos y que la distancia de unos a otros si puede ser alta.

# Crear una tabla con dos columnas: "Nombre" y "Edad"
desviacion <- 804.8106
varianza <- 647720.2
mediana <- 210
maximo <- 3482
minimo <- 1
media <- 565.0508
pobdesv <- 34025.7
pobvari <- 119733789956
pobmediana <- 386696
pobmedia <- 401716
pobmax <- 1273909
pobmin <- 3713
tabla <- data.frame(
  dato = c("Desviacion Estandar", "Varianza", "Mediana","Media", "Máximo", "Minimo"),
  casos = c(desviacion, varianza, mediana, media, maximo, minimo),
  poblacion = c(pobdesv, pobvari, pobmediana, pobmedia, pobmax, pobmin)
)

options(scipen = 999)

# Mostrar la tabla

print(tabla)
##                  dato       casos      poblacion
## 1 Desviacion Estandar    804.8106        34025.7
## 2            Varianza 647720.2000 119733789956.0
## 3             Mediana    210.0000       386696.0
## 4               Media    565.0508       401716.0
## 5              Máximo   3482.0000      1273909.0
## 6              Minimo      1.0000         3713.0

Gráficos

Clasificación de la conducta vs Casos

En este gráfico se muestra el número de casos que presenta cada conducta suicida,se aclara que número de casos se refiere al número de casos que presenta cada localidad. Se puede observar que la conducta que más se presenta es la ideación suicida,pero sus casos no se encuentran tan concentrados,ya que se puede observar una mayor dispersión. En el caso de la conducta “intento de suicidio” se evidencia que hay una mayor concentración de casos de aproximadamente el 50% de 0 a 400 casos, de ahí en adelante hay mayor dispersión del número de casos de esta conducta por localidad (es decir que hay mayor dispersión en las localidades que presentan altos números de esta conducta). Por último esta la conducta “suicidio consumado”, que es la conducta que menos se presenta en las localidades de Bogotá y se puede observar que en esta los casos se encuentran mayormente concentrados.

boxplot(BASE$Casos ~ BASE$`Clasificacion de la conducta`,names=c("ideación suicida","intento suicidio", "Suicidio consumado"),main="clasificación de la conducta",xlab="clasificación de la conducta",ylab="Casos",col = c("azure", "magenta", "pink"))

Clasificación de la conducta vs Población

En esta gráfica se analiza la clasificación de la conducta, respecto a la población, para poder observar como se distribuyen los casos por localidad de cada conducta entre la población, se puede observar que la distribución para las tres conductas es similar, aunque presentan algunas diferencias, se puede observar que ideación suicida y suicidio consumado tienen asimetría positiva, lo que quiere decir que los datos están más concentrados en la parte inferior, en el caso de intento de suicidio se puede observar que los casos están mejor distribuidos entre la población.

boxplot(BASE$Población~BASE$`Clasificacion de la conducta`,xlab = "Clasificacion de la conducta",ylab = "Población",col=c("#79CDCD","#CD6090","#CDB38B"))

Número de casos por localidad

En este gráfico observamos la relación entre el total de casos de conductas suicidas en el Norte, Centro y Sur de Bogotá, a travez de este se puede observar que la localidad con mayor número de casos de conductas suicidadas es el sur de Bogotá, con un total de 17433 casos, la sigue el norte con 12050 casos y la que tiene menor número de casos es la zona centro con un total de 3855 casos.

library(ggplot2)
total_c <- c(12050, 3855, 17433)

ggplot(Totalc, aes(x = Localidad, y = total_c, fill = Localidad)) +
  geom_bar(stat = "identity") +
  labs(title = "Número de casos por localidad",
       x = "Localidad",
       y = "Casos") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))  # Centra el título

casos vs población

En este gráfico se relaciona los casos con la población, la población esta distribuida por total de población en cada localidad, al igual que total de casos, se puede observar una relación positiva entre estas dos variables, El coeficiente de correlación lineal es 0.5566156. Este valor es positivo y mayor que 0, lo que indica que hay una correlación positiva entre la población y los casos de conducta suicida en el año 2022. Sin embargo, el valor no es extremadamente cercano a 1, lo que significa que la correlación no es perfecta, pero aún así existe una relación positiva.

plot(BASE$Casos,BASE$Población,pch=19,xlab="casos",ylab="población")

coeficiente de correlación lineal

correlacion <- cor(BASE$Población, BASE$Casos)
print(correlacion)
## [1] 0.5566156

Análisis de conducta por cada Localidad o zona (Centro, Sur y Norte)

casos de suicidio consumado vs Localidad

En este gráfico se puede analizar la distribución de casos de suicidio consumado en tres zonas de Bogotá (Centro, sur y Norte), cada zona está conformada por localidades que presentan diferentes números de casos de esta conducta. En el gráfico se puede analizar que esta conducta es más común en el sur de la ciudad, esta presenta asimetría positiva, es decir, en números más altos de casos, los datos están más dispersos. En el caso de el centro se puede observar una simetría negativa, mostrando que los datos están más compactos de Q3 a Q4, el Norte presenta asimetría positiva, además se puede observar un dato atípico, este dato atípico quiere decir que en una localidad del Norte se presenta un número muy bajo de casos, respecto a las demás localidades de esta zona.

boxplot(consumado$`Suicidio consumado`~consumado$Localidad,xlab = "Localidad",ylab = "casos suicidio consumado",col=c("beige","magenta","purple"))

Casos de intento de suicidio vs localidad

En el gráfico se puede observar que en el centro es dónde menos se presenta esta conducta, además presenta asimetría negativa, pero en general el número de casos en las localidades del centro no es tan disperso, En el Norte es en la zona en dónde más ocurre esta conducta, se puede observar asimetría positiva, lo que quiere decir que las localidades con pocos casos son más dispersan en comparación con las que presentan números mayores de casos; Por último el sur presenta asimetría postiva, lo que quiere decir que las localidades con números más bajos de casos están más compactas (su número de casos presenta más similitudes) y las localidades con números más altos de casos están más dispersas.

boxplot(intento$`Intento de Suicidio`~intento$Localidad,xlab = "Localidad",ylab = "casos intento de suicidio",col=c("green","#CD6090","azure"))

casos de ideación suicida vs localidad

Este gráfico muestra que el centro sigue siendo la localidad con menos casos de conducta suicida, este presenta un dato atípico que quiere decir que una localidad del centro de Bogotá tiene casos de ideación suicida mucho más alto que las otras localidades, este presenta asímetría negativa, en el caso del norte se evidencia asimetría positiva, se puede ver que en la paete inferior el número de casos es muy compacto, es decir que no presentan grandes diferencias, los datos están más dispersos por encima de la media, en el caso del Sur se puede observar que hay una simetría positiva y es la localidad que mayores casos de esta conducta presenta, aunque no está muy alejado de los casos del norte que también son altos.

boxplot(Ideación$`Ideación suicida`~Ideación$Localidad,xlab = "Localidad",ylab = "casos ideación suicida",col=c("beige","azure","orange"))

Clasificación de la conducta en el centro

En este gráfico se analiza el total de casos de cada conducta en el centro de Bogotá, se puede observar que ideación suicida es la conducta mayormente practicada en esta zona, con un total de 2879 casos, la segunda conducta que más se practica es intento de suicidio, con un total de 923 y la menos practicada es suicidio consumado, con un total de 53 casos.

library(ggplot2)
total_centro <- c(53, 923, 2879)

ggplot(Barracentro, aes(x = `Tipo de conducta` , y = total_centro, fill = `Tipo de conducta` )) +
  geom_bar(stat = "identity") +
  labs(title = "Total de casos por conducta en el centro",
       x = "Tipo de conducta",
       y = " Total Casos") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))  # Centra el título

Clasificación de la conducta en el Norte

En este gráfico se analiza el total de casos de cada conducta en el Norte de Bogotá, se puede observar que ideación suicida es la conducta mayormente practicada en esta zona, con un total de 8661 casos, la segunda conducta que más se practica es intento de suicidio, con un total de 3244 y la menos practicada es suicidio consumado, con un total de 145 casos.

library(ggplot2)
total_norte <- c(145, 3244, 8661)

ggplot(Barranorte, aes(x = `Tipo de conducta` , y = total_norte, fill = `Tipo de conducta` )) +
  geom_bar(stat = "identity") +
  labs(title = "Total de casos por conducta en el Norte",
       x = "Tipo de conducta",
       y = " Total Casos") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))  # Centra el título

Clasificación de la conducta en el Sur

En este gráfico se analiza el total de casos de cada conducta en el Sur de Bogotá, se puede observar que ideación suicida es la conducta mayormente practicada en esta zona, con un total de 13067 casos, la segunda conducta que más se practica es intento de suicidio, con un total de 4173 y la menos practicada es suicidio consumado, con un total de 193 casos.

library(ggplot2)
total_Sur <- c(193, 4173, 13067)

ggplot(Barrasur, aes(x = `Tipo de conducta` , y = total_Sur, fill = `Tipo de conducta` )) +
  geom_bar(stat = "identity") +
  labs(title = "Total de casos por conducta en el Norte",
       x = "Tipo de conducta",
       y = " Total Casos") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))  # Centra el título