Introducción

Este proyecto se enfoca en analizar las conductas suicidas en las distintas localidades de Bogotá, D.C., teniendo en cuenta la clasificación de la conducta suicida, el número de casos por conducta y la población de cada localidad. Nuestra meta es proporcionar una comprensión más profunda de este problema y contribuir a estrategias de prevención y apoyo más efectivas para mejorar la salud mental en la ciudad.

Objetivo general

Este proyecto tiene el objetivo de analizar la conducta suicida en las diferentes localidades de Bogotá, D.C.

Objetivos específicos

● Identificar dependiendo de cada variable que tipos de conducta suicida son más comunes en las diferentes localidades de Bogotá.

● Analizar los comportamientos y tendencias suicidas con tasas más altas según la población y la localidad de Bogotá.

● Mediante la identificación y análisis de datos, poder obtener información relevante para buscar alternativas que le puedan dar solución al problema identificado.

Indicadores estadisticos

Se hace el cálculo de estos indicadores con el objetivo de saber que tan dispersos están los datos, la relación que tienen, etc.

Casos

Los indicadores estadísticos para “Casos” muestran que en promedio se registraron 565 casos por localidad en total, la mediana difiere mucho de la media, con un valor de 210, lo que quiere decir que la distribución no es simétrica y presenta un sesgo positivo, ya que la media está por encima de la mediana, lo que quiere decir que hay localidades que presentan números de casos muy altos, por ello se calcula la desviación estandar, que tiene un valor de 804.81, lo que quiere decir que los valores están alejados de la media, que significaría que hay localidades con número de casos demasiado altos, o muy bajos, la varianaza es de 647720.2, que quiere decir que la dispersión de datos es grande, por último, La mayor localidad presento 3482 casos y la menor 1 caso.

Media

mean(BASE$Casos)
## [1] 565.0508

Mediana

median(BASE$Casos)
## [1] 210

Máximo y mínimo

max(BASE$Casos)
## [1] 3482
min(BASE$Casos)
## [1] 1

Desviación estándar

sd(BASE$Casos)
## [1] 804.8106

Varianza

var(BASE$Casos)
## [1] 647720.2

Población

Con respecto a la población se puede decir que la distribución por localidad difiere, como es evidente hay localidades que tienen mayor población que otras, esto se sabe porque la media y la mediana difieren un poco, adicional a esto, el máximo y el mínimo si están muy alejados, por lo que va a haber localidades con poca población y otras con mucha población, adicional esto se complementa con el cálculo de la desviación estandar y la variana¿za, que muestran que hay dispersión de datos y que la diatancia de unos a otros si puede ser alta.

Media

mean(BASE$Población)
## [1] 401716

Mediana

median(BASE$Población)
## [1] 386696

Máximo y mínimo

max(BASE$Población)
## [1] 1273909
min(BASE$Población)
## [1] 3713

Desviación estándar

sd(BASE$Población)
## [1] 346025.7

Varianza

var(BASE$Población)
## [1] 119733789956

Gráficos

Clasificación de la conducta vs Casos

Este gráfico muestra el número de casos que presenta cada conducta suicida, se puede observar que la ideación suicida es el tipo de conducta mayormente practicada, también es la que tiene mayor dispersión de datos, en el caso de la conducta “intento de suicidio”, se puede observar que La mayoría de datos se encuentran concentrados entre Q1 y Q2, es decir en el 50%, de ahí en adelante el número de casos es más disperso, y por último, “suicidio consumado” es la variable más compacta, es decir, en esta los casos se encuentran más concentrados, adicional se puede observar que este tipo de conducta suicida es la que menos se presenta.

boxplot(BASE$Casos ~ BASE$`Clasificacion de la conducta`,names=c("ideación suicida","intento suicidio", "Suicidio consumado"),main="clasificación de la conducta",xlab="clasificación de la conducta",ylab="Casos",col = c("azure", "magenta", "pink"))

Clasificación de la conducta vs Población

En esta gráfica se analiza la clasificación de la conducta, respecto a la población, para poder observar como se distribuyen los casos por localidad de cada conducta entre la población, se puede observar que la distribución para las tres conductas es similar, aunque presentan algunas diferencias, se puede observar que ideación suicida y suicidio consumado tienen asimetría positiva, lo que quiere decir que los datos están más concentrados en la parte inferior, en el caso de intento de suicidio se puede observar que los casos están mejor distribuidos entre la población.

boxplot(BASE$Población~BASE$`Clasificacion de la conducta`,xlab = "Clasificacion de la conducta",ylab = "Población",col=c("#79CDCD","#CD6090","#CDB38B"))

Número de casos por localidad

En este gráfico observamos la relación entre el total de casos de conductas suicidas en el Norte, Centro y Sur de Bogotá, a travez de este se puede observar que la localidad con mayor número de casos de conductas suicidadas es el sur de Bogotá, con un total de 17433 casos, la sigue el norte con 12050 casos y la que tiene menor número de casos es la zona centro con un total de 3855 casos.

library(ggplot2)
total_c <- c(12050, 3855, 17433)

ggplot(Totalc, aes(x = Localidad, y = total_c, fill = Localidad)) +
  geom_bar(stat = "identity") +
  labs(title = "Número de casos por localidad",
       x = "Localidad",
       y = "Casos") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))  # Centra el título

casos vs población

En este gráfico se relaciona los casos con la población, la población esta distribuida por total de población en cada localidad, al igual que total de casos, se puede observar una relación positiva entre estas dos variables, El coeficiente de correlación lineal es 0.5566156. Este valor es positivo y mayor que 0, lo que indica que hay una correlación positiva entre la población y los casos de conducta suicida en el año 2022. Sin embargo, el valor no es extremadamente cercano a 1, lo que significa que la correlación no es perfecta, pero aún así existe una relación positiva.

plot(BASE$Casos,BASE$Población,pch=19,xlab="casos",ylab="población")

coeficiente de correlación lineal

correlacion <- cor(BASE$Población, BASE$Casos)
print(correlacion)
## [1] 0.5566156

Análisis de conducta por cada Localidad o zona (Centro, Sur y Norte)

casos de suicidio consumado vs Localidad

En este gráfico se puede analizar la distribución de casos de suicidio consumado en tres zonas de Bogotá (Centro, sur y Norte), cada zona está conformada por localidades que presentan diferentes números de casos de esta conducta. En el gráfico se puede analizar que esta conducta es más común en el sur de la ciudad, esta presenta asimetría positiva, es decir, en números más altos de casos, los datos están más dispersos. En el caso de el centro se puede observar una simetría negativa, mostrando que los datos están más compactos de Q3 a Q4, el Norte presenta asimetría positiva, además se puede observar un dato atípico, este dato atípico quiere decir que en una localidad del Norte se presenta un número muy bajo de casos, respecto a las demás localidades de esta zona.

boxplot(consumado$`Suicidio consumado`~consumado$Localidad,xlab = "Localidad",ylab = "casos suicidio consumado",col=c("beige","magenta","purple"))

Casos de intento de suicidio vs localidad

En el gráfico se puede observar que en el centro es dónde menos se presenta esta conducta, además presenta asimetría negativa, pero en general el número de casos en las localidades del centro no es tan disperso, En el Norte es en la zona en dónde más ocurre esta conducta, se puede observar asimetría positiva, lo que quiere decir que las localidades con pocos casos son más dispersan en comparación con las que presentan números mayores de casos; Por último el sur presenta asimetría postiva, lo que quiere decir que las localidades con números más bajos de casos están más compactas (su número de casos presenta más similitudes) y las localidades con números más altos de casos están más dispersas.

boxplot(intento$`Intento de Suicidio`~intento$Localidad,xlab = "Localidad",ylab = "casos intento de suicidio",col=c("green","#CD6090","azure"))

casos de ideación suicida vs localidad

Este gráfico muestra que el centro sigue siendo la localidad con menos casos de conducta suicida, este presenta un dato atípico que quiere decir que una localidad del centro de Bogotá tiene casos de ideación suicida mucho más alto que las otras localidades, este presenta asímetría negativa, en el caso del norte se evidencia asimetría positiva, se puede ver que en la paete inferior el número de casos es muy compacto, es decir que no presentan grandes diferencias, los datos están más dispersos por encima de la media, en el caso del Sur se puede observar que hay una simetría positiva y es la localidad que mayores casos de esta conducta presenta, aunque no está muy alejado de los casos del norte que también son altos.

boxplot(Ideación$`Ideación suicida`~Ideación$Localidad,xlab = "Localidad",ylab = "casos ideación suicida",col=c("beige","azure","orange"))

Clasificación de la conducta en el centro

En este gráfico se analiza el total de casos de cada conducta en el centro de Bogotá, se puede observar que ideación suicida es la conducta mayormente practicada en esta zona, con un total de 2879 casos, la segunda conducta que más se practica es intento de suicidio, con un total de 923 y la menos practicada es suicidio consumado, con un total de 53 casos.

library(ggplot2)
total_centro <- c(53, 923, 2879)

ggplot(Barracentro, aes(x = `Tipo de conducta` , y = total_centro, fill = `Tipo de conducta` )) +
  geom_bar(stat = "identity") +
  labs(title = "Total de casos por conducta en el centro",
       x = "Tipo de conducta",
       y = " Total Casos") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))  # Centra el título

Clasificación de la conducta en el Norte

En este gráfico se analiza el total de casos de cada conducta en el Norte de Bogotá, se puede observar que ideación suicida es la conducta mayormente practicada en esta zona, con un total de 8661 casos, la segunda conducta que más se practica es intento de suicidio, con un total de 3244 y la menos practicada es suicidio consumado, con un total de 145 casos.

library(ggplot2)
total_norte <- c(145, 3244, 8661)

ggplot(Barranorte, aes(x = `Tipo de conducta` , y = total_norte, fill = `Tipo de conducta` )) +
  geom_bar(stat = "identity") +
  labs(title = "Total de casos por conducta en el Norte",
       x = "Tipo de conducta",
       y = " Total Casos") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))  # Centra el título

Clasificación de la conducta en el Sur

En este gráfico se analiza el total de casos de cada conducta en el Sur de Bogotá, se puede observar que ideación suicida es la conducta mayormente practicada en esta zona, con un total de13067 casos, la segunda conducta que más se practica es intento de suicidio, con un total de 4173 y la menos practicada es suicidio consumado, con un total de 193 casos.

library(ggplot2)
total_Sur <- c(193, 4173, 13067)

ggplot(Barrasur, aes(x = `Tipo de conducta` , y = total_Sur, fill = `Tipo de conducta` )) +
  geom_bar(stat = "identity") +
  labs(title = "Total de casos por conducta en el Norte",
       x = "Tipo de conducta",
       y = " Total Casos") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))  # Centra el título