Este relatório apresenta uma análise das taxas de suicídio entre 1985 e 2016, baseada no conjunto de dados do Kaggle.
O suicídio é um problema de saúde pública de grande relevância, afetando indivíduos, famílias e comunidades em todo o mundo. Suas causas são multifatoriais, envolvendo aspectos psicológicos, sociais, econômicos e culturais. Compreender os padrões e fatores associados ao suicídio é essencial para embasar estratégias eficazes de prevenção e formulação de políticas públicas voltadas para a saúde mental.
Este estudo se baseia em um conjunto de dados abrangente sobre taxas de suicídio entre 1985 e 2016, com o objetivo de identificar padrões e relações entre fatores como gênero, geração, PIB per capita e oscilações temporais. A análise foca, em especial, nos países da América, explorando como esses fatores influenciam as taxas de suicídio ao longo do tempo. Esta investigação pode oferecer insights valiosos para a formulação de medidas preventivas e políticas de saúde pública mais eficazes.
Para conduzir esta análise, foi utilizado um dataset do Kaggle que inclui informações sobre taxas de suicídio em diversos países ao longo de mais de três décadas. Os dados foram processados e analisados considerando as seguintes abordagens:
A abordagem técnica adotada combina visualização de dados, análise estatística e modelagem exploratória. Ferramentas como RStudio e pacotes estatísticos serão utilizadas para manipulação, análise e visualização dos dados. Gráficos de dispersão, histogramas e métodos de regressão serão empregados para avaliar a influência dos fatores econômicos e sociodemográficos.
Os resultados desta análise podem contribuir para um melhor entendimento das dinâmicas relacionadas às taxas de suicídio e fornecer embasamento para decisores públicos e organizações voltadas à saúde mental. Com insights baseados em dados, espera-se que esta pesquisa auxilie na formulação de estratégias preventivas mais eficazes e no desenvolvimento de iniciativas de suporte para grupos vulneráveis.
Para replicar a análise, os seguintes pacotes são carregados antecipadamente:
tidyverse = Pacote que reúne várias bibliotecas do R,
incluindo dplyr, ggplot2, tidyr, entre outras, para manipulação de dados
e visualizaçãoggplot2 = Pacote para criação de gráficos,
especialmente gráficos sofisticados e personalizadosggplot2 = Pacote para manipulação eficiente de dados,
como seleção, filtragem e agregaçãoggplot2 = Pacote para criar gráficos interativos,
permitindo visualizações dinâmicas no RDT = Cria tabelas interativas no R. Útil em R Markdown
e Shiny.purrr = Manipula listas/vetores de forma
funcional.FONTE = Kaggle
O conjunto de dados “Taxas de Suicídio 1985-2016” foi coletado para analisar as taxas de suicídio em diferentes países ao longo de três décadas, com o objetivo de identificar padrões e fatores associados, como sexo, idade e PIB per capita.
Estudar as tendências de suicídio globalmente e entender os fatores socioeconômicos e demográficos que influenciam essas taxas.
De 1985 a 2016.
O conjunto contém 12 variáveis, incluindo país, ano, sexo, faixa etária, número de suicídios, PIB, e taxa de suicídios por 100.000 habitantes.
Primeiro, baixe o csv nesse link
Depois dé o caminho do arquivo para que possa importalo dessa forma
Tratando dados
paises_america <- c(
"Antigua and Barbuda", "Argentina", "Bahamas", "Barbados", "Belize",
"Brazil", "Canada", "Chile", "Colombia", "Costa Rica", "Cuba",
"Dominica", "Ecuador", "El Salvador", "Grenada", "Guatemala",
"Guyana", "Honduras", "Jamaica", "Mexico", "Nicaragua", "Panama",
"Paraguay", "Peru", "Puerto Rico", "Saint Kitts and Nevis",
"Saint Lucia", "Saint Vincent and Grenadines", "Suriname",
"Trinidad and Tobago", "United States", "Uruguay", "Venezuela"
)
dados <- dados_completo %>%
filter(country %in% paises_america)data origen: Origem tem 27820 linhas. E colunas de nome { country, year, sex, age, suicides_no, population, suicides.100k.pop, country.year, HDI.for.year, gdp_for_year…., gdp_per_capita…., generation }
data tratado:
O novo vai ter 9046 linhas. E colunas de nome { country, year, sex, age,
suicides_no, population, suicides.100k.pop, country.year, HDI.for.year,
gdp_for_year, gdp_per_capita, generation }
O data ficara desta forma após a filtragem e tratamento
``` r
dados[c(1,20),]
```
```
## country year sex age suicides_no population
## 1 Antigua and Barbuda 1985 female 15-24 years 0 7709
## 20 Antigua and Barbuda 1986 male 25-34 years 0 6023
## suicides.100k.pop country.year HDI.for.year gdp_for_year
## 1 0 Antigua and Barbuda1985 NA 240,923,926
## 20 0 Antigua and Barbuda1986 NA 290,440,148
## gdp_per_capita generation
## 1 3850 Generation X
## 20 4740 Boomers
```
Com base nas primeiras linhas de dados que você forneceu, podemos ver que o conjunto de dados contém informações sobre suicídios, por sexo, faixa etária, ano e país. Por exemplo, no caso da Antigua and Barbuda em 1985 e 1986, temos dados sobre a quantidade de suicídios e a população de duas faixas etárias diferentes (15-24 anos e 35-54 anos), com informações adicionais sobre o PIB e o IDH do país.
media_historica_por_pais <- dados %>%
group_by(country) %>%
summarise(taxa_media_por_100k = mean(suicides.100k.pop, na.rm = TRUE))
media_historica_por_pais <- media_historica_por_pais %>%
arrange(desc(taxa_media_por_100k))
# Criar um mapa de calor interativo
mapa_suicidio <- plot_ly(
media_historica_por_pais,
type = 'choropleth', # Tipo de gráfico para mapa geográfico
locations = ~country,
locationmode = 'country names', # Modo de localização por nome do país
z = ~taxa_media_por_100k,
colorscale = 'RdBu', # Escala de cor para representar taxas
colorbar = list(title = "Taxa Média de Suicídio por 100k")
) %>%
layout(
title = "Variação Geográfica das Taxas de Suicídio",
geo = list(
projection = list(type = "equirectangular"),
showland = TRUE, # Exibir terras no mapa
landcolor = 'lightgray'
)
)dados_top10 <- dados %>%
group_by(country) %>%
summarise(taxa_suicidios = mean(`suicides.100k.pop`, na.rm = TRUE)) %>%
arrange(desc(taxa_suicidios)) %>%
slice_head(n = 10)
# Encontrar o valor máximo de suicídios para ajustar o eixo Y
max_taxa <- max(dados_top10$taxa_suicidios, na.rm = TRUE)
# Criar o gráfico com Plotly
grafico <- dados_top10 %>%
plot_ly(x = ~country, y = ~taxa_suicidios, type = 'bar',
marker = list(color = 'rgb(58, 71, 80)',
line = list(color = 'rgb(8,48,107)', width = 1.5))) %>%
layout(
title = "Top 10 Países com Maiores Taxas de Suicídio",
xaxis = list(title = "País", categoryorder = "array", categoryarray = dados_top10$country),
yaxis = list(
title = "Taxa de Suicídios por 100k População",
range = c(5, max_taxa + 3) # Adicionando 3 pontos ao valor máximo do eixo Y
),
barmode = 'group'
)
# Exibir o gráfico
graficocomparação_Suicídio_Gênero <- dados %>%
group_by(sex) %>%
summarise(media_suicidios = mean(suicides_no, na.rm = TRUE)) %>%
ggplot(aes(x = sex, y = media_suicidios, fill = sex)) +
geom_col() +
labs(title = "Comparação de Taxas de Suicídio por Gênero",
x = "Gênero",
y = "Média de Suicídios") +
theme_minimal()Temos essa diferença de suicidio entre os sexos Onde os homens tem uma taxa media de suicidio com mais de 200 pontos
Podemos comparar locais onde mais e menos morrem de acordo com o sexo
top_10_maiores_homens <- media_historica_suicidio %>%
filter(sex == "male") %>%
arrange(desc(taxa_media_por_100k)) %>%
head(10)
top_10_menores_homens <- media_historica_suicidio %>%
filter(sex == "male") %>%
arrange(taxa_media_por_100k) %>%
head(10)
top_10_maiores_mulheres <- media_historica_suicidio %>%
filter(sex == "female") %>%
arrange(desc(taxa_media_por_100k)) %>%
head(10)
top_10_menores_mulheres <- media_historica_suicidio %>%
filter(sex == "female") %>%
arrange(taxa_media_por_100k) %>%
head(10)grafico_maiores_homens <- plot_ly(
top_10_maiores_homens,
x = ~reorder(country, -taxa_media_por_100k),
y = ~taxa_media_por_100k,
type = 'bar',
marker = list(color = 'blue'),
name = 'Homens'
) %>%
layout(
title = "Top 10 Países com Maiores Taxas de Suicídio (Homens)",
xaxis = list(title = "País", tickangle = -45),
yaxis = list(title = "Suicídio por 100.000 habitantes")
)
grafico_maiores_mulheres <- plot_ly(
top_10_maiores_mulheres,
x = ~reorder(country, -taxa_media_por_100k),
y = ~taxa_media_por_100k,
type = 'bar',
marker = list(color = 'pink'),
name = 'Mulheres'
) %>%
layout(
title = "Top 10 Países com Maiores Taxas de Suicídio (Mulheres)",
xaxis = list(title = "País", tickangle = -45),
yaxis = list(title = "Suicídio por 100.000 habitantes")
)
grafico_menores_homens <- plot_ly(
top_10_menores_homens,
x = ~reorder(country, -taxa_media_por_100k),
y = ~taxa_media_por_100k,
type = 'bar',
marker = list(color = 'lightblue'),
name = 'Homens'
) %>%
layout(
title = "Top 10 Países com Menores Taxas de Suicídio (Homens)",
xaxis = list(title = "País", tickangle = -45),
yaxis = list(title = "Suicídio por 100.000 habitantes")
)
grafico_menores_mulheres <- plot_ly(
top_10_menores_mulheres,
x = ~reorder(country, -taxa_media_por_100k),
y = ~taxa_media_por_100k,
type = 'bar',
marker = list(color = 'lightpink'),
name = 'Mulheres'
) %>%
layout(
title = "Top 10 Países com Menores Taxas de Suicídio (Mulheres)",
xaxis = list(title = "País", tickangle = -45),
yaxis = list(title = "Suicídio por 100.000 habitantes")
)
maires_suicidios_por_100k_por_pais_comparação <- subplot(
grafico_maiores_homens,
grafico_maiores_mulheres,
nrows = 1,
shareY = TRUE,
titleX = TRUE,
titleY = TRUE
)
menores_suicidios_por_100k_por_pais_comparação <- subplot(
grafico_menores_homens,
grafico_menores_mulheres,
nrows = 1,
shareY = TRUE,
titleX = TRUE,
titleY = TRUE
)POdemos observa que os maiores países
menores países
Conseguimos levantar que, mesmo entre os países com as maiores e menores taxas de suicídio, os homens se suicidam mais que as mulheres. Tanto no maior gráfico quanto no menor gráfico, os países praticamente são os mesmos para ambos os gêneros.
A maior taxa de suicídio entre homens em comparação com mulheres é um fenômeno globalmente observado e pode ser explicada por diversos fatores, que incluem aspectos biológicos, psicológicos, sociais e culturais. Aqui estão algumas das principais razões e causas prováveis:
Maior Relutância em Buscar Ajuda
Psicológica
Normas sociais e culturais frequentemente desencorajam os homens a
expressar vulnerabilidade emocional e a procurar apoio profissional.
Isso resulta em menor adesão a tratamentos psicológicos e psiquiátricos,
agravando transtornos mentais como depressão e ansiedade.
Expectativas Sociais e Pressão por Sucesso
Homens geralmente são socializados para serem provedores e responsáveis
financeiramente pela família. Perdas financeiras, desemprego ou
fracassos profissionais podem ter um impacto severo sobre o bem-estar
emocional.
Menor Rede de Apoio Social
Enquanto mulheres tendem a manter redes sociais mais fortes e a
expressar seus sentimentos em círculos de amizade e familiares, homens
possuem menos conexões emocionais profundas, o que aumenta a sensação de
isolamento e desesperança.
Transtornos Mentais e Uso de Substâncias
Homens são mais propensos a desenvolver comportamentos impulsivos e
abusar de substâncias como álcool e drogas, o que pode aumentar o risco
de suicídio. O alcoolismo, em particular, está frequentemente associado
a tentativas de suicídio.
Fatores Biológicos e Hormonais
Estudos indicam que níveis mais altos de testosterona podem estar
relacionados a comportamentos de maior impulsividade e agressividade.
Diferenças na regulação da serotonina (neurotransmissor ligado ao humor)
também podem contribuir para o maior risco entre os homens.
Impacto do Envelhecimento e Solidão
Homens idosos são um dos grupos com maior taxa de suicídio,
possivelmente devido ao isolamento social, doenças crônicas, perda de
cônjuge e falta de propósito após a aposentadoria. Mulheres idosas, por
outro lado, tendem a manter redes de apoio mais ativas.
media_historica_por_pais_genero <- dados %>%
group_by(country, sex) %>%
summarise(taxa_media_por_100k = mean(suicides.100k.pop, na.rm = TRUE)) %>%
ungroup()## `summarise()` has grouped output by 'country'. You can override using the
## `.groups` argument.
# Mapa de calor para homens
mapa_suicidio_homens <- plot_ly(
data = media_historica_por_pais_genero %>% filter(sex == "male"),
type = 'choropleth',
locations = ~country,
locationmode = 'country names',
z = ~taxa_media_por_100k,
colorscale = 'Blues',
colorbar = list(title = "Taxa Média por 100k (Homens)")
) %>%
layout(
title = "Taxa Média de Suicídio por País (Homens)",
geo = list(
projection = list(type = "equirectangular"),
showland = TRUE,
landcolor = 'lightgray'
)
)
# Mapa de calor para mulheres
mapa_suicidio_mulheres <- plot_ly(
data = media_historica_por_pais_genero %>% filter(sex == "female"),
type = 'choropleth',
locations = ~country,
locationmode = 'country names',
z = ~taxa_media_por_100k,
colorscale = 'Reds',
colorbar = list(title = "Taxa Média por 100k (Mulheres)")
) %>%
layout(
title = "Taxa Média de Suicídio por País (Mulheres)",
geo = list(
projection = list(type = "equirectangular"),
showland = TRUE,
landcolor = 'lightgray'
)
)
# Combinar os mapas para comparação lado a lado
mapa_homens <- subplot(
mapa_suicidio_homens,
nrows = 1, # Uma única linha
titleX = TRUE,
titleY = TRUE
)
mapa_mulheres <- subplot(
mapa_suicidio_mulheres,
nrows = 1, # Uma única linha
titleX = TRUE,
titleY = TRUE
)Ao mostrar o mapa, podemos ter uma noção visual do suicidio por sexo
generation: Refere-se à geração associada à faixa etária da pessoa. As gerações podem ser as seguintes:
Generation X (Geração X)
Período de nascimento aproximadamente de 1965 a 1980. Cresceram em um período de transição entre a era industrial e a era digital. São conhecidos por sua independência e adaptação a mudanças rápidas de tecnologia.
Boomers (Baby Boomers)
Nascidos entre aproximadamente 1946 e 1964, cresceram em um período de grande prosperidade econômica e testemunharam as grandes mudanças sociais dos anos 60 e 70, como os direitos civis e a revolução sexual.
Silent (Geração Silenciosa)
Nascidos entre 1928 e 1945, marcaram o período pós-guerra, com um enfoque na estabilidade e conservadorismo. Foram muito afetados pela Grande Depressão e pela Segunda Guerra Mundial.
G.I. Generation (Geração G.I.)
Nascidos entre 1901 e 1927, são conhecidos por sua forte ética de trabalho, patriotismo e sacrifício. Muitos dessa geração participaram das duas grandes guerras mundiais.
Millenials (Geração Y)
Nascidos entre aproximadamente 1981 e 1996, cresceram com a popularização da internet e das redes sociais. São conhecidos por seu ativismo social e busca por justiça social.
Generation Z (Geração Z)
Nascidos entre 1997 e 2012, são os nativos digitais, com maior presença online, engajamento político e foco em saúde mental e sustentabilidade.
Essa coluna ajuda a classificar cada faixa etária de acordo com a geração histórica que a pessoa pertence, trazendo uma visão contextual das tendências e características de cada grupo.
Importante: Esse tipo de categorização também pode influenciar os padrões de comportamento, políticas públicas e tendências sociais analisadas ao longo do tempo.
# Calcular a média de suicídio por 100k por geração
media_suicidio_por_geracao <- dados %>%
group_by(generation) %>%
summarise(
taxa_media_por_100k = mean(suicides.100k.pop, na.rm = TRUE)
) %>%
arrange(desc(taxa_media_por_100k))
# Criar o gráfico de pizza
grafico_suicidio_por_geracao_pizza <- plot_ly(
data = media_suicidio_por_geracao,
labels = ~generation,
values = ~taxa_media_por_100k,
type = 'pie',
marker = list(colors = RColorBrewer::brewer.pal(n = length(media_suicidio_por_geracao$generation), name = "Set3"))
) %>%
layout(
title = "Distribuição de Suicídios por Geração (Média por 100k)",
showlegend = TRUE # Exibir a legenda
)
grafico_suicidio_por_geracao_pizzaDESTRUINDO UM MITO
A análise das taxas médias de suicídio por 100.000 habitantes por geração revela algumas tendências interessantes. As gerações mais velhas, como a G.I. Generation, Silent e Boomers, apresentam taxas mais elevadas de suicídio, refletindo possivelmente os desafios enfrentados em suas épocas, como guerras, recessões econômicas e instabilidade social. Essas gerações cresceram em períodos mais difíceis, com menos acesso a recursos modernos de saúde mental e apoio psicológico.
Por outro lado, as gerações mais novas, como Generation X, Millennials e Generation Z, têm taxas progressivamente mais baixas de suicídio. Isso pode estar relacionado a uma maior conscientização sobre a saúde mental, acesso mais amplo a tratamentos psicológicos e terapias, além da crescente normalização da busca por ajuda. A Geração Z, em particular, destaca-se com a taxa mais baixa, o que pode indicar uma maior ênfase no autocuidado, no apoio emocional e na diminuição do estigma em torno de questões como depressão e ansiedade.
Contudo, é importante destacar que, apesar dessa tendência de queda nas taxas de suicídio nas gerações mais novas, outros fatores sociais e culturais podem influenciar esses números, e ainda há a necessidade de mais apoio psicológico e recursos para todas as gerações, especialmente nas faixas etárias mais jovens, que enfrentam desafios modernos únicos.
A importancia da variância : Vamos falar sobre:
Oque é variância?
Medida estatística que mostra o quanto os valores de um conjunto de dados se dispersam em relação à média
A sua importância nesse dataset é que nos permite identificar flutuações nas taxas de suicídio ao longo do tempo, indicando momentos de crise ou instabilidade. Um valor alto de variância sugere períodos de aumento significativo, o que pode ser causado por fatores como crises econômicas ou mudanças sociais.
calcular_media_suicidios_por_ano_do_pais <- function(dados, pais) {
dados_brasil <- dados %>% filter(country == pais)
media_suicidios_por_ano <- dados_brasil %>%
group_by(year) %>%
summarise(
media_suicidios_por_100k = mean(suicides.100k.pop, na.rm = TRUE)
)
return(media_suicidios_por_ano)
}
calcular_variancia_por_pais <- function(dados) {
variancia_por_pais <- dados %>%
group_by(country) %>%
summarise(
variancia_suicidios = var(suicides.100k.pop, na.rm = TRUE)
) %>%
arrange(desc(variancia_suicidios))
return(variancia_por_pais)
}variancia_suicidios_por_pais <- calcular_variancia_por_pais(dados)
# Calcular a média de suicídios por ano para cada país com maior variância
media_suicidios_por_ano_variancia <- map(variancia_suicidios_por_pais$country, ~calcular_media_suicidios_por_ano_do_pais(dados, .))
media_suicidios_cuba <- media_suicidios_por_ano_variancia[[1]]
grafico_histograma_cuba <- plot_ly(
media_suicidios_cuba,
x = ~year,
y = ~media_suicidios_por_100k,
type = 'bar',
marker = list(color = 'red')
) %>%
layout(
title = "Média de Suicídios por Ano em Cuba",
xaxis = list(title = "Ano"),
yaxis = list(
title = "Média de Suicídios por 100k Habitantes",
range = c(0, max(media_suicidios_cuba$media_suicidios_por_100k) + 4)
)
)
grafico_histograma_cubaTransformações sociais e políticas:
Mudanças econômicas e políticas, como o colapso da União Soviética e a
crise econômica nos anos 1990, afetaram a estabilidade social e podem
ter influenciado as taxas de suicídio.
Melhoria na coleta de dados:
O aprimoramento na coleta e reportação de dados pode ter contribuído
para um aumento percebido nas taxas de suicídio, refletindo maior
precisão na monitorização.
Fatores sociais e econômicos:
Flutuações nas condições econômicas e sociais, como crises ou escassez
de recursos, podem ter impactado a saúde mental e aumentado o risco de
suicídio em determinados períodos.
Políticas de saúde pública:
Mudanças na ênfase dada às questões de saúde mental ou nas políticas de
apoio social também podem ter influenciado as taxas de
suicídio.
top_10_maiores_pib <- dados %>%
group_by(country) %>%
summarise(
pib = max(gdp_per_capita, na.rm = TRUE), # Assumindo que gdp_for_year é o PIB
suicidios_media = mean(suicides.100k.pop, na.rm = TRUE) # Média de suicídios por 100k habitantes
) %>%
arrange(desc(pib)) %>%
head(10)
top_10_menores_pib <- dados %>%
group_by(country) %>%
summarise(
pib = max(gdp_per_capita, na.rm = TRUE), # Assumindo que gdp_for_year é o PIB
suicidios_media = mean(suicides.100k.pop, na.rm = TRUE) # Média de suicídios por 100k habitantes
) %>%
arrange(pib) %>%
head(10)
grafico_maiores_pib <- plot_ly(
top_10_maiores_pib,
x = ~reorder(country, pib), # Reordenar os países pelo PIB
y = ~suicidios_media, # Usar a taxa média de suicídios no eixo Y
type = 'bar',
name = 'Maiores PIBs',
marker = list(color = 'royalblue')
) %>%
layout(
title = "Top 10 Países com Maiores PIBs Per Capta e Taxa de Suicídios",
xaxis = list(title = "País", tickangle = -45),
yaxis = list(title = "Suicídios 100k")
)
grafico_menores_pib <- plot_ly(
top_10_menores_pib,
x = ~reorder(country, pib),
y = ~suicidios_media,
type = 'bar',
name = 'Menores PIBs',
marker = list(color = 'darkorange')
) %>%
layout(
title = "Top 10 Países com Menores PIBs Per Capta",
xaxis = list(title = "País e renda", tickangle = -45),
yaxis = list(title = "PIB ($)")
)Os gráficos apresentados mostram a relação entre PIB per capita e taxa média de suicídios (por 100 mil habitantes) para os países com os 10 maiores e 10 menores PIBs.
Além do PIB, diversos aspectos influenciam as taxas de suicídio, incluindo: - Cultura e estigma sobre saúde mental. - Acesso a serviços psicológicos e psiquiátricos. - Desigualdade social e econômica dentro dos países. - Fatores psicológicos e traumas individuais. - Políticas públicas de prevenção ao suicídio.
Embora os dados forneçam uma visão valiosa sobre as tendências de suicídio, há limitações, como a falta de dados completos para todos os países e a possível subnotificação de suicídios, especialmente em países com baixos PIBs. Além disso, fatores culturais específicos e outros determinantes sociais não foram completamente explorados. Futuras análises poderiam incluir uma investigação mais aprofundada sobre o impacto de políticas públicas de saúde mental e a análise de dados longitudinais para compreender melhor as mudanças ao longo do tempo.
Para melhorar a análise, seria interessante integrar dados mais detalhados sobre a saúde mental da população, além de realizar um estudo comparativo entre países com características sociais e culturais semelhantes, mas com diferentes níveis de PIB.