Trabalho Final de Estatística - Análise de ataques de Tubarão no Mundo

Introdução

Este relatório propõe uma análise abrangente e rigorosa dos ataques de tubarão em escala global, com o objetivo de proporcionar uma compreensão precisa e objetiva desses incidentes. Por meio da meticulosa avaliação de dados qualitativos e quantitativos, nosso intuito é identificar padrões, tendências e fatores associados aos ataques de tubarão, adotando uma abordagem fundamentada em evidências e afastando-nos de narrativas sensacionalistas.

Ao longo do documento, será dada uma ênfase significativa à interpretação cuidadosa e detalhada dos dados estatísticos coletados. Este enfoque visa estabelecer uma base sólida para a formulação de políticas de segurança em áreas propensas a esses incidentes.

Nossa abordagem metodológica inclui a compilação e análise de dados históricos, considerando não apenas a frequência de ataques, mas também fatores contextuais, como localização geográfica, condições ambientais, comportamento das vítimas e espécies de tubarão envolvidas. A contextualização dessas informações contribuirá para uma compreensão mais holística e informada dos incidentes, permitindo a identificação de áreas específicas de risco e a formulação de estratégias de prevenção e resposta.

Buscamos promover uma abordagem equilibrada, baseada em fatos, que possa ser instrumental na gestão de riscos relacionados a ataques de tubarão. Este relatório não apenas servirá como uma fonte confiável de informações para pesquisadores, autoridades e especialistas em segurança, mas também como um recurso valioso para educar o público em geral sobre medidas preventivas e comportamentos seguros em áreas suscetíveis a encontros com tubarões.

Objetivo

Nosso objetivo neste trabalho é oferecer dados e informações sobre ataques de tubarões em todo o mundo,para que possam servir de insights e auxiliem a informar estratégias de prevenção e gestão de riscos, fornecendo uma perspectiva clara sobre a distribuição geográfica, sazonalidade e espécies de tubarão envolvidas nos ataques. Já de uma perspectiva específica, esse relatório analisará se e como algumas variáveis tem influência sobre os ataques e os riscos dos mesmos. Mais precisamente temos o objetivo central de responder às seguintes perguntas de pesquisa:

● Onde tem mais ataques no mundo?

● Como influenciam as atividades praticadas durante o ataque na chance de fatalidade?

● Existem espécies mais propensas a atacar seres humanos? Se sim,quais seriam essas espécies?

Analisaremos também o que esses resultados podem impactar, se há influência de fatores externos nas hipóteses, suas possíveis causas e conclusões sobre essas análises.

Metodologia

1. Fonte de Dados: ‘Global Shark Attack’: A base de dados principal utilizada neste estudo consiste na compilação de informações provenientes do conjunto de dados ‘Global Shark Attack’, composto por 6.819 observações. Esses dados foram extraídos do site ‘Opendatasoft’, e ressaltamos que a versão acessada e utilizada para esta análise é a mais recente disponível até 31/10/2023. Vale destacar que essa base é dinâmica, sujeita a atualizações periódicas.

2. Cruzamento de Dados com a Base Auxiliar ‘CODIGO PARA MAPA’: Para aprimorar a análise e facilitar a utilização de determinadas funções, realizamos um cruzamento manual da base de dados principal com a base auxiliar intitulada ‘CODIGO PARA MAPA’. Esse procedimento permitiu uma visão mais abrangente e contextualizada dos dados, enriquecendo as possibilidades de interpretação.

3. Idioma da Base de Dados e Análises Estatísticas: A base de dados principal está integralmente em língua inglesa. Portanto, as análises estatísticas realizadas neste estudo serão apresentadas em inglês, refletindo a natureza original da fonte. No entanto, as descrições, interpretações e conclusões serão fornecidas em português, garantindo a compreensão clara e acessível do conteúdo.

4. Limpeza de Dados e Estruturação da Base: Realizamos um processo de ‘limpeza’ dos dados, visando aprimorar a qualidade e consistência da análise. Algumas colunas, como ‘Case Number’ e ‘href formula’, foram excluídas por não contribuírem diretamente para os objetivos do estudo. Além disso, na coluna ‘Sex’, implementamos uma padronização para garantir que apenas as opções ‘F’ (feminino) e ‘M’ (masculino) estejam presentes, simplificando a interpretação e facilitando futuras comparações.

Esta metodologia visa assegurar a confiabilidade e relevância dos resultados obtidos, proporcionando uma base sólida para análises estatísticas e interpretações significativas no contexto global de ataques de tubarões.

segue o carregamento das bases de dados e das bibliotecas necessárias para a elaboração do relatório

library(readxl)
global_shark_attack <- read_excel("C:/Users/Gabriela/Downloads/global-shark-attack.xlsx")
library(readxl)
CODIGO_PARA_MAPA <- read_excel("C:/Users/Gabriela/Downloads/CODIGO_PARA_MAPA.xlsx") 
## New names:
## • `Country` -> `Country...2`
## • `` -> `...3`
## • `Country` -> `Country...4`
View(global_shark_attack)

Análise de ataques no Globo

o gráfico a seguir apresenta uma demonstração do número de ataques por País.

library(rworldmap)
## Warning: package 'rworldmap' was built under R version 4.3.2
## Carregando pacotes exigidos: sp
## The legacy packages maptools, rgdal, and rgeos, underpinning the sp package,
## which was just loaded, were retired in October 2023.
## Please refer to R-spatial evolution reports for details, especially
## https://r-spatial.org/r/2023/05/15/evolution4.html.
## It may be desirable to make the sf package available;
## package maintainers should consider adding sf to Suggests:.
## ### Welcome to rworldmap ###
## For a short introduction type :   vignette('rworldmap')
tub <- joinCountryData2Map(CODIGO_PARA_MAPA
                             , joinCode = "ISO3"
                             , nameJoinColumn = "ISO3V10" )
## 149 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 94 codes from the map weren't represented in your data
cor <- RColorBrewer::brewer.pal(5,'RdPu')

mapCountryData( tub, nameColumnToPlot="n",colourPalette =cor,
                mapTitle ="Ataque de Tubarão")
## You asked for 7 quantiles, only 3 could be created in quantiles classification
## Warning in rwmGetColours(colourPalette, numColours): 5 colours specified and 3
## required, using interpolation to calculate colours

Ao examinar o gráfico apresentado, notamos que O continente Americano se destaca como a região com a maior ocorrência desse tipo de incidente. Mais especificamente, a América do Norte se sobressai como a área com a maior incidência, com os Estados Unidos liderando como o país mais afetado.

Embora as analises visuais mostrem certo padrão, após a realização do teste de kruskal wallis o p valor resultante indicou uma ausencia de correlação entre as variáveis. Logo, pode-se concluir que a região geográfica nada influencia nos ataques de tubarão.

Análise da Influência da Atividade na Gravidade do Ataque

para essa avaliação iremos criar tabelas para as análises individuais das estatísticas e depois agrega-las em uma análise conjunta.

Tabela de lesões

Nessa tabela contaremos os tipos de lesões causadas pelos ataques de tubarão.

library(forcats)
## Warning: package 'forcats' was built under R version 4.3.2
global_shark_attack$lesao = global_shark_attack$Injury %>%
  fct_lump_n(5)

table(global_shark_attack$lesao)
## 
##       FATAL Foot bitten  Leg bitten   No injury    Survived       Other 
##         862         100          82          89          97        5623

A tabela de lesões fornece detalhes sobre os tipos de danos causados pelos ataques de tubarão. Destaca-se que, embora a maioria dos ataques resulte em sobrevivência, as fatalidades representam uma preocupação significativa, totalizando 862 casos. Além disso, é notável que algumas lesões que inicialmente não parecem graves podem levar a fatalidades ao longo do tempo

Tabela de atividades

a tabela a seguir nos mostra as atividades que as pessoas estavam fazendo quando foram atacadas.

global_shark_attack$atividade = global_shark_attack$Activity %>%
  fct_lump_n(5)

table(global_shark_attack$atividade)
## 
##      Fishing Spearfishing      Surfing     Swimming       Wading        Other 
##          498          387         1112         1009          171         3127

Os dados da tabela revelam que as atividades mais frequentemente associadas a ataques de tubarão são o surfe e a natação recreativa. Isso pode ser explicado pela prática mais comum dessas atividades em áreas mais profundas do mar em comparação com outras. Essa análise estatística fornece insights valiosos sobre os padrões de ataques de tubarão e destaca a importância de considerar a atividade específica ao avaliar a gravidade potencial desses incidentes.

Análise conjunta

Hipótese:

A hipótese em estudo propõe que a atividade realizada no momento do ataque por tubarões pode influenciar as chances de fatalidade associadas ao incidente.

tabela = table(global_shark_attack$lesao,global_shark_attack$atividade)
barplot(tabela,beside = T,legend.text = rownames(tabela),args.legend = list(x = "topleft"),
        col=c("#d9aaf0","#e436f7","#fc62b2","skyblue","#f768cf","#68f7b4"))

Teste de Hipótese:

H0 (Hipótese Nula): A atividade realizada no momento do ataque pode influenciar a gravidade do ataque. H1 (Hipótese Alternativa): A atividade realizada no momento do ataque não influencia a gravidade do ataque. Nível de Significância (Alpha): 0,05

chisq.test(global_shark_attack$atividade,global_shark_attack$lesao)
## Warning in chisq.test(global_shark_attack$atividade,
## global_shark_attack$lesao): Aproximação do qui-quadrado pode estar incorreta
## 
##  Pearson's Chi-squared test
## 
## data:  global_shark_attack$atividade and global_shark_attack$lesao
## X-squared = 270.77, df = 25, p-value < 2.2e-16

Resultado do Teste:

Após a aplicação do teste Qui-quadrado de Pearson, obtemos um p-valor de 2.2e-16, indicando que p-valor < 0,05.

Interpretação:

O p-valor menor que 0,05 leva à rejeição da hipótese nula (H0). Isso sugere que a atividade realizada no momento do ataque de tubarão realmente tem uma associação estatisticamente significativa com a gravidade do ataque. No entanto, ao analisarmos o gráfico, observamos que, embora exista uma atividade (nadando) com uma incidência de fatalidade mais alta, a conclusão é que a atividade em si não influencia a gravidade do ataque. Surpreendentemente, quando a pessoa está surfando, as chances de um ataque fatal são menores em comparação com outras atividades. Além disso, destaca-se que os ataques durante a prática do surfe têm uma tendência menor de resultar em fatalidades em comparação com outras atividades. Curiosamente, há uma maior probabilidade de os ataques de tubarão resultarem em mordidas nos pés das vítimas quando o incidente ocorre durante a prática do surfe

Tabelas de análise de gênero e fatalidade

Tabela fatal ou não fatal

global_shark_attack$fatal = ifelse(global_shark_attack$`Fatal (Y/N)`=="y","Sim",
                            ifelse(global_shark_attack$`Fatal (Y/N)`=="Y","Sim",
                            ifelse(global_shark_attack$`Fatal (Y/N)`=="n","Não",
                            ifelse(global_shark_attack$`Fatal (Y/N)`=="N","Não",NA))))

table(global_shark_attack$fatal)
## 
##  Não  Sim 
## 4805 1448

Tabela sexo

global_shark_attack$Sexo= ifelse(global_shark_attack$Sex=="F","feminino",
                                 ifelse(global_shark_attack$Sex=="M","masculino",NA))

table(global_shark_attack$Sexo)
## 
##  feminino masculino 
##       768      5545

Análise das raças envolvidas nos ataques

Nesta parte final do relatório gostariamos de analisar se determinadas espécies de tubarões são mais propensas a atacar seres humanos do que outras.

library(forcats)

global_shark_attack$especie = global_shark_attack$Species %>%
  fct_lump_n(5)

table(global_shark_attack$especie)
## 
##                                            Invalid 
##                                                102 
##                    Shark involvement not confirmed 
##                                                 92 
## Shark involvement prior to death was not confirmed 
##                                                105 
##                                        Tiger shark 
##                                                 89 
##                                        White shark 
##                                                193 
##                                              Other 
##                                               3191
pie(table(global_shark_attack$especie))

A análise da incidência de ataques de tubarões revela variações significativas de acordo com a espécie, sendo notável que o tubarão branco se destaca com valores consideráveis. Os dados coletados indicam que o tubarão branco, também conhecido como Carcharodon carcharias, está associado a um número mais elevado de incidentes em comparação com outras espécies. No conjunto de dados fornecido, verifica-se que o envolvimento do tubarão não foi confirmado em 92 casos. Além disso, em 105 casos, o envolvimento do tubarão não foi confirmado antes da morte da vítima. Entre as espécies específicas, o tubarão-tigre, representado por 89 casos, e o tubarão branco, com 193 casos, destacam-se como potenciais protagonistas em incidentes de ataques a seres humanos.

Conclusão

Com base nos resultados obtidos, podemos inferir que a variável qualitativa “Ataque de Tubarão” é influenciada por diversas variáveis presentes na base de dados utilizada. De acordo com nossa primeira hipótese, a incidência de ataques de tubarão varia conforme a região geográfica. Notavelmente, as áreas que se destacam com maiores ocorrências de ataques de tubarão são América do Norte, principalmente nos Estados Unidos, Austrália e África do Sul. Em segundo plano, encontramos o Caribe, Brasil e México.

Ao analisarmos nossa segunda hipótese, é evidente que a incidência e a gravidade ou fatalidade do ataque de tubarão variam de acordo com a atividade realizada pela vítima durante o incidente. Observa-se uma maior frequência de ataques durante atividades como natação ou surfe, possivelmente devido ao fato de essas práticas ocorrerem em áreas mais profundas do mar, onde a presença de tubarões é mais comum. Além disso, tais atividades podem contribuir para que a pessoa seja confundida como presa pelos tubarões. Quando o ataque ocorre durante a natação, as chances de ser fatal são mais elevadas. Outro ponto destacado é que homens sofrem mais ataques de tubarões do que mulheres, possivelmente devido ao maior tempo que os homens passam na água e à prática mais frequente de atividades propensas a ataques.

Na terceira hipótese, concluímos que a incidência de ataques varia de acordo com a espécie de tubarão, sendo notável que a espécie Tubarão Branco se destaca em relação aos ataques a humanos. Pesquisas indicam que isso ocorre principalmente devido ao seu tamanho, poder e comportamento alimentar. Para evitar o aumento da incidência de ataques de tubarão, é crucial promover a conscientização sobre locais com alta probabilidade de ataques e instruir as pessoas sobre os cuidados necessários em determinadas áreas.

Seria ideal que essa conscientização fosse incorporada ao currículo escolar, tornando-se um conhecimento comum desde cedo. Educar as gerações mais jovens sobre as precauções necessárias ao frequentar áreas propensas a ataques de tubarão pode contribuir significativamente para a redução desses incidentes no futuro.