Qual é o departamento de polícia mais movimentado em
Ames?
# Cálculo da Frequência Relativa:
distribuicao_testes <- dados %>%
group_by(location) %>%
summarise(frequencia = n()) %>%
mutate(frequencia_relativa = frequencia/sum(frequencia))
distribuicao_testes
## # A tibble: 2 × 3
## location frequencia frequencia_relativa
## <chr> <int> <dbl>
## 1 Ames PD 616 0.396
## 2 ISU PD 940 0.604
# Gráfico de barras com Porcentagem:
ggplot(distribuicao_testes, aes(x = reorder(location, -frequencia_relativa), y = frequencia_relativa, fill = location)) +
geom_bar(stat = "identity", color = "black") +
theme_minimal() +
labs(x = "Localização", y = "Frequência Relativa", title = "Porcentagem de Testes de Alcoolemia por Local") +
scale_fill_manual(values = c("ISU PD" = "cyan", "Local2" = "red")) +
scale_fill_discrete(name = "Local") +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
geom_text(aes(label = scales::percent(frequencia_relativa), y = frequencia_relativa), position = position_stack(vjust = 0.5))

Conclusão A polícia da Iowa State University (ISU
PD) foi o local onde ocorreu a maior quantidade de testes de bafômetro.
Obteve um quantidade de 940 testes, o que representa 60 % dos testes.
Pelo fato de ser um cidade universitária, têm uma alta concentração de
jovens adultos, um grupo demográfico que estatisticamente pode ter maior
propensão ao consumo de álcool, especialmente em contextos sociais.
Eventos universitários e festas contribuem para isso. A localização da
universidade e o acesso a bares, restaurantes e eventos que vendem
álcool também podem facilitar o consumo.

A tradição de festas que se estendem até a madrugada é uma
prática comum em muitas culturas ao redor do mundo, refletindo não
apenas uma preferência social por celebrações noturnas, mas também
aspectos mais profundos das interações humanas e da vida comunitária.
Sabemos que em uma cidade universitária como Ames, existem horários que
são realizados mais e menos testes de alcoolemia. Quais horas do dia
fazem mais e menos testes de bafômetro?
# Testes de bafômetro por hora:
testes_por_hora <- dados %>%
group_by(hour) %>%
count() %>%
arrange(desc(n))
testes_por_hora
## # A tibble: 24 × 2
## # Groups: hour [24]
## hour n
## <int> <int>
## 1 2 417
## 2 3 364
## 3 1 219
## 4 4 124
## 5 0 98
## 6 23 51
## 7 5 48
## 8 20 31
## 9 22 29
## 10 21 26
## # ℹ 14 more rows
# Gráfico de barras para visualização:
testes_por_hora %>%
ggplot(aes(x = factor(hour), y = n)) +
geom_bar(stat = "identity",color = "cyan", fill = "black") +
theme_minimal() +
labs(title = "Quantidade de testes por hora", x = "Hora", y = "Número de Testes") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))

Conclusão: Conforme o gráfico, é possível perceber
que entre meia-noite e 4 horas da manhã é o intervalo de tempo onde
ocorre a maior quantidade de testes de alcoolemia. É comum que os testes
de bafômetro mostrem um aumento nas horas noturnas e nas primeiras horas
da manhã, justamente por conta do fechamento de bares e clubes. As horas
da manhã e da tarde apontam uma quantidade bem menor de testes, o que
possa ser também por conta do horário de trabalho, indicando uma menor
incidência de condução sob influência de álcool durante esses
períodos.
Agora que descobrimos qual horário do dia é mais comum para
o teste do bafômetro, vamos determinar qual época do ano tem mais testes
de bafômetro. Qual mês terá mais testes registrados ?
# Quantiade de testes por mês:
testes_por_mes <- dados %>%
group_by(month) %>%
count() %>%
arrange(desc(n))
testes_por_mes
## # A tibble: 12 × 2
## # Groups: month [12]
## month n
## <int> <int>
## 1 8 167
## 2 4 159
## 3 9 146
## 4 1 145
## 5 3 145
## 6 10 135
## 7 5 132
## 8 2 117
## 9 6 112
## 10 7 104
## 11 11 100
## 12 12 94
# Plotando um gráfico de Barras para visualização:
testes_por_mes %>%
ggplot(aes(x = factor(month), y = n)) +
geom_bar(stat = "identity", fill = "red", color = "black") +
theme_minimal() +
labs(title = "Quantidade de Testes de bafômetro por mês", x = "Meses Do Ano",y = "Quantidade de Testes por mês") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))

Conclusão O mês com a maior quantidade de testes
registrados é o mês de agosto.
Quando pensamos em beber em cidades universitárias nos
Estados Unidos, geralmente pensamos sempre na imagem de homens bebendo.
E assim, pode-se suspeitar que os testes de alcoolemia são dados aos
homens com mais frequência do que às mulheres e que os homens bebem mais
do que as mulheres. Com quem foi realizado mais testes de bafômetro, com
as mulheres ou com os homens ?

# Quantidade de testes para cada Gênero:
dados %>%
group_by(gender) %>%
count()
## # A tibble: 3 × 2
## # Groups: gender [3]
## gender n
## <chr> <int>
## 1 F 425
## 2 M 1102
## 3 <NA> 29
# Conseguimos notar que há valores 29 valores "NA" na variável gender (Gênero). Será que há mais valores NA em outras variáveis ? Vamos descobrir.
quantidade_na <- sapply(dados, function(x) sum(is.na(x)))
quantidade_na
## year month day hour location gender Res1 Res2
## 0 0 0 0 0 29 0 0
# Há somentes valores NA na variável Gênero. Vamos filtrar todos os valores que não são NA na variável para que possamos responder a pergunta.
clean_genero <- dados %>%
filter(!is.na(gender))
sum(is.na(clean_genero$gender))
## [1] 0
# Limpeza concluída.
# Cálculo da Frequência Relativa:
distribuicao_genero <- clean_genero %>%
group_by(gender) %>%
summarise(frequencia = n()) %>%
mutate(frequencia_relativa = frequencia/sum(frequencia))
# Gráfico de setores:
distribuicao_genero %>%
ggplot(aes(x = " ", y = frequencia_relativa, fill = gender)) +
geom_bar(width = 1, stat = "identity", color = "black") +
coord_polar("y", start = 0) +
theme_void() +
labs(title = "Distribuição do Gênero nos testes", x = NULL, y = NULL) + geom_text(aes(label = scales::percent(frequencia_relativa), y = frequencia_relativa), position = position_stack(vjust = 0.5))

Conclusão: Como observado pelo gráfico de setores e
confirmado pelos dados, uma grande maioria dos testes de bafômetro
(aproximadamente 72%) foram realizados em pessoas do sexo masculino, em
contraste com cerca de 28% para o sexo feminino. Esta disparidade pode
ser reflexo de padrões sociais e de comportamento relacionados ao
consumo de álcool. Pesquisas indicam que, em média, homens tendem a
consumir álcool mais frequentemente e em maiores quantidades que
mulheres, o que pode contribuir para um maior risco de envolvimento em
situações que requerem testes de bafômetro, como a condução sob
influência de álcool. É importante, contudo, considerar que esses dados
também podem refletir políticas de fiscalização e abordagens de
prevenção que variam por gênero, além de possíveis vieses na aplicação
de tais testes. A análise destes resultados sugere a necessidade de
abordagens direcionadas na educação sobre o consumo de álcool e nas
estratégias de prevenção de condução sob efeito de álcool, que
considerem as diferenças de gênero nas práticas de consumo de álcool e
nas interações com as forças de segurança.
Nos Estados Unidos, a legislação de trânsito proíbe a
condução de veículos por indivíduos com uma concentração de álcool no
sangue (BAC) que ultrapasse 0,08%. Essa regra é uniforme em todos os 50
estados, estabelecendo um padrão claro para a definição de condução sob
influência (DUI).
Considerando a hipótese de que todos os indivíduos
submetidos aos testes de bafômetro em nosso dataset estivessem de fato
dirigindo — embora os dados não forneçam informações diretas sobre as
circunstâncias dos testes —, a presença de qualquer resultado (Res1 ou
Res2) acima do limite de 0,08% implicaria na possibilidade de uma
acusação formal por DUI.
Este critério serve como um importante indicador legal para
aferir a capacidade de condução segura, visando reduzir os riscos de
acidentes associados ao consumo de álcool. Ao analisar os dados sob essa
perspectiva, é possível identificar a proporção de testes que
resultariam em potenciais acusações de DUI, oferecendo insights valiosos
sobre a prevalência de comportamentos de risco entre os
motoristas.
# Vamos Determinar qual o percentual dos testes do bafômetro nos dados estão acima do limite legal.
testes_acima_limite <- dados %>%
filter(Res1 > 0.08 | Res2 > 0.08)
# Proporção de testes que teriam resultado em uma DUI:
proporcao_dui <- nrow(testes_acima_limite)/nrow(dados)
proporcao_dui
## [1] 0.7448586
# Criando uma nova variável informando se o teste está acima do limite:
dados <- dados %>%
mutate(Limit_exceeded = ifelse(Res1 > 0.08 | Res2 > 0.08, "Yes", "No"))
head(dados)
## year month day hour location gender Res1 Res2 Limit_exceeded
## 1 2017 12 17 1 Ames PD M 0.046 0.046 No
## 2 2017 12 14 3 ISU PD F 0.121 0.120 Yes
## 3 2017 12 10 5 ISU PD F 0.068 0.067 No
## 4 2017 12 10 3 ISU PD F 0.077 0.077 No
## 5 2017 12 9 2 ISU PD M 0.085 0.084 Yes
## 6 2017 12 9 1 Ames PD M 0.160 0.161 Yes
# Calculando a Frequência relativa:
frequencia_relativa_teste <- dados %>%
group_by(Limit_exceeded) %>%
summarise(frequencia = n()) %>%
mutate(frequencia_relativa = frequencia/sum(frequencia))
# Gráfico de Barras com porcentagem para visualização:
frequencia_relativa_teste %>%
ggplot(aes(x = Limit_exceeded, y = frequencia_relativa, fill = Limit_exceeded)) +
geom_bar(stat = "identity",color= "black") +
theme_minimal() +
labs(title = "Porcentagem de testes acima e dentro do limite", x = "Limite excedido", y = "Porcentagem") +
scale_fill_discrete(name = "Status") +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
geom_text(aes(label = scales::percent(frequencia_relativa), y = frequencia_relativa), position = position_stack(vjust = 0.5))

Conclusão: A análise revelou que 74% dos testes de
bafômetro apresentaram níveis de álcool acima do limite legal, com a
maioria ocorrendo sob a jurisdição do Departamento de Polícia da
Universidade Estadual (ISU PD). Este achado sublinha a influência do
ambiente universitário, sugerindo que características específicas de
cidades universitárias, como a cultura de festas e eventos sociais com
álcool, podem contribuir significativamente para o alto índice de
infrações por DUI. A prevalência desses resultados em áreas ligadas à
vida universitária reforça a necessidade de estratégias educativas e
preventivas focadas na população estudantil para mitigar o risco de
condução sob influência de álcool.
Teste do bafômetro: existe um padrão ao longo do
tempo?
Vimos anteriormente que 2h da manhã é o horário mais comum
do dia para a aplicação do teste do bafômetro, e agosto é o mês do ano
mais comum para o teste do bafômetro. Agora, olhamos para as semanas do
ano ao longo do tempo. Vamos Usar brevemente um pacote para um pouco de
manipulação de data-hora.
library(lubridate)
# Criando uma nova variável com a Data:
dados <- dados %>%
mutate(date = ymd(paste(year, month, day, sep = "-")))
# Criando uma nova variável para a semana:
dados <- dados %>%
mutate(week = week(date))
head(dados)
## year month day hour location gender Res1 Res2 Limit_exceeded date
## 1 2017 12 17 1 Ames PD M 0.046 0.046 No 2017-12-17
## 2 2017 12 14 3 ISU PD F 0.121 0.120 Yes 2017-12-14
## 3 2017 12 10 5 ISU PD F 0.068 0.067 No 2017-12-10
## 4 2017 12 10 3 ISU PD F 0.077 0.077 No 2017-12-10
## 5 2017 12 9 2 ISU PD M 0.085 0.084 Yes 2017-12-09
## 6 2017 12 9 1 Ames PD M 0.160 0.161 Yes 2017-12-09
## week
## 1 51
## 2 50
## 3 50
## 4 50
## 5 49
## 6 49
Como as semanas diferem ao longo do tempo?
O Encerramento da VEISHEA: Um Fim para a Tradição Histórica
na Iowa State University
Da Wikipedia: A VEISHEA era uma festividade tradicional que marcava
o calendário da primavera na Iowa State University, situada em Ames,
Iowa. Reconhecida como a maior celebração estudantil do país, a VEISHEA
unia, durante uma semana anual, um vasto leque de atividades que
incluíam um desfile emblemático, exposições abertas ao público das
diversas faculdades e departamentos da universidade, bem como a
apresentação de inovações tecnológicas e produtos desenvolvidos por
organizações estudantis. Estas últimas também aproveitavam o evento para
promover campanhas beneficentes. A riqueza cultural do evento era
complementada por conferências e espetáculos que atraíam personalidades
e artistas de renome ao estado de Iowa, consolidando a VEISHEA como um
ponto de encontro que atraía milhares de visitantes ao campus
universitário a cada ano.
No entanto, após mais de nove décadas de tradição, a VEISHEA teve
seu término anunciado de forma definitiva devido a episódios de
violência e vandalismo ocorridos durante as celebrações de 2014,
incluindo atos de embriaguez que resultaram na destruição de veículos e
postes de iluminação. Infelizmente, esses eventos não foram isolados,
marcando apenas o mais recente de uma série de incidentes que mancharam
a história do festival. A decisão de encerrar a VEISHEA reflete a
preocupação com a segurança e o bem-estar da comunidade, pondo fim a uma
era de celebrações que, apesar de ricas em cultura e engajamento
comunitário, foram ofuscadas pela recorrência de distúrbios.
# Vamos plotar o gráfico de série temporal anterior com anotações apontando para as duas últimas semanas VEISHEA na história do estado de Iowa:
ggplot() +
geom_point(data = testes_por_semana_emcada_ano, aes(x = week, y = n, color = factor(year))) +
geom_line(data = testes_por_semana_emcada_ano, aes(x = week, y = n, color = factor(year))) +
geom_segment(data = NULL, arrow = arrow(angle = 20, length = unit(0.1, "inches"),
ends = "last", type = "closed"),
aes(x = c(20,20), xend = c(15.5,16), y = c(21, 20), yend = c(21, 12.25))) +
geom_text(data = NULL, aes(x = 23, y = 20.5, label = "VEISHEA Weeks"), size = 3) +
scale_x_continuous(breaks = seq(0,52,2))

Conclusão do Projeto sobre Testes de Alcoolemia em Ames,
Iowa
A análise detalhada dos dados de testes de alcoolemia realizados em
Ames, Iowa, especialmente no contexto da Iowa State University, revela
insights significativos sobre padrões de consumo de álcool e
comportamento de condução. Aumentos notáveis na realização de testes
durante os anos de 2013 e 2014 sugerem uma resposta intensificada das
autoridades locais frente aos desafios impostos pelo consumo excessivo
de álcool, especialmente em um ambiente universitário vibrante. A
subsequente diminuição nos testes pode refletir tanto mudanças nas
estratégias de fiscalização quanto alterações no comportamento da
comunidade.
A localização dos testes, majoritariamente conduzidos pela Polícia
da Iowa State University, destaca a influência do ambiente universitário
e dos eventos sociais relacionados. A alta concentração de jovens
adultos, propensos a participar de festividades e eventos que envolvem
álcool, sugere uma ligação direta entre as dinâmicas sociais
universitárias e a incidência de condução sob influência de álcool.
A distribuição temporal dos testes, com picos entre meia-noite e 4
horas da manhã e durante o mês de agosto, bem como a predominância de
testes em homens, ressalta a necessidade de políticas públicas e
estratégias educacionais focadas. Isso inclui campanhas de
conscientização sobre os perigos da condução sob efeito de álcool e
programas de educação direcionados à população jovem adulta e
estudantil.
Além disso, a análise dos dados em relação ao evento da VEISHEA, que
tradicionalmente atraía um grande número de visitantes ao campus,
fornece um contexto crucial para entender o pico de testes observados em
determinados períodos. O encerramento da VEISHEA, devido aos distúrbios
relacionados ao álcool, reflete as complexidades de gerenciar eventos de
grande escala em ambientes universitários e as consequências potenciais
na segurança pública.
Conclui-se que a combinação de um ambiente universitário ativo,
eventos sociais centrados no álcool, e a demografia específica de Ames
contribui para os desafios de segurança pública relacionados à
alcoolemia. A resposta das autoridades locais e da universidade,
juntamente com a necessidade de estratégias preventivas e educacionais
adaptadas, são cruciais para mitigar os riscos associados à condução sob
influência de álcool. Este projeto sublinha a importância de abordagens
multidisciplinares e colaborativas na promoção da segurança no trânsito
e na criação de um ambiente comunitário mais seguro e responsável.
