Através do gráfico, vamos testar a teoria que se há fumantes mais jovens ou fumantes mais velhos.
library(readxl)
questionario_usp <- read_excel("C:/Users/loren/OneDrive/Documentos/Base_de_dados-master/questionario_usp.xlsx")
View(questionario_usp)
library(flextable)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
boxplot(questionario_usp$Idade~questionario_usp$Fuma,col=c("#322155","#188481"), main="Boxplot: Idade de fumantes e não fumantes", xlab = "Fumantes", ylab= "Idade")
No gráfico do tipo Bloxpot, podemos notar que a mediana dos fumantes e não fumantes, em termos absolutos, são bem parecidas, ficando na faixa dos 18 até 19 anos. Além disso, observa-se que não há fumantes menores que 18 anos, o que obviamente é contrário em relação aos não fumantes.
Ademais, apesar de medianas parecidas, podemos notar que o 3º quartil é bem maior em comparação ao 3º quartil dos não fumantes, provando que há bem mais fumantes na faixa dos 19 até 20 anos. Assim, como também, há bastante pessoas fumantes dos 20 ao 21.
Com isso, chegamos a conclusão que a maioria dos fumantes está na faixa etária dos 18 aos 21 anos, logo sendo jovens. Porém, há uma menção honrosa aos não fumantes, com outliers na idade de 23 - 24 anos.