Primeiro passo dado foi transformar a variável Natural do RJ para uma variável qualitativa.
Questionario_Estresse$RJ = ifelse(Questionario_Estresse$RJ == 1, "Sim","Não")
boxplot(Horas_estudo ~ RJ, data = Questionario_Estresse, col=c("gray","pink"), main=
"Relação entre ser natural do RJ e Horas de estudo")Através do gráfico, foi possível concluir que a mediana de horas de estudo fica em torno de 30horas, independentemente do aluno ser ou não natural do Rio. Para o caso dos alunos naturais do Rio, existem dois outliers, ou seja, dois alunos, estudam muito mais que os demais. O gráfico dos alunos naturais do Rio é assimétrico. Para o caso dos alunos de outros estados, existe apenas um outlier, ou seja, apenas um aluna estuda muito mais que os demais. O gráfico dos alunos naturais do Rio é simétrico. Ao comparar os dois gráficos, é possível observar que a amplitude interquartil de quem não mora n RJ é maior do que quem mora, sendo possível explicar devido à fatores externos, como falta dos familiares, falta de incentivo etc.