library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Maysa Godoy/Desktop/Base_de_dados-master/Questionario_Estresse.xls",
sheet = "Dados")As variáveis utilizadas na análise foram: desempenho e horas de estudo. Foi feito um cruzamento entre os dados.
par(bg = "lightpink")
par(cex=0.8)
plot(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho, pch = 16, col= "purple",
main = " Gráfico 1 - Diagrama de dispersão \n entre desempenho e horas de estudo",
xlab = "Horas de estudo",
ylab = "Desempenho")
abline(lsfit(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho),col="black")cor(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho)## [1] 0.2231532
selecao<-c("Desempenho","Horas_estudo")
correlacao <- cor(Questionario_Estresse[,selecao])
library(corrplot)## corrplot 0.92 loaded
par(bg = "lightyellow")
par(cex=0.7)
corrplot(correlacao,method = "number")Inicialmente, ao cruzar os dados e montar o gráfico de dispersão, a linha traçada indica uma correlação positiva média, onde os dados estão crescendo, apesar de os pontos não estarem tão concentrados. Entretanto, primeiramente, todos têm a impressão de que mais horas estudadas representam maior desempenho, porém, quando criado o gráfico de dispersão, essa ideia é logo dada como não verdadeira, pois vê-se que mesmo com o número de horas estudo aumentando, o desempenho de alguns alunos não acompanham o crescimento.
Posteriormente, com a matriz de correlação, é confirmado que há de fato uma correlação entre as duas variáveis e é de 0,22, o que caracteriza uma correlação positiva e de grau fraco de associação. Logo, é desmistificada a afirmação de que mais horas estudadas resultam em um maior desempenho, pois, os dados mostram que mesmo aqueles que possuem mais horas de estudo semanalmente podem ter um desempenho pior daqueles que estudam bem menos horas por semana.