Diagrama de dispersão

library(readxl)
Quest_Est <- read_excel("C:/Users/Windows 10/Documents/MESTRADO - UFF/Estatistica aplicada a engenharia/Base_de_dados-master/Questionario_Estresse.xls")




plot(Quest_Est$Estresse, Quest_Est$Horas_estudo,
     main="Correlação entre as horas de estudo e o estresse",
     pch=19, col="darkgreen",
     ylab= "Horas de estudo",
     xlab= "Estresse",
     abline(lsfit(Quest_Est$Estresse, Quest_Est$Horas_estudo), col="blue"))

Correlação entre o estresse e as horas de estudo

cor(Quest_Est$Estresse, Quest_Est$Horas_estudo)
## [1] 0.303917

Este trabalho é resultado de uma pesquisa sobre grau de estresse aplicada em duas turmas do curso de psicologia. 95 alunos participaram da pesquisa. Quando traçamos o diagrama de dispersão relacionando as horas de estudos e o estresse dos participantes da pesquisa, encontramos uma correlação positiva moderada (ρ = 0,303917). O coeficiente de determinação R² indica a proporção da variabilidade em uma variável que é explicada pela outra. Entre as duas variáveis analisadas esse valor foi de R² = 0,0924, indicando que apenas 9,2% dos dados de estresse podem ser explicados pelas horas de estudo.

Matriz de correlação

library(dplyr)
library(corrplot)

selecao <-c("Desempenho","Horas_estudo","Estresse","Créditos")
Quest_Est %>% select(selecao) %>% cor() %>% corrplot(addCoef.col=TRUE,number.cex=0.7)

Na matriz de correlação estão dispostas as seguintes variáveis: desempenho, horas de estudo, estresse e créditos. Havia um dado faltando na variável de créditos, esse dado foi incluindo efetuando uma média entre os outros dados de créditos. Excetuando o cruzamento de variáveis iguais, a maior correlação obtida foi entre o número de créditos e as horas de estudo, com um coeficiente de correlação ρ = 0,5, que indica uma correlação positiva moderada. A menor correlação obtida foi entre o número de créditos e o estresse, com coeficiente de correlação ρ = -0,06, que indica uma correlação negativa nula.