Carregar a base de dados - Questionário Estresse

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/KESIA/Desktop/KESIA/Kesia/UFF/1 PERIODO/ESTATISTICA/mestrado_eng/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)

Diagrama de Dispersão

Alunos e Horas de Estudo
plot(Questionario_Estresse$Aluno, Questionario_Estresse$Horas_estudo,
     main = "Correlação entre Alunos e Horas de Estudo",
     pch=19, col="red",
     ylab="Alunos",
     xlab="Horas de Estudo")
abline(lsfit(Questionario_Estresse$Aluno,Questionario_Estresse$Horas_estudo),col="blue")

cor(Questionario_Estresse$Aluno,Questionario_Estresse$Horas_estudo)
## [1] -0.2975181
Alunos e Estresse
plot(Questionario_Estresse$Aluno, Questionario_Estresse$Estresse,
     main = "Correlação entre Alunos e Estresse",
     pch=19, col="pink",
     ylab="Alunos",
     xlab="Estresse")
abline(lsfit(Questionario_Estresse$Aluno,Questionario_Estresse$Estresse),col="red")

cor(Questionario_Estresse$Aluno,Questionario_Estresse$Estresse)
## [1] -0.1969907

Matriz de Correlação das Variáveis

varquantitativas <- c("Aluno", "Desempenho", "Estresse", "Horas_estudo")

varquantitativas
## [1] "Aluno"        "Desempenho"   "Estresse"     "Horas_estudo"
cor(Questionario_Estresse[varquantitativas])
##                     Aluno   Desempenho    Estresse Horas_estudo
## Aluno         1.000000000 -0.005300716 -0.19699068   -0.2975181
## Desempenho   -0.005300716  1.000000000  0.08257246    0.2231532
## Estresse     -0.196990678  0.082572463  1.00000000    0.3039170
## Horas_estudo -0.297518085  0.223153161  0.30391699    1.0000000
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
Questionario_Estresse %>% select(varquantitativas) %>% cor()
## Note: Using an external vector in selections is ambiguous.
## i Use `all_of(varquantitativas)` instead of `varquantitativas` to silence this message.
## i See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.
## This message is displayed once per session.
##                     Aluno   Desempenho    Estresse Horas_estudo
## Aluno         1.000000000 -0.005300716 -0.19699068   -0.2975181
## Desempenho   -0.005300716  1.000000000  0.08257246    0.2231532
## Estresse     -0.196990678  0.082572463  1.00000000    0.3039170
## Horas_estudo -0.297518085  0.223153161  0.30391699    1.0000000
Questionario_Estresse %>% select(varquantitativas) %>% cor() %>% corrplot::corrplot(addCoef.col = TRUE, number.cex =0.7)

Conclusão

No diagrama de dispersão podemos analisar no gráfico das variáveis quantitativas “Alunos e Horas de Estudo” que quanto maior o número de alunos, temos menos horas de estudos e a correlação que mais se aproxima é Correlação negativa fraca, sendo (cor = -0,29). No gráfico das variáveis quantitativas “Alunos e Estresse” podemos definir que ele é sem correlação (cor = -0,19).
Na matriz de correlação das variáveis quantitativas, temos o grau de cada variável quantintativa, pois essa matriz correlaciona todas as variáveis quantitativas escolhidas da base de dados, conforme apresenta o gráfico.