Passo 1 - Carregar a base de dados

library(readxl)
Quest_Estresse <- read_excel("C:/Users/a/Downloads/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls")
View(Quest_Estresse)

Passo 2 - Definição de variável resposta

Variável resposta (desfecho, dependente, endogena): Desempenho (Y)

Variáveis explicativa (exogena, independente): as outras quantitativas (X)

Passo 3 - Diagrama de dispersão

Horas_estudo e Desempenho

plot(Quest_Estresse$Horas_estudo,Quest_Estresse$Desempenho,
     main = " Correlação entre Horas de estudo e Desemprenho",
     pch=25, col="pink",
     ylab="Desempenho",
     xlab = "Horas de estudo")
abline(lsfit(Quest_Estresse$Horas_estudo,Quest_Estresse$Desempenho),col="blue")

cor(Quest_Estresse$Horas_estudo,Quest_Estresse$Desempenho)
## [1] 0.2231532

Há uma correlação entre horas de estudos e desempenhode, sende esta de de 0,22 considerada fraca, positiva.

Contudo vemos que Quanto maior as horas de estudos maior tende a ser o desempenho. O maior desempenho dos alunos é de 9 e o menor 6. Sendo as horas de estudo maior 60 e menor 20.

No diagrama de dispersão vemos que grande parte dos alunos tem maior desempenho acima de 8 com horas de estudo entre 25 a 40.

Passo 4 - Matriz de correlação

names(Quest_Estresse)
##  [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado_a"  
##  [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
selecao = c("Desempenho", "Estresse", "Horas_estudo")
selecao
## [1] "Desempenho"   "Estresse"     "Horas_estudo"
cor(Quest_Estresse[,selecao])
##              Desempenho   Estresse Horas_estudo
## Desempenho   1.00000000 0.08257246    0.2231532
## Estresse     0.08257246 1.00000000    0.3039170
## Horas_estudo 0.22315316 0.30391699    1.0000000
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
Quest_Estresse %>% select(selecao) %>% cor()
## Note: Using an external vector in selections is ambiguous.
## i Use `all_of(selecao)` instead of `selecao` to silence this message.
## i See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.
## This message is displayed once per session.
##              Desempenho   Estresse Horas_estudo
## Desempenho   1.00000000 0.08257246    0.2231532
## Estresse     0.08257246 1.00000000    0.3039170
## Horas_estudo 0.22315316 0.30391699    1.0000000

Passo 5 - Visualização de dados

library(corrplot)
## corrplot 0.92 loaded
Quest_Estresse %>% select(selecao) %>% cor() %>% corrplot(method="number",bg="gold2")

Concluão

Há correlação fraca entre as várias, sendo as mesmas positivas.