Passo 1 - Carregar a base de dados

#----------------------------------------------------------
# Passo 1 - Carregar a base de dados
#-------------------------------------------------------------
library(readxl)
Questi <- read_excel("C:/Users/Marcus Tulio/Desktop/MESTRADO2022_1/DISCIPLINAS/Estatistica/Mestrado_engenharia/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls", 
                     sheet = "Dados", col_types = c("numeric", 
                                                    "numeric", "numeric", "numeric", 
                                                    "numeric", "numeric", "numeric", 
                                                    "numeric", "numeric", "numeric"))
View(Questi)

Passo 2 - Definição de Variável resposta de Dispersão

Desempenho e Horas de Estudo

Estresse e Horas de Estudo

Variável resposta (desfecho, dependente, endógena): Horas de Estudo (Y)

Variável explicativa (independente, exógena: Desempenho e Estresse (X)

Os determinantes das Horas de Estudo

Passo 3 - Diagrama de dispersão

#----------------------------------------------------------
# Passo 3 - Diagrama de dispersão
#----------------------------------------------------------

# plot(Questi$Desempenho,Questi$Horas_estudo)
plot(Questi$Desempenho,Questi$Horas_estudo, 
     main = "Correlação entre Desempenho e Horas de Estudo",
     pch=19, col="red",
     ylab = "Horas de Estudo", 
     xlab = "Desempenho")
abline(lsfit(Questi$Desempenho,Questi$Horas_estudo),col="blue")

cor(Questi$Desempenho,Questi$Horas_estudo)
## [1] 0.2231532
# plot(Questi$Estresse,Questi$Horas_estudo)

plot(Questi$Estresse,Questi$Horas_estudo, 
     main = "Correlação entre Horas de Estudo e Estresse",
     pch=21, col="blue",
     ylab = "Horas_estudo", 
     xlab = "Estresse")
abline(lsfit(Questi$Estresse,Questi$Horas_estudo),col="red")

cor(Questi$Estresse,Questi$Horas_estudo)
## [1] 0.303917
Quanto maior as horas de estudo tende a ser melhor o desempenho dos alunos.
O estresse e as horas de estudo possuem uma correlação linear positiva e moderada com um valor aproximado de cor = 0,30.

Passo 4 - Matriz de Correlação

#----------------------------------------------------------
# Passo 4 - Matriz de Correlação
#----------------------------------------------------------

names(Questi)
##  [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado_a"  
##  [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
selecao <- c("Desempenho","Estresse","Créditos","Horas_estudo")
selecao
## [1] "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
cor(Questi[selecao])
##              Desempenho   Estresse Créditos Horas_estudo
## Desempenho   1.00000000 0.08257246       NA    0.2231532
## Estresse     0.08257246 1.00000000       NA    0.3039170
## Créditos             NA         NA        1           NA
## Horas_estudo 0.22315316 0.30391699       NA    1.0000000
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
Questi %>% select (selecao) %>% cor()
## Note: Using an external vector in selections is ambiguous.
## i Use `all_of(selecao)` instead of `selecao` to silence this message.
## i See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.
## This message is displayed once per session.
##              Desempenho   Estresse Créditos Horas_estudo
## Desempenho   1.00000000 0.08257246       NA    0.2231532
## Estresse     0.08257246 1.00000000       NA    0.3039170
## Créditos             NA         NA        1           NA
## Horas_estudo 0.22315316 0.30391699       NA    1.0000000

Passo 5 - Visualização de Dados

#----------------------------------------------------------
# Passo 5 - Visualização de Dados
#----------------------------------------------------------

library(corrplot)
## corrplot 0.92 loaded
Questi %>% select (selecao) %>% cor() %>% corrplot()

Questi %>% select (selecao) %>% cor() %>% corrplot(method = "pie")

Questi %>% select (selecao) %>% cor() %>% corrplot(method = "number")

Questi %>% select (selecao) %>% cor() %>% corrplot.mixed()

Conclusão

  1. As horas de estudo dos alunos inflenciam de forma positiva a variável desempenho e aumenta o estresse do corpo discente;
  2. Desempenho tem uma correlação moderada com horas de estudo de apenas = 0.22;
  3. Desempenho tem uma correlação moderada com estresse de apenas = 0.08;
  4. Não há correlação entre Créditos e horas de estudo.