Introdução

A proposta da atividade é fazer um diagrama de dispersão e uma matriz de correlação de duas variáveis quantitavas da Base de dados Questionário Estresse. Primeiramente, sempre começo carregando as bibliotecas e em seguida a base de dados.

# Passo 0 - carregar bibliotecas
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
library(reactable)
library(RColorBrewer)
library(corrplot)
## corrplot 0.90 loaded
library(rio)

# Passo 1 - Carregar base de dados
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/luuan/Desktop/UNIRIO/estatistica/Base_de_dados-master/Questionario_Estresse.xls")
head(Questionario_Estresse)
## # A tibble: 6 x 10
##   Aluno Turma Mora_pais    RJ Namorado_a Trabalha Desempenho Estresse Créditos
##   <dbl> <dbl>     <dbl> <dbl>      <dbl>    <dbl>      <dbl>    <dbl>    <dbl>
## 1     1     1         2     2          2        2       8.89       23       27
## 2     2     1         1     1          2        2       8.8        24       28
## 3     3     1         2     2          2        2       8          25       25
## 4     4     1         2     2          1        1       8.8        38       21
## 5     5     1         2     2          2        1       8.9        41       18
## 6     6     1         2     2          1        1       8.1        25       29
## # ... with 1 more variable: Horas_estudo <dbl>

Diagrama de Dispersão

As duas variáveis que escolhi para relacionar foram estresse e horas de estudo, fiquei curiosa pois como estudante acho que horas de estudos influencia no meu estresse e vice e versa, e gostaria de ver o resultado do questionário.

# Diagrama de dispersão 
plot(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo,pch=19, col="blue", main="Gráfico 1",
     ylab="Horas de estudo", xlab="Estresse")
abline(lsfit(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo),col="darkred")

Matriz de correlção

# Matriz de correlação
cor(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo)
## [1] 0.303917
MATRIZ <- Questionario_Estresse %>% select(Estresse,Horas_estudo) %>% cor()
MATRIZ
##              Estresse Horas_estudo
## Estresse     1.000000     0.303917
## Horas_estudo 0.303917     1.000000
corrplot(MATRIZ)

corrplot(MATRIZ, method = "number")

corrplot.mixed(MATRIZ)

Conclusão

Ao analisar o diagrama e a matriz que permite melhor visualização, é possivel afirmar que a correlação entre horas de estudo com estresse é de 30% ou 0.30 e o circulo azul claro representa que é uma correlação fraca positiva, tendo em vista que está mais proxima de zero do que um.