Introdução

Nessa atividade vamos fazer o diagrama de dispersão das variáveis quantitativas da base de dados “Questionário_Estresse.xls” e vamos analisar a matriz de correlação dessa base. Os primeiros passos são: carregar as bibliotecas (library), a base de dados e verificar se está tudo bem com o comando “head”

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.1.1
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(corrplot)
## corrplot 0.90 loaded
library(rio)
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/jheni/Base_de_dados-master/Questionario_Estresse.xls")
head(Questionario_Estresse)
## # A tibble: 6 x 10
##   Aluno Turma Mora_pais    RJ Namorado_a Trabalha Desempenho Estresse Créditos
##   <dbl> <dbl>     <dbl> <dbl>      <dbl>    <dbl>      <dbl>    <dbl>    <dbl>
## 1     1     1         2     2          2        2       8.89       23       27
## 2     2     1         1     1          2        2       8.8        24       28
## 3     3     1         2     2          2        2       8          25       25
## 4     4     1         2     2          1        1       8.8        38       21
## 5     5     1         2     2          2        1       8.9        41       18
## 6     6     1         2     2          1        1       8.1        25       29
## # ... with 1 more variable: Horas_estudo <dbl>

Diagrama de dispersão

Aqui podemos identificar que existe uma correlação positiva média, podendo ser facilmente confundida pela não correlação, pois há grande dispersão entre as variáveis no gráfico. Sendo assim, podemos interpretar que o gráfico demonstra que o estresse e está diretamente relacionado com o uso do tempo, apresentando diferença estatística entre aqueles que estudam por mais horas, os que tendem a ser mais etressados, e aqueles que estudam menos horas, os que tendem a ser menos estressados.

par(bg="#d4fdff")
plot(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo, pch=19, col="#956dbf", main= "Gráfico 1", ylab="Horas de estudo", xlab="Estresse")
abline (lsfit(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo),col= "#26595c")

# Matriz de Correção e Coeficiente de Correlação A linha quase horizontal do Gráfico 1 segere que o coeficiente de correlação está entre 0 e 1, sendo= [0.303917], mostrando que é uma relação positiva entre as duas variáveis. Na Matriz de Correlação, representada pelo Gráfico 2, é possivel observar as relações positivas (dadas pela cor azul), as relações negativas (dadas pela cor vermelha) e as relações nulas ou quase nulas (dadas pela ausência de cor). Nesse sentido, pode-se confimar que muitas horas de estudo contribuem para o estresse. Contudo, as horas de estudo são importantes também para um desempenho positivo, como podemos ver no gráfico.

cor(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo)
## [1] 0.303917
names(Questionario_Estresse)
##  [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado_a"  
##  [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
MC <-Questionario_Estresse %>% select(Estresse, Desempenho, Horas_estudo, Aluno, RJ, Turma, Mora_pais, Trabalha, Namorado_a)%>% cor()
MC
##                 Estresse   Desempenho Horas_estudo        Aluno          RJ
## Estresse      1.00000000  0.082572463   0.30391699 -0.196990678  0.03565118
## Desempenho    0.08257246  1.000000000   0.22315316 -0.005300716  0.12828113
## Horas_estudo  0.30391699  0.223153161   1.00000000 -0.297518085 -0.01842304
## Aluno        -0.19699068 -0.005300716  -0.29751808  1.000000000  0.08545631
## RJ            0.03565118  0.128281134  -0.01842304  0.085456309  1.00000000
## Turma        -0.12416218 -0.078198588  -0.28706787  0.940936929  0.03902466
## Mora_pais    -0.03623445  0.113230630  -0.10803569 -0.033871336  0.65244353
## Trabalha      0.01897219  0.054199018   0.14733504  0.060926264  0.06811743
## Namorado_a   -0.07694459 -0.204248795  -0.14795063 -0.103646657 -0.10286554
##                    Turma   Mora_pais    Trabalha   Namorado_a
## Estresse     -0.12416218 -0.03623445 0.018972190 -0.076944595
## Desempenho   -0.07819859  0.11323063 0.054199018 -0.204248795
## Horas_estudo -0.28706787 -0.10803569 0.147335040 -0.147950626
## Aluno         0.94093693 -0.03387134 0.060926264 -0.103646657
## RJ            0.03902466  0.65244353 0.068117433 -0.102865540
## Turma         1.00000000 -0.09781599 0.070970251 -0.091816933
## Mora_pais    -0.09781599  1.00000000 0.014199499 -0.116889304
## Trabalha      0.07097025  0.01419950 1.000000000  0.008222913
## Namorado_a   -0.09181693 -0.11688930 0.008222913  1.000000000
corrplot(MC)

corrplot(MC, method= "square", main= "Gráfico 2")