Nessa atividade vamos fazer o diagrama de dispersão das variáveis quantitativas da base de dados “Questionário_Estresse.xls” e vamos analisar a matriz de correlação dessa base. Os primeiros passos são: carregar as bibliotecas (library), a base de dados e verificar se está tudo bem com o comando “head”
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.1.1
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(corrplot)
## corrplot 0.90 loaded
library(rio)
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/jheni/Base_de_dados-master/Questionario_Estresse.xls")
head(Questionario_Estresse)
## # A tibble: 6 x 10
## Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 1 2 2 2 2 8.89 23 27
## 2 2 1 1 1 2 2 8.8 24 28
## 3 3 1 2 2 2 2 8 25 25
## 4 4 1 2 2 1 1 8.8 38 21
## 5 5 1 2 2 2 1 8.9 41 18
## 6 6 1 2 2 1 1 8.1 25 29
## # ... with 1 more variable: Horas_estudo <dbl>
Aqui podemos identificar que existe uma correlação positiva média, podendo ser facilmente confundida pela não correlação, pois há grande dispersão entre as variáveis no gráfico. Sendo assim, podemos interpretar que o gráfico demonstra que o estresse e está diretamente relacionado com o uso do tempo, apresentando diferença estatística entre aqueles que estudam por mais horas, os que tendem a ser mais etressados, e aqueles que estudam menos horas, os que tendem a ser menos estressados.
par(bg="#d4fdff")
plot(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo, pch=19, col="#956dbf", main= "Gráfico 1", ylab="Horas de estudo", xlab="Estresse")
abline (lsfit(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo),col= "#26595c")
# Matriz de Correção e Coeficiente de Correlação A linha quase horizontal do Gráfico 1 segere que o coeficiente de correlação está entre 0 e 1, sendo= [0.303917], mostrando que é uma relação positiva entre as duas variáveis. Na Matriz de Correlação, representada pelo Gráfico 2, é possivel observar as relações positivas (dadas pela cor azul), as relações negativas (dadas pela cor vermelha) e as relações nulas ou quase nulas (dadas pela ausência de cor). Nesse sentido, pode-se confimar que muitas horas de estudo contribuem para o estresse. Contudo, as horas de estudo são importantes também para um desempenho positivo, como podemos ver no gráfico.
cor(Questionario_Estresse$Estresse, Questionario_Estresse$Horas_estudo)
## [1] 0.303917
names(Questionario_Estresse)
## [1] "Aluno" "Turma" "Mora_pais" "RJ" "Namorado_a"
## [6] "Trabalha" "Desempenho" "Estresse" "Créditos" "Horas_estudo"
MC <-Questionario_Estresse %>% select(Estresse, Desempenho, Horas_estudo, Aluno, RJ, Turma, Mora_pais, Trabalha, Namorado_a)%>% cor()
MC
## Estresse Desempenho Horas_estudo Aluno RJ
## Estresse 1.00000000 0.082572463 0.30391699 -0.196990678 0.03565118
## Desempenho 0.08257246 1.000000000 0.22315316 -0.005300716 0.12828113
## Horas_estudo 0.30391699 0.223153161 1.00000000 -0.297518085 -0.01842304
## Aluno -0.19699068 -0.005300716 -0.29751808 1.000000000 0.08545631
## RJ 0.03565118 0.128281134 -0.01842304 0.085456309 1.00000000
## Turma -0.12416218 -0.078198588 -0.28706787 0.940936929 0.03902466
## Mora_pais -0.03623445 0.113230630 -0.10803569 -0.033871336 0.65244353
## Trabalha 0.01897219 0.054199018 0.14733504 0.060926264 0.06811743
## Namorado_a -0.07694459 -0.204248795 -0.14795063 -0.103646657 -0.10286554
## Turma Mora_pais Trabalha Namorado_a
## Estresse -0.12416218 -0.03623445 0.018972190 -0.076944595
## Desempenho -0.07819859 0.11323063 0.054199018 -0.204248795
## Horas_estudo -0.28706787 -0.10803569 0.147335040 -0.147950626
## Aluno 0.94093693 -0.03387134 0.060926264 -0.103646657
## RJ 0.03902466 0.65244353 0.068117433 -0.102865540
## Turma 1.00000000 -0.09781599 0.070970251 -0.091816933
## Mora_pais -0.09781599 1.00000000 0.014199499 -0.116889304
## Trabalha 0.07097025 0.01419950 1.000000000 0.008222913
## Namorado_a -0.09181693 -0.11688930 0.008222913 1.000000000
corrplot(MC)
corrplot(MC, method= "square", main= "Gráfico 2")