Foi feita uma pesquisa sobre grau de estresse aplicada em duas turmas do curso de Psicologia. 95 alunos responderam a diversas perguntas do questionário para análise de estresse como: mora com os pais, mora no RJ, namora e trabalha. A seguir vamos analisar essa Base de dados: “Questionario_Estresse.xls”.
1° Vamos carregar a biblioteca (read) e o banco de dados:
library(readxl)
#carregar banco de dados
Quest_Est <- read_excel("C:/Users/steff/OneDrive/Área de Trabalho/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls")Estresse e Horas de estudo
Variável resposta: Estresse (Y);
Variável explicativa: Horas de estudo (X).
plot(Quest_Est$Horas_estudo,Quest_Est$Estresse,
main = "Correlação entre Horas de estudo e Estresse",
pch=17, col="blue",
ylab="Estresse",
xlab = "Horas_estudo")
abline(lsfit(Quest_Est$Horas_estudo,Quest_Est$Estresse),col="red")cor(Quest_Est$Horas_estudo,Quest_Est$Estresse)## [1] 0.303917
Há uma associação entre horas de estudo e estresse, quanto maior as
horas de estudo, maior tende a ser o estresse.Horas de estudo por
Estresse apresenta uma correlção positiva fraca de (cor = 0,30).
O resultado mostra que há uma concentração de alunos com horas de estudo
entre as 30 horas onde apresentam os maiores níveis de estresse.
selecao <- c("Desempenho","Estresse","Horas_estudo","Trabalha","Mora_pais","RJ","Namorado_a")
selecao## [1] "Desempenho" "Estresse" "Horas_estudo" "Trabalha" "Mora_pais"
## [6] "RJ" "Namorado_a"
library(dplyr)
Quest_Est %>% select(selecao) %>% cor()## Desempenho Estresse Horas_estudo Trabalha Mora_pais
## Desempenho 1.00000000 0.08257246 0.22315316 0.054199018 0.11323063
## Estresse 0.08257246 1.00000000 0.30391699 0.018972190 -0.03623445
## Horas_estudo 0.22315316 0.30391699 1.00000000 0.147335040 -0.10803569
## Trabalha 0.05419902 0.01897219 0.14733504 1.000000000 0.01419950
## Mora_pais 0.11323063 -0.03623445 -0.10803569 0.014199499 1.00000000
## RJ 0.12828113 0.03565118 -0.01842304 0.068117433 0.65244353
## Namorado_a -0.20424880 -0.07694459 -0.14795063 0.008222913 -0.11688930
## RJ Namorado_a
## Desempenho 0.12828113 -0.204248795
## Estresse 0.03565118 -0.076944595
## Horas_estudo -0.01842304 -0.147950626
## Trabalha 0.06811743 0.008222913
## Mora_pais 0.65244353 -0.116889304
## RJ 1.00000000 -0.102865540
## Namorado_a -0.10286554 1.000000000
Na matriz de correlação entre “Desempenho”, “Estresse”, “Horas_estudo”, “Trabalha”, “Mora_pais”, “RJ” e “Namorado_a” a sua diagonal é igual a 1 mostrando a correlação linear perfeita. A correlação do Desempenho com o Estresse é (0,08); das Horas de Estudo (0,30) com o Estresse como visto anteriormente; do Trabalho (0,02) com o Estresse; Mora com os pais (-0,04) e Estresse, sendo uma correlação negativa e fraca; Rio de Janeiro (0,03) com Estresse e Namorado(a) e Estresse é (-0,07).
library(corrplot)
library(dplyr)
Quest_Est %>% select(selecao) %>% cor() %>% corrplot(addCoef.col = TRUE,numer.cex=0.7)Na visualização da matriz de correlação acima todos os círculos representados por azul são positivos e todos os círculos vermelhos são negativos, e as correlações brancas estão mais próximas de zero. Assim, quanto maior a correlação maior a força da cor, logo, podemos ver que a matriz acima representa grande parte de suas correlações muito próximas do zero, ou seja não apresentando correlação com a variável resposta. Com exceção da correlação do RJ com Mora_pais (cor=0,65) sendo positiva em seguida das horas de estudo e estresse (cor=0,30).