Introdução

Foi feita uma pesquisa sobre grau de estresse aplicada em duas turmas do curso de Psicologia. 95 alunos responderam a diversas perguntas do questionário para análise de estresse como: mora com os pais, mora no RJ, namora e trabalha. A seguir vamos analisar essa Base de dados: “Questionario_Estresse.xls”.

Carregando banco de dados

1° Vamos carregar a biblioteca (read) e o banco de dados:

library(readxl)
#carregar banco de dados

Quest_Est <- read_excel("C:/Users/steff/OneDrive/Área de Trabalho/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls")

Definição da variável resposta

Estresse e Horas de estudo

Variável resposta: Estresse (Y);

Variável explicativa: Horas de estudo (X).

Diagrama de Dispersão

plot(Quest_Est$Horas_estudo,Quest_Est$Estresse,
     main = "Correlação entre Horas de estudo e Estresse",
     pch=17, col="blue",
     ylab="Estresse",
     xlab = "Horas_estudo")
abline(lsfit(Quest_Est$Horas_estudo,Quest_Est$Estresse),col="red")

cor(Quest_Est$Horas_estudo,Quest_Est$Estresse)
## [1] 0.303917

Há uma associação entre horas de estudo e estresse, quanto maior as horas de estudo, maior tende a ser o estresse.Horas de estudo por Estresse apresenta uma correlção positiva fraca de (cor = 0,30).
O resultado mostra que há uma concentração de alunos com horas de estudo entre as 30 horas onde apresentam os maiores níveis de estresse.

Matriz de correlação

selecao <- c("Desempenho","Estresse","Horas_estudo","Trabalha","Mora_pais","RJ","Namorado_a")

selecao
## [1] "Desempenho"   "Estresse"     "Horas_estudo" "Trabalha"     "Mora_pais"   
## [6] "RJ"           "Namorado_a"
library(dplyr)

Quest_Est %>% select(selecao) %>% cor()
##               Desempenho    Estresse Horas_estudo    Trabalha   Mora_pais
## Desempenho    1.00000000  0.08257246   0.22315316 0.054199018  0.11323063
## Estresse      0.08257246  1.00000000   0.30391699 0.018972190 -0.03623445
## Horas_estudo  0.22315316  0.30391699   1.00000000 0.147335040 -0.10803569
## Trabalha      0.05419902  0.01897219   0.14733504 1.000000000  0.01419950
## Mora_pais     0.11323063 -0.03623445  -0.10803569 0.014199499  1.00000000
## RJ            0.12828113  0.03565118  -0.01842304 0.068117433  0.65244353
## Namorado_a   -0.20424880 -0.07694459  -0.14795063 0.008222913 -0.11688930
##                       RJ   Namorado_a
## Desempenho    0.12828113 -0.204248795
## Estresse      0.03565118 -0.076944595
## Horas_estudo -0.01842304 -0.147950626
## Trabalha      0.06811743  0.008222913
## Mora_pais     0.65244353 -0.116889304
## RJ            1.00000000 -0.102865540
## Namorado_a   -0.10286554  1.000000000

Na matriz de correlação entre “Desempenho”, “Estresse”, “Horas_estudo”, “Trabalha”, “Mora_pais”, “RJ” e “Namorado_a” a sua diagonal é igual a 1 mostrando a correlação linear perfeita. A correlação do Desempenho com o Estresse é (0,08); das Horas de Estudo (0,30) com o Estresse como visto anteriormente; do Trabalho (0,02) com o Estresse; Mora com os pais (-0,04) e Estresse, sendo uma correlação negativa e fraca; Rio de Janeiro (0,03) com Estresse e Namorado(a) e Estresse é (-0,07).

Visualização da Matriz de correlação

library(corrplot)
library(dplyr)
Quest_Est %>% select(selecao) %>% cor() %>% corrplot(addCoef.col = TRUE,numer.cex=0.7)

Na visualização da matriz de correlação acima todos os círculos representados por azul são positivos e todos os círculos vermelhos são negativos, e as correlações brancas estão mais próximas de zero. Assim, quanto maior a correlação maior a força da cor, logo, podemos ver que a matriz acima representa grande parte de suas correlações muito próximas do zero, ou seja não apresentando correlação com a variável resposta. Com exceção da correlação do RJ com Mora_pais (cor=0,65) sendo positiva em seguida das horas de estudo e estresse (cor=0,30).