1- Importar dados 2- Tranformar dados qualitativos que estão representados numéricamente 3- Diagra de Dispersão: relação estresse e desempenho e estresse e horas de estudo 4- Gráfico 5- Correlação entre estas variáveis 6- Matriz de correlação.
# Passo 1 - Importação de dados
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/isabe/Desktop/Base_de_dados-master/Questionario_Estresse.xls",
sheet = "Dados")
View(Questionario_Estresse)
# Passo 2 - Transformar os dados
Questionario_Estresse$Turma<- ifelse(Questionario_Estresse$Turma==1,"2007_2",
ifelse(Questionario_Estresse$Turma==2,"2008_1","2008_2"))
Questionario_Estresse$Mora_pais<- ifelse(Questionario_Estresse$Mora_pais==1,"sim","não")
Questionario_Estresse$RJ<- ifelse(Questionario_Estresse$RJ==1,"natural do RJ","natural de outras cidades")
Questionario_Estresse$Namorado_a<- ifelse(Questionario_Estresse$Namorado_a==1,"sim","não")
Questionario_Estresse$Trabalha<- ifelse(Questionario_Estresse$Trabalha==1,"sim","não")
# Passo 3 - Visualizar os dados
## Diagrama de dispersão
## Para duas variáveis quantitativas
# Desempenho dos alunos e nível de estresse
# Correlação linear positiva fraca
#Gráfico
plot(Questionario_Estresse$Desempenho, Questionario_Estresse$Estresse, pch=16, col="blue",
main = "Gráfico- Diagrama de dispersão entre Desempenho e Estresse",
ylab = "Nível de Estresse", xlab = "Desempenho" )
# linha
abline(lsfit(Questionario_Estresse$Desempenho,Questionario_Estresse$Estresse),col="darkred")
#---------------------------------------------------------------------------------------------
# Estresse e Horas de Estudo
# Correlação linear Positiva fraca
plot(Questionario_Estresse$Horas_estudo, Questionario_Estresse$Estresse, pch=16, col="darkred",
main = "Gráfico 2 - Diagrama de dispersão entre Horas de estudo e Estresse",
ylab = "Nível de Estresse", xlab = "Horas de estudo" )
abline(lsfit(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Estresse),col="darkred")
par(bg="lightyellow")
par(cex=1.0)
# Passo 4 - Correlação
cor(Questionario_Estresse$Desempenho, Questionario_Estresse$Estresse)
## [1] 0.08257246
cor(Questionario_Estresse$Horas_estudo, Questionario_Estresse$Estresse)
## [1] 0.303917
# Situação 1 Correlação baixa ou nenhuma entre desempenho e estresse - 0.08257
# Situação 2 Correlação fraca entre horas de estudo e estresse - 0.303917
# Passo 5 - Matriz de Correlação
names(Questionario_Estresse)
## [1] "Aluno" "Turma" "Mora_pais" "RJ" "Namorado_a"
## [6] "Trabalha" "Desempenho" "Estresse" "Créditos" "Horas_estudo"
selecao <- c("Desempenho","Estresse","Horas_estudo")
cor_quest_estresse<- cor (Questionario_Estresse[,selecao])
cor_quest_estresse
## Desempenho Estresse Horas_estudo
## Desempenho 1.00000000 0.08257246 0.2231532
## Estresse 0.08257246 1.00000000 0.3039170
## Horas_estudo 0.22315316 0.30391699 1.0000000
library(corrplot)
## corrplot 0.92 loaded
par(cex=0.7)
corrplot(cor_quest_estresse, method="number")
Foi realizado o diagrama de dispersão entre a variável estresse e desempenho, estresse e horas de estudo. Na primeira podemos ver no gráfico que a correlação entre essas variáveis é fraca, a reta é positiva e fraca, assim, interpretamos que a relação entre o estresse dos alunos e o desempenho deles tem dependência mínima ou até nenhuma. Quer dizer que o estresse não aumenta e nem diminuí com o desemepnho, mas como o gráfico apresenta uma leve inclinação positiva, há uma alteração mínima provocada entre as variáveis. Enquanto ao gráfico de estresse e horas de estudo, a inclinação da linha é até maior, também mostrando um resultado positivo, mesmo assim fraca, o que indica que a correlação entre essas duas variáveis é fraca.
Na matriz de Correlação temos um resultado mais preciso e númerico, nos permitindo melhor tirar a dúvida se os dados representam uma correlação positiva fraca ou talvez nenhuma correlação. Partindo do ponto que quanto mais próximo do valor de 0, significa correlação nula, valores negativos são então uma correlação negativa, quando uma variável diminui ao mesmo tempo que a outra aumenta e valores positivos representando correlação positiva, as duas variáveis aumentam. A matriz nos fornece o valor 0.08 na correlação de desempenho e estresse, positiva e bem próxima do zero, indicando uma relação fraca entre elas, já na correlação entre estresse e horas estudadas o valor é 0.30, menos perto do 0, mas ainda sim uma correlação positiva fraca.