trabalho número 6

Primeiro passo - Carregar base de dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Dell/Desktop/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)

Segundo passo - Diagrama de disperção

par(bg="light pink")
plot(Questionario_Estresse$Desempenho,Questionario_Estresse$Horas_estudo, col="darkgreen", 
     main = "DESEMPENHO X HORAS DE ESTUDO",
     pch=16, xlab="DESEMPENHO", ylab = "HORAS DE ESTUDO")
abline(lsfit(Questionario_Estresse$Desempenho,Questionario_Estresse$Estresse),col="light blue")

Terceiro passo - Correlação

cor(Questionario_Estresse$Desempenho,Questionario_Estresse$Horas_estudo)
## [1] 0.2231532
selecao = c("Desempenho", "Horas_estudo")

cor_questionario = cor(Questionario_Estresse[,selecao])
cor_questionario
##              Desempenho Horas_estudo
## Desempenho    1.0000000    0.2231532
## Horas_estudo  0.2231532    1.0000000
library(corrplot)
## corrplot 0.92 loaded
corrplot(cor_questionario, method = "number", "full") # colorful number

corrplot(cor_questionario, method = "number", "full", col= "pink")

Dentro da base de dados “questionario_estresse.xls” foram análisados os dados de Desempenho e Horas de estudo, através do diagrama de dispersão e a correlação de dados, é possível observar que os dados diretos, os números passam por uma média, poucos são os que possuem altas horas de estudo e alto desempenho, a maioria dos estudantes com alto desempenho possuem horas razoaveis de estudo, na média dos 30/40 não atingindo a marca das 50/60 horas de estudo.

Com a correlação de dados, é possível observar o índice de correlação de 0,22 de 1 que chega a ser um número abaixo da média, fraca correlação.