1. Carregar base de dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/roberta.bastos/Desktop/Base_de_dados-master/Questionario_Estresse.xls")

2. Tratar base de dados

Questionario_Estresse$Trabalha<-ifelse(Questionario_Estresse$Trabalha==1,"Sim","Não")

3. O Boxplot

boxplot(Questionario_Estresse$Desempenho ~ Questionario_Estresse$Trabalha,
        col=c("red","blue"),main="O boxplot 1",
        xlab = "Trabalha",
        ylab = "Desempenho")

boxplot(Questionario_Estresse$Estresse ~ Questionario_Estresse$Trabalha,
        col=c("red","blue"),main="O boxplot 2",
        xlab = "Trabalha",
        ylab = "Estresse")

4. Diagrama de dispersão

plot(Questionario_Estresse$Desempenho,Questionario_Estresse$Horas_estudo,pch=19,col="red",
     xlab = "Desempenho",
     ylab = "Horas de estudo",
     main = "Gráfico 3 - Diagrama de dispersão")
abline(lsfit(Questionario_Estresse$Desempenho,Questionario_Estresse$Horas_estudo),
       col="blue")

cor(Questionario_Estresse$Desempenho,Questionario_Estresse$Horas_estudo)
## [1] 0.2231532
plot(Questionario_Estresse$Estresse,Questionario_Estresse$Horas_estudo,pch=19,col="red",
     xlab = "Estresse",
     ylab = "Horas de estudos",
     main = "Gráfico 4 - Diagrama de dispersão")
abline(lsfit(Questionario_Estresse$Desempenho,Questionario_Estresse$Horas_estudo),
       col="blue")

cor(Questionario_Estresse$Estresse,Questionario_Estresse$Horas_estudo)
## [1] 0.303917

5. Matriz de correlação

names(Questionario_Estresse)
##  [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado(a)" 
##  [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
variaveis_quanti<-c("Desempenho","Estresse","Horas_estudo")
Questionario_Estresse[,variaveis_quanti]
## # A tibble: 95 x 3
##    Desempenho Estresse Horas_estudo
##         <dbl>    <dbl>        <dbl>
##  1       8.89       23           27
##  2       8.8        24           28
##  3       8          25           25
##  4       8.8        38           30
##  5       8.9        41           20
##  6       8.1        25           32
##  7       9.2        41           25
##  8       8.5        20           25
##  9       8.7        26           25
## 10       8.3        36           59
## # ... with 85 more rows
cor(Questionario_Estresse[,variaveis_quanti])
##              Desempenho   Estresse Horas_estudo
## Desempenho   1.00000000 0.08257246    0.2231532
## Estresse     0.08257246 1.00000000    0.3039170
## Horas_estudo 0.22315316 0.30391699    1.0000000
library(corrplot)
## corrplot 0.84 loaded
correlacao_QuestionarioEstresse<-cor(Questionario_Estresse[,variaveis_quanti])
correlacao_QuestionarioEstresse
##              Desempenho   Estresse Horas_estudo
## Desempenho   1.00000000 0.08257246    0.2231532
## Estresse     0.08257246 1.00000000    0.3039170
## Horas_estudo 0.22315316 0.30391699    1.0000000
par(mfrow=c(1,1))
corrplot(correlacao_QuestionarioEstresse,method = "square")

6. Análise dos gráficos

summary(Questionario_Estresse$Desempenho)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   5.820   8.500   8.700   8.594   9.050   9.700

Para esta análise foram consideradas as seguintes variavíes da base de dados:

Qauntitativas: Desempenho, Estresse e Horas de Estudo Qualitativa: Trabalha

Analisando as informações estatísticas da variável Desemepenho, tem-se a média bem próxima da mediana, tendo como 8,59 a média de desempenho.

Na análise do Boxplot 1 - Deesempenho x Trabalha, pode-se observar que há uma leve assimetria entre os gráficos, havendo uma pequena diferença na média de desemoenho destes grupos. Já no bloxplot 2 - Trabalha x Estresse, pode-se observar uma maior variação entre as medias, surpreendendo o resultado de que está é menor para o grupo que trabalha.

Anallisando o gráfico 3 - Dispersão Desempenho x Horas de Estudo, ve-se uma alta concentração de alunos com alto desempenho e que não demandam um alto volume de horas de estudos. Já o grafico 4 - Horas de estudo x Estresse mostra que não há correlação entre estas variáveis.

Quando analisamos estas varíáveis com base na matriz de correlação, vimos que as horas de estudo tem uma correlação forte com o desempenho, assim como com o estresse. Apresentando uma correlação mais fraca entre o desempenho e estresse.