Introdução

Vamos carregar o banco de dados. Depois disso, vamos fazer uma limpeza deste para após começar a fazer as estatísticas.

library(readxl)
Quest <- read_excel("C:/Users/Marcus Tulio/Desktop/MESTRADO2022_1/DISCIPLINAS/Estatistica/Mestrado_engenharia/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls", 
                    sheet = "Dados", col_types = c("numeric", 
                                                   "numeric", "numeric", "numeric", 
                                                   "numeric", "numeric", "numeric", 
                                                   "numeric", "numeric", "numeric"))
View(Quest)

summary(Quest$Desempenho)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     5.8     8.5     8.7     8.6     9.1     9.7
summary(Quest$Trabalha)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00    1.00    2.00    1.62    2.00    2.00

Banco de Dados Questionário Estresse dos Alunos

Variáveis para o cálculo da média e do desvio-padrão

Variável Quantitativa: Desempenho

Variável Qualitativa: Trabalha além de estudar e Mora com os pais

Limpeza das Variáveis

Quest$Trabalha <- ifelse(Quest$Trabalha==0,"Sim","Não")

summary(Quest)
##      Aluno        Turma        Mora_pais          RJ         Namorado_a  
##  Min.   : 1   Min.   :1.00   Min.   :1.00   Min.   :1.00   Min.   :1.00  
##  1st Qu.:24   1st Qu.:1.00   1st Qu.:1.00   1st Qu.:1.00   1st Qu.:1.00  
##  Median :48   Median :2.00   Median :2.00   Median :2.00   Median :2.00  
##  Mean   :48   Mean   :2.07   Mean   :1.54   Mean   :1.65   Mean   :1.51  
##  3rd Qu.:72   3rd Qu.:3.00   3rd Qu.:2.00   3rd Qu.:2.00   3rd Qu.:2.00  
##  Max.   :95   Max.   :3.00   Max.   :2.00   Max.   :2.00   Max.   :2.00  
##                                                                          
##    Trabalha           Desempenho     Estresse     Créditos   Horas_estudo
##  Length:95          Min.   :5.8   Min.   :12   Min.   :15   Min.   :19   
##  Class :character   1st Qu.:8.5   1st Qu.:22   1st Qu.:23   1st Qu.:25   
##  Mode  :character   Median :8.7   Median :27   Median :24   Median :30   
##                     Mean   :8.6   Mean   :28   Mean   :25   Mean   :31   
##                     3rd Qu.:9.1   3rd Qu.:33   3rd Qu.:27   3rd Qu.:35   
##                     Max.   :9.7   Max.   :44   Max.   :49   Max.   :60   
##                                                NA's   :1
Quest$Mora_pais <- ifelse(Quest$Mora_pais==0,"Sim","Não")

summary(Quest)
##      Aluno        Turma       Mora_pais               RJ         Namorado_a  
##  Min.   : 1   Min.   :1.00   Length:95          Min.   :1.00   Min.   :1.00  
##  1st Qu.:24   1st Qu.:1.00   Class :character   1st Qu.:1.00   1st Qu.:1.00  
##  Median :48   Median :2.00   Mode  :character   Median :2.00   Median :2.00  
##  Mean   :48   Mean   :2.07                      Mean   :1.65   Mean   :1.51  
##  3rd Qu.:72   3rd Qu.:3.00                      3rd Qu.:2.00   3rd Qu.:2.00  
##  Max.   :95   Max.   :3.00                      Max.   :2.00   Max.   :2.00  
##                                                                              
##    Trabalha           Desempenho     Estresse     Créditos   Horas_estudo
##  Length:95          Min.   :5.8   Min.   :12   Min.   :15   Min.   :19   
##  Class :character   1st Qu.:8.5   1st Qu.:22   1st Qu.:23   1st Qu.:25   
##  Mode  :character   Median :8.7   Median :27   Median :24   Median :30   
##                     Mean   :8.6   Mean   :28   Mean   :25   Mean   :31   
##                     3rd Qu.:9.1   3rd Qu.:33   3rd Qu.:27   3rd Qu.:35   
##                     Max.   :9.7   Max.   :44   Max.   :49   Max.   :60   
##                                                NA's   :1
boxplot(Quest$Desempenho,
        col = "skyblue",main="Boxplot do Desempenho dos Alunos",
        horizontal = TRUE)

Outlier:

Há a apresença de alguns pontos de outliers na variável “desempenho”, com valores que flutuam” entre 5,5 e 7,5.

Quando há a presença de outliers, a mediana não muda mas a média muda. Então na presença de outliers recomenda-se usar a mediana.

Desvio-padrão do desempenho

plot(Quest$Desempenho)

sd(Quest$Desempenho)
## [1] 0.78

Média do desempenho

plot(Quest$Desempenho)

mean(Quest$Desempenho)
## [1] 8.6

Mediana do desempenho

plot(Quest$Desempenho)

median(Quest$Desempenho)
## [1] 8.7

Variável Qualitativa X Variável Quantitativa

Quantitativa = Desempenho

Qualiitativa = Trabalha

boxplot(Quest$Desempenho ~ Quest$Trabalha,
        main="Gráfico 1 - boxplot do Desempenho dos Alunos",
        col=c("orange","yellow"),
        xlab = "Trabalha",
        ylab = "Desempenho")

Quantitativa = Desempenho

Qualiitativa = Mora com pais

boxplot(Desempenho ~ Mora_pais, data = Quest,
        main="Gráfico 2 - boxplot do Desempenho dos Alunos",
        col=c("yellow","pink"),
        xlab = "Desempenho",
        ylab = "Mora com Pais",
        horizontal = TRUE)

Estatística para relacionamento de variáveis qualitativas e quantitativas

Quantitativa = Desempenho

Qualitativa = Trabalha

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)

Quest %>% select(Desempenho,Trabalha) %>%
  group_by(Trabalha) %>%
  summarise(Media=round(mean(Desempenho),1),
            Mediana=median(Desempenho),
            Desvio_Padrão = round(sd(Desempenho),1),
            Tamanho=n()) %>% 
  flextable() %>%
  add_header_lines("Tabela 1 - Estatísticas do Desempenho") %>%
  theme_tron()

Quantitativa = Desempenho

Qualiitativa = Mora com pais

library(dplyr)
library(flextable)

Quest %>% select(Desempenho,Mora_pais) %>%
  group_by(Mora_pais) %>%
  summarise(Media=round(mean(Desempenho),1),
            Mediana=median(Desempenho),
            Desvio_Padrão = round(sd(Desempenho),1),
            Tamanho=n()) %>% 
  flextable() %>%
  add_header_lines("Tabela 2 - Estatísticas do Desempenho") %>%
  theme_vader()

Conclusão

Observando-se os gráficos e os resultados demonstrados acima pode-se concluir que a avaliação entre as variáveis quantitativas (desempenho dos alunos) com as variáveis qualitativas (trabalham além de estudar) flutuam entre 7,8 e 9,8 e há sete outliers.

No que diz respeito ao cruzamento entre as variáveis desempenho X Mora com Pais o mesmo desempenho acontece entre os alunos.

Em relação ao gráfico da variável desempenho dos alunos que moram com pais o mesmo tem uma aparência levemente simétrica. Fato que pode ser comprovado pela proximidade dos valores da média (8,60) e da mediana (8,70).