Vamos carregar o banco de dados. Depois disso, vamos fazer uma limpeza deste para após começar a fazer as estatísticas.
library(readxl)
Quest <- read_excel("C:/Users/Marcus Tulio/Desktop/MESTRADO2022_1/DISCIPLINAS/Estatistica/Mestrado_engenharia/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls",
sheet = "Dados", col_types = c("numeric",
"numeric", "numeric", "numeric",
"numeric", "numeric", "numeric",
"numeric", "numeric", "numeric"))
View(Quest)
summary(Quest$Desempenho)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.8 8.5 8.7 8.6 9.1 9.7
summary(Quest$Trabalha)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 1.00 2.00 1.62 2.00 2.00
Quest$Trabalha <- ifelse(Quest$Trabalha==0,"Sim","Não")
summary(Quest)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1 Min. :1.00 Min. :1.00 Min. :1.00 Min. :1.00
## 1st Qu.:24 1st Qu.:1.00 1st Qu.:1.00 1st Qu.:1.00 1st Qu.:1.00
## Median :48 Median :2.00 Median :2.00 Median :2.00 Median :2.00
## Mean :48 Mean :2.07 Mean :1.54 Mean :1.65 Mean :1.51
## 3rd Qu.:72 3rd Qu.:3.00 3rd Qu.:2.00 3rd Qu.:2.00 3rd Qu.:2.00
## Max. :95 Max. :3.00 Max. :2.00 Max. :2.00 Max. :2.00
##
## Trabalha Desempenho Estresse Créditos Horas_estudo
## Length:95 Min. :5.8 Min. :12 Min. :15 Min. :19
## Class :character 1st Qu.:8.5 1st Qu.:22 1st Qu.:23 1st Qu.:25
## Mode :character Median :8.7 Median :27 Median :24 Median :30
## Mean :8.6 Mean :28 Mean :25 Mean :31
## 3rd Qu.:9.1 3rd Qu.:33 3rd Qu.:27 3rd Qu.:35
## Max. :9.7 Max. :44 Max. :49 Max. :60
## NA's :1
Quest$Mora_pais <- ifelse(Quest$Mora_pais==0,"Sim","Não")
summary(Quest)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1 Min. :1.00 Length:95 Min. :1.00 Min. :1.00
## 1st Qu.:24 1st Qu.:1.00 Class :character 1st Qu.:1.00 1st Qu.:1.00
## Median :48 Median :2.00 Mode :character Median :2.00 Median :2.00
## Mean :48 Mean :2.07 Mean :1.65 Mean :1.51
## 3rd Qu.:72 3rd Qu.:3.00 3rd Qu.:2.00 3rd Qu.:2.00
## Max. :95 Max. :3.00 Max. :2.00 Max. :2.00
##
## Trabalha Desempenho Estresse Créditos Horas_estudo
## Length:95 Min. :5.8 Min. :12 Min. :15 Min. :19
## Class :character 1st Qu.:8.5 1st Qu.:22 1st Qu.:23 1st Qu.:25
## Mode :character Median :8.7 Median :27 Median :24 Median :30
## Mean :8.6 Mean :28 Mean :25 Mean :31
## 3rd Qu.:9.1 3rd Qu.:33 3rd Qu.:27 3rd Qu.:35
## Max. :9.7 Max. :44 Max. :49 Max. :60
## NA's :1
boxplot(Quest$Desempenho,
col = "skyblue",main="Boxplot do Desempenho dos Alunos",
horizontal = TRUE)
Há a apresença de alguns pontos de outliers na variável “desempenho”, com valores que flutuam” entre 5,5 e 7,5.
Quando há a presença de outliers, a mediana não muda mas a média muda. Então na presença de outliers recomenda-se usar a mediana.
plot(Quest$Desempenho)
sd(Quest$Desempenho)
## [1] 0.78
plot(Quest$Desempenho)
mean(Quest$Desempenho)
## [1] 8.6
plot(Quest$Desempenho)
median(Quest$Desempenho)
## [1] 8.7
boxplot(Quest$Desempenho ~ Quest$Trabalha,
main="Gráfico 1 - boxplot do Desempenho dos Alunos",
col=c("orange","yellow"),
xlab = "Trabalha",
ylab = "Desempenho")
boxplot(Desempenho ~ Mora_pais, data = Quest,
main="Gráfico 2 - boxplot do Desempenho dos Alunos",
col=c("yellow","pink"),
xlab = "Desempenho",
ylab = "Mora com Pais",
horizontal = TRUE)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
Quest %>% select(Desempenho,Trabalha) %>%
group_by(Trabalha) %>%
summarise(Media=round(mean(Desempenho),1),
Mediana=median(Desempenho),
Desvio_Padrão = round(sd(Desempenho),1),
Tamanho=n()) %>%
flextable() %>%
add_header_lines("Tabela 1 - Estatísticas do Desempenho") %>%
theme_tron()
Tabela 1 - Estatísticas do Desempenho | ||||
Trabalha | Media | Mediana | Desvio_Padrão | Tamanho |
Não | 8.6 | 8.7 | 0.8 | 95 |
library(dplyr)
library(flextable)
Quest %>% select(Desempenho,Mora_pais) %>%
group_by(Mora_pais) %>%
summarise(Media=round(mean(Desempenho),1),
Mediana=median(Desempenho),
Desvio_Padrão = round(sd(Desempenho),1),
Tamanho=n()) %>%
flextable() %>%
add_header_lines("Tabela 2 - Estatísticas do Desempenho") %>%
theme_vader()
Tabela 2 - Estatísticas do Desempenho | ||||
Mora_pais | Media | Mediana | Desvio_Padrão | Tamanho |
Não | 8.6 | 8.7 | 0.8 | 95 |