# Carregar Base de Dados
library(readxl)
Quest_Estresse <- read_excel("C:/Users/55219/Desktop/Base_de_dados-master/Questionario_Estresse.xls",
col_types = c("text", "text", "text",
"text", "text", "text", "numeric",
"numeric", "numeric", "numeric"))
head(Quest_Estresse)
## # A tibble: 6 × 10
## Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos
## <chr> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl>
## 1 1 1 2 2 2 2 8.89 23 27
## 2 2 1 1 1 2 2 8.8 24 28
## 3 3 1 2 2 2 2 8 25 25
## 4 4 1 2 2 1 1 8.8 38 21
## 5 5 1 2 2 2 1 8.9 41 18
## 6 6 1 2 2 1 1 8.1 25 29
## # … with 1 more variable: Horas_estudo <dbl>
# Mostrar a Base de Dados
library(DT)
DT::datatable(Quest_Estresse)
# Tranformação de Variáveis
Quest_Estresse$Mora_pais <- ifelse(Quest_Estresse$Mora_pais==1,"Sim","Nao")
Quest_Estresse$RJ <- ifelse(Quest_Estresse$RJ==1,"natural do RJ","natural de outra cidade")
Quest_Estresse$Namorado_a <- ifelse(Quest_Estresse$Namorado_a==1,"Sim","Nao")
Quest_Estresse$Trabalha <- ifelse(Quest_Estresse$Trabalha==1,"Sim","Nao")
# Carregar biblioteca
library(flextable)
library(dplyr)
Quest_Estresse %>% select(Horas_estudo,Mora_pais) %>%
group_by(Mora_pais) %>%
summarise(
Mímimo=min(Horas_estudo),
Mediana=median(Horas_estudo),
Média=round(mean(Horas_estudo),2),
Desvio_Padrão=round(sd(Horas_estudo),2),
Máximo=max(Horas_estudo)) %>%
flextable() %>% theme_zebra()
Mora_pais | Mímimo | Mediana | Média | Desvio_Padrão | Máximo |
Nao | 19 | 30 | 30.00 | 5.81 | 44 |
Sim | 20 | 30 | 31.57 | 8.67 | 60 |
# Representação Gráfica
boxplot(Quest_Estresse$Horas_estudo ~ Quest_Estresse$Mora_pais,
main="Gráfico 1",
xlab= "Mora com os pais",
ylab= "Horas de estudo")
Quest_Estresse %>% select(Estresse,Namorado_a) %>%
group_by(Namorado_a) %>%
summarise(
Mímimo=min(Estresse),
Mediana=median(Estresse),
Média=round(mean(Estresse),2),
Desvio_Padrão=round(sd(Estresse),2),
Máximo=max(Estresse)) %>%
flextable() %>% theme_zebra()
Namorado_a | Mímimo | Mediana | Média | Desvio_Padrão | Máximo |
Nao | 12 | 26 | 27.25 | 7.79 | 44 |
Sim | 15 | 29 | 28.40 | 7.31 | 44 |
# Representação Gráfica
boxplot(Quest_Estresse$Estresse ~ Quest_Estresse$Namorado_a,
main="Gráfico 2",
xlab= "Possui namorado/a",
ylab= "Nível de estresse")
Quest_Estresse %>% select(Desempenho,Trabalha) %>%
group_by(Trabalha) %>%
summarise(
Mímimo=min(Desempenho),
Mediana=median(Desempenho),
Média=round(mean(Desempenho),2),
Desvio_Padrão=round(sd(Desempenho),2),
Máximo=max(Desempenho)) %>%
flextable() %>% theme_zebra()
Trabalha | Mímimo | Mediana | Média | Desvio_Padrão | Máximo |
Nao | 6.00 | 8.8 | 8.63 | 0.7 | 9.6 |
Sim | 5.82 | 8.7 | 8.54 | 0.9 | 9.7 |
#Representação Gráfica
boxplot(Quest_Estresse$Desempenho ~ Quest_Estresse$Trabalha,
main="Gráfico 3",
xlab= "Desempenho",
ylab= "Não/Possui emprego")
A hipótese 1 - de que os alunos que moram com os pais possuem mais
horas de estudos - está correta. Pois, de acordo com a intercepretação
do gráfico 1 e a observação dos resultados da primeira tabela, é
possível perceber que os alunos que moram com os pais possuem uma média
maior, 31.57, do que aqueles alunos que não moram com os pais, média de
30. Além disso, ambas as categorias possuem uma mediana igual, e o
desvio padrão dos alunos que trabalham é maior do que aqueles que não
trabalham.
A hipótese 2 - a qual diz que os alunos que namoram possuem um menor
nível de estresse - náo está correta. Os dados dos gráfico 2 e da tabela
referente à esse gtupo mostram que os alunos que namoram possuem uma
média de estresse maior, de 28.40, do que os que não namoram, que
possuem uma média de 27.25.Já a mediana deste grupo se encontra um pouco
mais distante e o desvio padrão mais próximo comparado a primeira
hipótese.
A hipótese 3 - onde os alunos que trabalham possuem um menor desempenho
do que aqueles que não trabalham - está correta. Tendo por base o
gráfico 3 e a última tabela, observa-se que a média de desempenho dos
alunos que não trabalham, apesar de serem bem próximas, é um pouco maior
do que a dos alunos que trabalham, 8.63 para os que não trabalham e 8.54
para aqueles que trabalham. A mediana e o desvio padrão possuem uma
diferença muito pequena. E diferentes dos outros gráficos, o gráfico 3
possui outliers.