Introdução

# Carregar Base de Dados


library(readxl)
Quest_Estresse <- read_excel("C:/Users/55219/Desktop/Base_de_dados-master/Questionario_Estresse.xls", 
                             col_types = c("text", "text", "text", 
                                           "text", "text", "text", "numeric", 
                                           "numeric", "numeric", "numeric"))
head(Quest_Estresse)
## # A tibble: 6 × 10
##   Aluno Turma Mora_pais RJ    Namorado_a Trabalha Desempenho Estresse Créditos
##   <chr> <chr> <chr>     <chr> <chr>      <chr>         <dbl>    <dbl>    <dbl>
## 1 1     1     2         2     2          2              8.89       23       27
## 2 2     1     1         1     2          2              8.8        24       28
## 3 3     1     2         2     2          2              8          25       25
## 4 4     1     2         2     1          1              8.8        38       21
## 5 5     1     2         2     2          1              8.9        41       18
## 6 6     1     2         2     1          1              8.1        25       29
## # … with 1 more variable: Horas_estudo <dbl>
# Mostrar a Base de Dados

library(DT)
DT::datatable(Quest_Estresse)
# Tranformação de Variáveis

Quest_Estresse$Mora_pais <- ifelse(Quest_Estresse$Mora_pais==1,"Sim","Nao")
Quest_Estresse$RJ <- ifelse(Quest_Estresse$RJ==1,"natural do RJ","natural de outra cidade")
Quest_Estresse$Namorado_a <- ifelse(Quest_Estresse$Namorado_a==1,"Sim","Nao")
Quest_Estresse$Trabalha <- ifelse(Quest_Estresse$Trabalha==1,"Sim","Nao")
# Carregar biblioteca

library(flextable)
library(dplyr)

Cruazamento das Variáveis

Hipóteses

  1. Os alunos que moram com os pais possuem mais horas de estudos.
  2. Os alunos que namoram possuem um menor nível de estresse.
  3. Os alunos que trabalham possuem um menor desempenho do que aqueles que não trabalham.

Análise da hipótese 1

Quest_Estresse %>% select(Horas_estudo,Mora_pais) %>%
 group_by(Mora_pais) %>% 
 summarise(
         Mímimo=min(Horas_estudo),
         Mediana=median(Horas_estudo),
         Média=round(mean(Horas_estudo),2),
         Desvio_Padrão=round(sd(Horas_estudo),2),
         Máximo=max(Horas_estudo)) %>%
     flextable() %>% theme_zebra()
# Representação Gráfica

boxplot(Quest_Estresse$Horas_estudo ~ Quest_Estresse$Mora_pais,
        main="Gráfico 1",
        xlab= "Mora com os pais",
        ylab= "Horas de estudo")

Resultado: Hipótese comprovada

Análise da hipótese 2

Quest_Estresse %>% select(Estresse,Namorado_a) %>%
  group_by(Namorado_a) %>% 
  summarise(
    Mímimo=min(Estresse),
    Mediana=median(Estresse),
    Média=round(mean(Estresse),2),
    Desvio_Padrão=round(sd(Estresse),2),
    Máximo=max(Estresse)) %>%
  flextable() %>% theme_zebra()
# Representação Gráfica

boxplot(Quest_Estresse$Estresse ~ Quest_Estresse$Namorado_a,
        main="Gráfico 2",
        xlab= "Possui namorado/a",
        ylab= "Nível de estresse")

Resultado: Hipótese não comprovada

Análise da hipótese 3

Quest_Estresse %>% select(Desempenho,Trabalha) %>%
  group_by(Trabalha) %>% 
  summarise(
    Mímimo=min(Desempenho),
    Mediana=median(Desempenho),
    Média=round(mean(Desempenho),2),
    Desvio_Padrão=round(sd(Desempenho),2),
    Máximo=max(Desempenho)) %>%
  flextable() %>% theme_zebra()
#Representação Gráfica

boxplot(Quest_Estresse$Desempenho ~ Quest_Estresse$Trabalha,
        main="Gráfico 3",
        xlab= "Desempenho",
        ylab= "Não/Possui emprego")

Resultado: Hipótese comprovada

Conclusão

A hipótese 1 - de que os alunos que moram com os pais possuem mais horas de estudos - está correta. Pois, de acordo com a intercepretação do gráfico 1 e a observação dos resultados da primeira tabela, é possível perceber que os alunos que moram com os pais possuem uma média maior, 31.57, do que aqueles alunos que não moram com os pais, média de 30. Além disso, ambas as categorias possuem uma mediana igual, e o desvio padrão dos alunos que trabalham é maior do que aqueles que não trabalham.
A hipótese 2 - a qual diz que os alunos que namoram possuem um menor nível de estresse - náo está correta. Os dados dos gráfico 2 e da tabela referente à esse gtupo mostram que os alunos que namoram possuem uma média de estresse maior, de 28.40, do que os que não namoram, que possuem uma média de 27.25.Já a mediana deste grupo se encontra um pouco mais distante e o desvio padrão mais próximo comparado a primeira hipótese.
A hipótese 3 - onde os alunos que trabalham possuem um menor desempenho do que aqueles que não trabalham - está correta. Tendo por base o gráfico 3 e a última tabela, observa-se que a média de desempenho dos alunos que não trabalham, apesar de serem bem próximas, é um pouco maior do que a dos alunos que trabalham, 8.63 para os que não trabalham e 8.54 para aqueles que trabalham. A mediana e o desvio padrão possuem uma diferença muito pequena. E diferentes dos outros gráficos, o gráfico 3 possui outliers.