Introdução

Foi feita uma pesquisa sobre grau de estresse aplicada em duas turmas do curso de Psicologia. 95 alunos responderam a diversas perguntas do questionário para análise de estresse como: mora com os pais, mora no RJ, namora e trabalha. A seguir vamos analisar essa Base de dados: “Questionario_Estresse.xls”.

1° Vamos carregar a biblioteca (read) e o banco de dados:

library(readxl)
# 1- carregar banco de dados

Quest_Est <- read_excel("C:/Users/steff/OneDrive/Área de Trabalho/Base_de_dados-master/Base_de_dados-master/Questionario_Estresse.xls")

Média, Variância, Desvio Padrão e Raiz Quadrada

# média
media_desem    <- mean(Quest_Est$Desempenho)
media_desem
## [1] 8.6
#Variância
variancia_desem<- var(Quest_Est$Desempenho)
variancia_desem
## [1] 0.6
#Desvio-Padrão
dp_desem       <- sd(Quest_Est$Desempenho)
dp_desem
## [1] 0.78
#Raiz Quadrada
sqrt(variancia_desem)
## [1] 0.78

Transformação de variáveis

Aqui vamos pegar a variável trabalha (quantitativa) e transformar em variável qualitativa.

E a variável Namorado(a)(quantitativa) em qualitativa, sim e não.

#A variável Trabalha (quantitativa) vai se transformar em variável qualitativa.

Quest_Est$Trabalha <- ifelse(Quest_Est$Trabalha== 1,"Sim","Não")
Quest_Est$Namorado_a <- ifelse(Quest_Est$Namorado_a== 1,"Sim","Não")

Sumário Questionário Estresse

summary(Quest_Est)
##      Aluno        Turma        Mora_pais          RJ        Namorado_a       
##  Min.   : 1   Min.   :1.00   Min.   :1.00   Min.   :1.00   Length:95         
##  1st Qu.:24   1st Qu.:1.00   1st Qu.:1.00   1st Qu.:1.00   Class :character  
##  Median :48   Median :2.00   Median :2.00   Median :2.00   Mode  :character  
##  Mean   :48   Mean   :2.07   Mean   :1.54   Mean   :1.65                     
##  3rd Qu.:72   3rd Qu.:3.00   3rd Qu.:2.00   3rd Qu.:2.00                     
##  Max.   :95   Max.   :3.00   Max.   :2.00   Max.   :2.00                     
##                                                                              
##    Trabalha           Desempenho     Estresse     Créditos   Horas_estudo
##  Length:95          Min.   :5.8   Min.   :12   Min.   :15   Min.   :19   
##  Class :character   1st Qu.:8.5   1st Qu.:22   1st Qu.:23   1st Qu.:25   
##  Mode  :character   Median :8.7   Median :27   Median :24   Median :30   
##                     Mean   :8.6   Mean   :28   Mean   :25   Mean   :31   
##                     3rd Qu.:9.1   3rd Qu.:33   3rd Qu.:27   3rd Qu.:35   
##                     Max.   :9.7   Max.   :44   Max.   :49   Max.   :60   
##                                                NA's   :1

Relacionamento de variáveis qualitativas e quantitativas

library(flextable)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Quantitativa = Estresse;

Qualitativa = Trabalha

# quantitativa = Estresse
# qualitativa = Trabalha

Quest_Est %>% select(Estresse,Trabalha) %>% 
  group_by(Trabalha) %>%
  summarise(Média=round(mean(Estresse),1),
            Mediana=median(Estresse),
            Desvio_Padrão= round(sd(Estresse),1),
            Tamanho=n()) %>%
  flextable() %>%
  add_header_lines("Tabela 1 - Estatísticas do estresse") %>%
  theme_tron()

Na tabela 1 Estatísticas do estresse podemos ver a média, mediana, desvio-padrão e tamanho do estresse em relação aos alunos que trabalham além de estudar. Grau fornecido por uma escala estabelecida com um máximo de 50. Logo a média encontrada para os alunos que trabalham e os que não trabalham é de 28, acima da metade. A quantidade de pessoas que não estão trabalhando é maior (59) do que os que trabalham (36).

Quantitativa = Estresse;

Qualitativa = Namorando

# quantitativa = Estresse
# qualitativa = Namorando

Quest_Est %>% select(Estresse,Namorado_a) %>% 
  group_by(Namorado_a) %>%
  summarise(Média=round(mean(Estresse),1),
            Mediana=median(Estresse),
            Desvio_Padrão= round(sd(Estresse),1),
            Tamanho=n()) %>%
  flextable() %>%
  add_header_lines("Tabela 2 - Estatísticas do estresse") %>%
  theme_tron()

Na tabela 2 Estatísticas do estresse podemos ver a média, mediana, desvio-padrão e tamanho do estresse em relação aos alunos que estão namorando. Grau fornecido por uma escala estabelecida com um máximo de 50. Logo a média encontrada para os alunos que namoram é de 28 e os que não namoram é de 27, acima da metade. E que a mediana dos que responderam que estão namorando é maior (29).

Variável de interesse (Variável resposta): Estresse;

Preditores lineares: Trabalha e Namora

# Variável de interesse (Variável resposta): Estresse
# Preditores lineares: Trabalha e Namora

Quest_Est %>% select(Estresse, Trabalha, Namorado_a) %>%
  group_by(Trabalha, Namorado_a) %>%
  summarise(Média=round(mean(Estresse),1),
            Mediana=median(Estresse),
            Desvio_Padrão= round(sd(Estresse),1),
            Tamanho=n()) %>%
  flextable() %>%
  add_header_lines("Tabela 3 - Estatísticas do Estresse por Trabalhar e Namorar") %>%
  theme_tron()
## `summarise()` has grouped output by 'Trabalha'. You can override using the
## `.groups` argument.

Na tabela 3 Estatísticas do estresse por trabalhar e namorar também podemos ver a média, mediana, desvio-padrão e tamanho do estresse em relação ao trabalho e namoro. Grau fornecido por uma escala estabelecida com um máximo de 50. 30 alunos dos 95 não trabalham e namoram e 18 fazem os dois.

Qual a relação do estresse dos alunos que namoram com o fato de trabalhar além de estudar?

# Qual a relação do estresse dos alunos que namoram com o fato de trabalhar além de estudar?

Quest_Est %>% filter(Namorado_a =='Sim') %>%
  select(Estresse,Trabalha) %>%
  group_by(Trabalha) %>%
  summarise(Média=round(mean(Estresse),1),
            Mediana=median(Estresse)) %>%
  flextable() %>%
  bg(j = "Média", bg = "#42f58d", part = "body") %>%
  bg(j = "Mediana", bg = "#facff1", part = "body") %>%
  bg(j = "Trabalha", bg = "lightyellow", part = "body") %>%
  add_header_lines("Tabela 4  - Estatísticas do Estresse por
                  trabalho para alunos que estão namorando")

Na tabela 4 Estatísticas do estresse por trabalho para alunos que estão namorando, podemos ver a média e mediana. O grau do estresse foi fornecido por uma escala estabelecida. A média e mediana dos alunos que namoram mas não trabalham é maior(30) mostrando um nível de estresse grande para os alunos que só namoram.

BOXPLOT por grupo

Quantitativa = Horas de estudo;

Qualitativa = Trabalha

# quantitativa = Horas de estudo
# qualitativa = Trabalha   

boxplot(Quest_Est$Horas_estudo ~ Quest_Est$Trabalha,
        main = "Gráfico 1 - boxplot de horas de estudo por trabalho",
        col=c("red","blue"),
        ylab = "Horas_de_estudo",
        xlab = "Trabalham")

No gráfico 1 boxplot de horas de estudo por trabalho, vemos que as medianas dos que trabalham e não trabalham em relação as horas de estudo são as mesmas. É maior a representação do quarto quartil para os alunos que não trabalham. Assim eles apresentam mais horas de estudo, em contra partida o tamanho da caixa que representa os alunos que trabalham é maior, há uma dispersão, uma nas horas de estudo abaixo da mediana. A quantidade de alunos que trabalham é maior.

Quantitativa = Horas de estudo;

Qualitativa = Namorando

# quantitativa = Horas de estudo
# qualitativa = Namorando   

boxplot(Quest_Est$Horas_estudo ~ Quest_Est$Namorado_a,
        main = "Gráfico 2 - boxplot de horas de estudo por namoro",
        col=c("green","yellow"),
        ylab = "Horas_de_estudo",
        xlab = "Namorando")

No gráfico 2 boxplot de horas de estudo por namoro, vemos que as medianas das horas de estudo dos alunos que estão namorando é um pouco maior dos que não namoram. Os dois máximos estão igualados e são levemente simétricos. Os dois têm outliers, possuem alunos que apresentaram muitas horas de estudo.

Quantitativa = Estresse;

Qualitativa = Namorando

# quantitativa = Estresse
# qualitativa = Namorando   

boxplot(Quest_Est$Estresse ~ Quest_Est$Namorado_a,
        main = "Gráfico 3 - boxplot de estresse por namoro",
        col=c("orange","pink"),
        ylab = "Estresse",
        xlab = "Namorando")

No gráfico 3 boxplot de estresse apenas por namorando, vemos que a mediana do estresse para os alunos que estão namorando é maior. Também podemos observar que os dois são simétricos, mas o bloco do que não estão namorando é mais concentrado, logo apresenta mais alunos. Logo, grande parte dos alunos não namoram visto que o maior nível de estresse são dos que estão namorando.

Quantitativa = Estresse;

Qualitativa = trabalhar

# quantitativa = Estresse
# qualitativa = trabalhar

boxplot(Quest_Est$Estresse ~ Quest_Est$Trabalha,
        main = "Gráfico 4 - boxplot de estresse por trabalhar além de estudar",
        col=c("green","red"),
        ylab = "Estresse",
        xlab = "trabalha além de estuda")

Por último foi feito um gráfico boxplot de estresse por trabalhar além de estudar. Existe uma pequena variabilidade em relação ao mínimo do estresse ser representado para os alunos que não trabalham. Em contra partida eles também apresentam uma mediana maior de estresse, porém há uma dispersão no box dos que trabalham, Existem uma maior diversidade de alunos que trabalham além de estudar logo tem o nível de estresse varia.