Esse trabalho trata-se de uma atividade proposta na quarta aula da matéria de "Estatística aplicada à Engenharia" ministrada no dia 22 de novembro de 2021 pelo professor Steven Dutt-Ross.

1. INTRODUÇÃO

Estresse é uma resposta do organismo às situções vividas diariamente, que desencadeia uma série de reações químicas, disparando hormônios, entre eles a adrenalina, deixando o indivíduo “em estado de alerta”. Altos níveis de estresse são responsáveis pelo surgimento de diversas doenças, por isso avaliar situações estressantes e evitá-las é fundamental para promoção de saúde.

Estudantes que ingressam no Ensino Superior geralmente se encontram em situações de constante estresse, porque muitas vezes é necessário sair da casa dos pais, mudar de cidade, buscar alguma fonte de renda, estudar muitas matérias novas, adaptar-se à nova rotina, justificando assim a realização dessa pesquisa.

Dessa forma, esse trabalho tem por objetivo observar algumas características dos estudantes que participaram e em seguida analisar o nível de estresse explorando as ferramentas e possibilidades de aplicação da linguagem R.

2. MATERIAIS E MÉTODOS

Participaram da pesquisa 95 alunos de três turmas de um Curso de Psicologia de uma faculdade do Rio de Janeiro no ano de 2008.

Como instrumento para coleta de dados, foi aplicado um questionário que inicialmente caracteriza a amostra e em seguida quantifica o nível de estresse de acordo com a Escala de percepção de Estresse. Essa escala é composta por dez perguntas, onde suas respostas recebem pontuções de 1 a 5, de acordo com a frequência que o estudante passa pelas situções descritas nas perguntas, levando em consideração o último mês. Sendo assim, a menor pontuação possível será 10 e a maior será 50.

Para análise dos dados, utilizou-se o software RStudio.

2.1 Base de dados

Os dados coletados foram armazenados em um arquivo Excel, denominado “Questionário_Estresse”. Analizando o arquivo, observam-se três abas: “Dados”, “Descrição” e “Questionário” e que os dados de interesse se encontram na aba “Dados”. As demais abas orientam sobre o preenchimento da plinilha e apresenta o questionário aplicado.

#carregar a base de dados
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Vanessa/Documents/POSCIVIL/ESTATISTICA/Aulas/Base_de_dados-master/Questionario_Estresse.xls", 
                                    sheet = "Dados")
require(dplyr)
head(Questionario_Estresse) %>% 
  knitr::kable()
Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos Horas_estudo
1 1 2 2 2 2 8.89 23 27 27
2 1 1 1 2 2 8.80 24 28 28
3 1 2 2 2 2 8.00 25 25 25
4 1 2 2 1 1 8.80 38 21 30
5 1 2 2 2 1 8.90 41 18 20
6 1 2 2 1 1 8.10 25 29 32

Observando a estrutura dos dados, trata-se de uma amostra com 95 observações em 10 variáveis numéricas.

str(Questionario_Estresse)
tbl_df [95 x 10] (S3: tbl_df/tbl/data.frame)
 $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
 $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
 $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
 $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
 $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
 $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
 $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
 $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
 $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
 $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...

As variáveis “Mora_pais”, “RJ”, “Namorado_a” e “Trabalha” são do tipo qualitativa e suas respostas foram atribuídas a números. Nesse caso, se faz necessário realizar o tratamento dessas variáveis para uma abordagem melhor.

2.2. Variáveis categóricas

Conforme a orientação do arquivo de origem, a variável “Mora_pais” receberá as respostas “mora” e “não mora” substituindo o “1” para sim e “2” para não; a variável “RJ” receberá “RJ” e “outros”; a variável “Namorado_a” receberá “namora” e “não namora”; e a variável “Trabalha” receberá “trabalha” e “não trabalha”.

estresse = data.frame(Questionario_Estresse)

estresse$Mora_pais = ifelse(estresse$Mora_pais==1, "mora", "não mora")
estresse$RJ = ifelse(estresse$RJ==1, "RJ", "outros")
estresse$Namorado_a = ifelse(estresse$Namorado_a == 1, "namora", "não namora")
estresse$Trabalha = ifelse(estresse$Trabalha == 1, "trabalha", "não trabalha")

str(estresse)
'data.frame':   95 obs. of  10 variables:
 $ Aluno       : num  1 2 3 4 5 6 7 8 9 10 ...
 $ Turma       : num  1 1 1 1 1 1 1 1 1 1 ...
 $ Mora_pais   : chr  "não mora" "mora" "não mora" "não mora" ...
 $ RJ          : chr  "outros" "RJ" "outros" "outros" ...
 $ Namorado_a  : chr  "não namora" "não namora" "não namora" "namora" ...
 $ Trabalha    : chr  "não trabalha" "não trabalha" "não trabalha" "trabalha" ...
 $ Desempenho  : num  8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
 $ Estresse    : num  23 24 25 38 41 25 41 20 26 36 ...
 $ Créditos    : num  27 28 25 21 18 29 26 24 20 49 ...
 $ Horas_estudo: num  27 28 25 30 20 32 25 25 25 59 ...
  • Base de dados após tratamento das variáveis:
head(estresse) %>% 
  knitr::kable()
Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos Horas_estudo
1 1 não mora outros não namora não trabalha 8.89 23 27 27
2 1 mora RJ não namora não trabalha 8.80 24 28 28
3 1 não mora outros não namora não trabalha 8.00 25 25 25
4 1 não mora outros namora trabalha 8.80 38 21 30
5 1 não mora outros não namora trabalha 8.90 41 18 20
6 1 não mora outros namora trabalha 8.10 25 29 32

3. RESULTADOS E ANÁLISES

3.1. Relações entre as variáveis do estudo

3.1.1. Morar com os pais e trabalhar

Analisando os dados obtidos, verifica-se que 46,31% dos estudantes declaram morar com os pais e desses, 61,36% não trabalham, o que representa 28,42% do total.

Outro ponto importante, estudantes que não moram com seus pais e não trabalham representam 33,68% do estudo.

#tabelas
MorarPais = estresse$Mora_pais
Trabalhar = estresse$Trabalha
tab1 = table(Trabalhar, MorarPais)
tab10 = round(prop.table(tab1)*100,2)

require(tidyverse)
require(flextable)
#tabela
tab1 %>% data.frame() %>% flextable()
#tabela de freq relativa
tab10 %>% data.frame() %>% flextable()
#Gráfico de barras justapostas
graf10 = barplot(tab10, 
                main = "Gráfico relacional - Mora com os pais e Trabalha",
                col = c("#49aba8", "#0a5957"),
                ylim = c(0,50),
                beside = TRUE)
text(graf10, tab10, labels = tab10, pos = 3, cex = 0.8)
legend(5, 50, c("não trabalha", "trabalha"),  col = c("#49aba8", "#0a5957"), pch = 15)

3.1.2. Morar com os pais e ser natural do Rio de Janeiro

Nesse tópico, observa-se que metade dos estudantes (50,53%) não moram com seus pais e não são naturais do Rio de Janeiro, revelando assim que esses alunos vieram de outras localidades para cursar a faculdade.

Nota-se também que 31,58% dos estudantes são naturais do Rio de Janeiro e moram com seus pais.

RJ = estresse$RJ

tab2 = table(RJ, MorarPais)
tab20 = round(prop.table(tab2)*100,2)

tab2 %>% data.frame() %>% flextable()
tab20 %>% data.frame() %>% flextable()
#Gráfico de barras justapostas
graf20 = barplot(tab20, 
                main = "Gráfico relacional - Morar com os pais e ser natural do RJ",
                col = c("#b8a3f7", "#4b3787"),
                ylim = c(0,60),
                beside = TRUE)
text(graf20, tab20, labels = tab20, pos = 3, cex = 0.8)
legend(5.3, 50, c("outros", "RJ"),  col = c("#b8a3f7", "#4b3787"), pch = 15)

3.1.3. Trabalhar e namorar

Com relação à variável trabalho, 62,1% não trabalham e 37,9% trabalham. Em ambos os grupos, metade das pessoas namoram.

Namorar = estresse$Namorado_a

tab4 = table(Namorar,Trabalhar)
tab40 = round(prop.table(tab4)*100,2)

tab4 %>% data.frame() %>% flextable()
tab40 %>% data.frame() %>% flextable()
#Gráfico de barras justapostas
graf40 = barplot(tab40, 
                main = "Gráfico relacional - Trabalhar e namorar",
                col = c("#abffd2", "#406b54"),
                ylim = c(0,60),
                beside = TRUE)
text(graf40, tab40, labels = tab40, pos = 3, cex = 0.8)
legend(5, 50, c("namora", "não namora"),  col = c("#abffd2", "#406b54"), pch = 15)

3.2. Análise do nível de estresse

A partir da aplicação da Escala de percepção de Estresse, obteve-se a variável “Estresse”, indicando o nível de estresse de cada aluno.

#Estatísticas
require(dplyr)
require(flextable)
estresse %>% select(Estresse) %>% 
  summarise(Media = mean(Estresse), Desvio_padrao = sd(Estresse)) %>% 
  flextable()
#Hitograma
hist(estresse$Estresse, 
     main = "Nível de estresse das turmas de Psicologia - 2008",
     xlab = "Nível de estresse",
     ylab = "Freq.",
     col = "#b8a3f7",
     ylim = c(0,30),
     labels = TRUE)
abline(v = mean(estresse$Estresse), col = "red")

3.2.1 Estresse por morar com os pais

Em média, morar com os pais é mais estressante do que não morar. Porém, é possível observar uma dispersão maior dos dados para quem não mora com os pais.

#Estatísticas

estresse %>%  select(Estresse, Mora_pais) %>% 
  group_by(Mora_pais) %>% 
  summarise(Media = mean(Estresse), Desvio_Padrao = sd(Estresse)) %>% 
  flextable()
#Boxplot
Estresse = estresse$Estresse

boxplot(Estresse~MorarPais,
        main = "Nível de Estresse - Morar com os Pais",
        col = c("#49aba8", "#0a5957"),
        ylab = "Alunos",
        xlab = "Nível de Estresse",
        horizontal = TRUE)

3.2.2 Estresse por trabalhar

Na avaliação desse tópico, verificam-se valores médios muito próximos (27,9 para “não trabalha” e 27,6 para “trabalha”). Dessa forma, ao analisar o gráfico gerado, a mediana das observações se torna mais significativa reforçando que quem não trabalha apresenta maiores níveis de estresse.

#Estatísticas

estresse %>%  select(Estresse, Trabalha) %>% 
  group_by(Trabalha) %>% 
  summarise(Media = mean(Estresse), Desvio_Padrao = sd(Estresse)) %>% 
  flextable()
#Boxplot
boxplot(Estresse~Trabalhar,
        main = "Nível de Estresse - Trabalhar",
        col = c("#ffabd6", "#873760"),
        ylab = "Alunos",
        xlab = "Nível de Estresse",
        horizontal = TRUE)

3.2.3 Estresse por namorar

Como avaliado em um outro momento do estudo, metade dos estudantes namoram e o nível de estresse desse grupo é maior do que o grupo que não namora, apresentando um valor médio de 28,4, enquanto quem não namora o nível de estresse médio é 27,25.

#Estatísticas

estresse %>%  select(Estresse, Namorado_a) %>% 
  group_by(Namorado_a) %>% 
  summarise(Media = mean(Estresse), Desvio_Padrao = sd(Estresse)) %>% 
  flextable()
#Boxplot
boxplot(Estresse~Namorar,
        main = "Nível de Estresse - Namorar",
        col = c("#abffd2", "#406b54"),
        ylab = "Alunos",
        xlab = "Nível de Estresse",
        horizontal = TRUE)

4. CONCLUSÃO

Diversos são os fatores que desencadeiam o estresse. Para os estudantes desse estudo, foi possível avaliar três desses fatores: morar com os pais, trabalhar e namorar. Pôde-se observar que estudantes que namoram apresentaram em média maior nível de estresse que as demais variáveis. Porém, esse dado não é suficiente para realizar análises mais profundas.

De forma geral, analisando apenas o nível de estresse dos estudantes que participaram da pesquisa, encontra-se o valor médio de 27,8, evidenciando assim que a maioria dos alunos não se encontram em níveis elevados de estresse, visto que o valor médio da Escala aplicada é 30.

Nesse exercício, a linguagem R se mostrou uma excelente ferramenta para o tratamento das informações, possibilitando manipular os dados com facilidade, gerando gráficos e tabelas que contribuiram para uma melhor compreenção do estudo.