Esse trabalho trata-se de uma atividade proposta na quarta aula da matéria de "Estatística aplicada à Engenharia" ministrada no dia 22 de novembro de 2021 pelo professor Steven Dutt-Ross.

1. INTRODUÇÃO

Estresse é uma resposta do organismo às situções vividas diariamente, que desencadeia uma série de reações químicas, disparando hormônios, entre eles a adrenalina, deixando o indivíduo “em estado de alerta”. Altos níveis de estresse são responsáveis pelo surgimento de diversas doenças, por isso avaliar situações estressantes e evitá-las é fundamental para promoção de saúde.

Estudantes que ingressam no Ensino Superior geralmente se encontram em situações de constante estresse, porque muitas vezes é necessário sair da casa dos pais, mudar de cidade, buscar alguma fonte de renda, estudar muitas matérias novas, adaptar-se à nova rotina, justificando assim a realização dessa pesquisa.

Dessa forma, esse trabalho tem por objetivo observar algumas características dos estudantes que participaram e em seguida analisar o nível de estresse explorando as ferramentas e possibilidades de aplicação da linguagem R.

2. MATERIAIS E MÉTODOS

Participaram da pesquisa 95 alunos de três turmas de um Curso de Psicologia de uma faculdade do Rio de Janeiro no ano de 2008.

Como instrumento para coleta de dados, foi aplicado um questionário que inicialmente caracteriza a amostra e em seguida quantifica o nível de estresse de acordo com a Escala de percepção de Estresse. Essa escala é composta por dez perguntas, onde suas respostas recebem pontuções de 1 a 5, de acordo com a frequência que o estudante passa pelas situções descritas nas perguntas, levando em consideração o último mês. Sendo assim, a menor pontuação possível será 10 e a maior será 50.

Para análise dos dados, utilizou-se o software RStudio.

2.1 Base de dados

Os dados coletados foram armazenados em um arquivo Excel, denominado “Questionário_Estresse”. Analizando o arquivo, observam-se três abas: “Dados”, “Descrição” e “Questionário” e que os dados de interesse se encontram na aba “Dados”. As demais abas orientam sobre o preenchimento da plinilha e apresenta o questionário aplicado.

#carregar a base de dados
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Vanessa/Documents/POSCIVIL/ESTATISTICA/Aulas/Base_de_dados-master/Questionario_Estresse.xls", 
                                    sheet = "Dados")
require(dplyr)
head(Questionario_Estresse) %>% 
  knitr::kable()

Aluno	Turma	Mora_pais	RJ	Namorado_a	Trabalha	Desempenho	Estresse	Créditos	Horas_estudo
1	1	2	2	2	2	8.89	23	27	27
2	1	1	1	2	2	8.80	24	28	28
3	1	2	2	2	2	8.00	25	25	25
4	1	2	2	1	1	8.80	38	21	30
5	1	2	2	2	1	8.90	41	18	20
6	1	2	2	1	1	8.10	25	29	32

Observando a estrutura dos dados, trata-se de uma amostra com 95 observações em 10 variáveis numéricas.

str(Questionario_Estresse)

tbl_df [95 x 10] (S3: tbl_df/tbl/data.frame)
 $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
 $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
 $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
 $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
 $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
 $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
 $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
 $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
 $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
 $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...

As variáveis “Mora_pais”, “RJ”, “Namorado_a” e “Trabalha” são do tipo qualitativa e suas respostas foram atribuídas a números. Nesse caso, se faz necessário realizar o tratamento dessas variáveis para uma abordagem melhor.

2.2. Variáveis categóricas

Conforme a orientação do arquivo de origem, a variável “Mora_pais” receberá as respostas “mora” e “não mora” substituindo o “1” para sim e “2” para não; a variável “RJ” receberá “RJ” e “outros”; a variável “Namorado_a” receberá “namora” e “não namora”; e a variável “Trabalha” receberá “trabalha” e “não trabalha”.

estresse = data.frame(Questionario_Estresse)

estresse$Mora_pais = ifelse(estresse$Mora_pais==1, "mora", "não mora")
estresse$RJ = ifelse(estresse$RJ==1, "RJ", "outros")
estresse$Namorado_a = ifelse(estresse$Namorado_a == 1, "namora", "não namora")
estresse$Trabalha = ifelse(estresse$Trabalha == 1, "trabalha", "não trabalha")

str(estresse)

'data.frame':   95 obs. of  10 variables:
 $ Aluno       : num  1 2 3 4 5 6 7 8 9 10 ...
 $ Turma       : num  1 1 1 1 1 1 1 1 1 1 ...
 $ Mora_pais   : chr  "não mora" "mora" "não mora" "não mora" ...
 $ RJ          : chr  "outros" "RJ" "outros" "outros" ...
 $ Namorado_a  : chr  "não namora" "não namora" "não namora" "namora" ...
 $ Trabalha    : chr  "não trabalha" "não trabalha" "não trabalha" "trabalha" ...
 $ Desempenho  : num  8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
 $ Estresse    : num  23 24 25 38 41 25 41 20 26 36 ...
 $ Créditos    : num  27 28 25 21 18 29 26 24 20 49 ...
 $ Horas_estudo: num  27 28 25 30 20 32 25 25 25 59 ...

Base de dados após tratamento das variáveis:

head(estresse) %>% 
  knitr::kable()

Aluno	Turma	Mora_pais	RJ	Namorado_a	Trabalha	Desempenho	Estresse	Créditos	Horas_estudo
1	1	não mora	outros	não namora	não trabalha	8.89	23	27	27
2	1	mora	RJ	não namora	não trabalha	8.80	24	28	28
3	1	não mora	outros	não namora	não trabalha	8.00	25	25	25
4	1	não mora	outros	namora	trabalha	8.80	38	21	30
5	1	não mora	outros	não namora	trabalha	8.90	41	18	20
6	1	não mora	outros	namora	trabalha	8.10	25	29	32

3. RESULTADOS E ANÁLISES

3.1. Relações entre as variáveis do estudo

3.1.1. Morar com os pais e trabalhar

Analisando os dados obtidos, verifica-se que 46,31% dos estudantes declaram morar com os pais e desses, 61,36% não trabalham, o que representa 28,42% do total.

Outro ponto importante, estudantes que não moram com seus pais e não trabalham representam 33,68% do estudo.

#tabelas
MorarPais = estresse$Mora_pais
Trabalhar = estresse$Trabalha
tab1 = table(Trabalhar, MorarPais)
tab10 = round(prop.table(tab1)*100,2)

require(tidyverse)
require(flextable)
#tabela
tab1 %>% data.frame() %>% flextable()

Trabalhar	MorarPais	Freq
não trabalha	mora	27
trabalha	mora	17
não trabalha	não mora	32
trabalha	não mora	19

#tabela de freq relativa
tab10 %>% data.frame() %>% flextable()

Trabalhar	MorarPais	Freq
não trabalha	mora	28.42
trabalha	mora	17.89
não trabalha	não mora	33.68
trabalha	não mora	20.00

#Gráfico de barras justapostas
graf10 = barplot(tab10, 
                main = "Gráfico relacional - Mora com os pais e Trabalha",
                col = c("#49aba8", "#0a5957"),
                ylim = c(0,50),
                beside = TRUE)
text(graf10, tab10, labels = tab10, pos = 3, cex = 0.8)
legend(5, 50, c("não trabalha", "trabalha"),  col = c("#49aba8", "#0a5957"), pch = 15)

3.1.2. Morar com os pais e ser natural do Rio de Janeiro

Nesse tópico, observa-se que metade dos estudantes (50,53%) não moram com seus pais e não são naturais do Rio de Janeiro, revelando assim que esses alunos vieram de outras localidades para cursar a faculdade.

Nota-se também que 31,58% dos estudantes são naturais do Rio de Janeiro e moram com seus pais.

RJ = estresse$RJ

tab2 = table(RJ, MorarPais)
tab20 = round(prop.table(tab2)*100,2)

tab2 %>% data.frame() %>% flextable()

RJ	MorarPais	Freq
outros	mora	14
RJ	mora	30
outros	não mora	48
RJ	não mora	3

tab20 %>% data.frame() %>% flextable()

RJ	MorarPais	Freq
outros	mora	14.74
RJ	mora	31.58
outros	não mora	50.53
RJ	não mora	3.16

#Gráfico de barras justapostas
graf20 = barplot(tab20, 
                main = "Gráfico relacional - Morar com os pais e ser natural do RJ",
                col = c("#b8a3f7", "#4b3787"),
                ylim = c(0,60),
                beside = TRUE)
text(graf20, tab20, labels = tab20, pos = 3, cex = 0.8)
legend(5.3, 50, c("outros", "RJ"),  col = c("#b8a3f7", "#4b3787"), pch = 15)

3.1.3. Trabalhar e namorar

Com relação à variável trabalho, 62,1% não trabalham e 37,9% trabalham. Em ambos os grupos, metade das pessoas namoram.

Namorar = estresse$Namorado_a

tab4 = table(Namorar,Trabalhar)
tab40 = round(prop.table(tab4)*100,2)

tab4 %>% data.frame() %>% flextable()

Namorar	Trabalhar	Freq
namora	não trabalha	29
não namora	não trabalha	30
namora	trabalha	18
não namora	trabalha	18

tab40 %>% data.frame() %>% flextable()

Namorar	Trabalhar	Freq
namora	não trabalha	30.53
não namora	não trabalha	31.58
namora	trabalha	18.95
não namora	trabalha	18.95

#Gráfico de barras justapostas
graf40 = barplot(tab40, 
                main = "Gráfico relacional - Trabalhar e namorar",
                col = c("#abffd2", "#406b54"),
                ylim = c(0,60),
                beside = TRUE)
text(graf40, tab40, labels = tab40, pos = 3, cex = 0.8)
legend(5, 50, c("namora", "não namora"),  col = c("#abffd2", "#406b54"), pch = 15)

3.2. Análise do nível de estresse

A partir da aplicação da Escala de percepção de Estresse, obteve-se a variável “Estresse”, indicando o nível de estresse de cada aluno.

#Estatísticas
require(dplyr)
require(flextable)
estresse %>% select(Estresse) %>% 
  summarise(Media = mean(Estresse), Desvio_padrao = sd(Estresse)) %>% 
  flextable()

Media	Desvio_padrao
27.82105	7.539935

#Hitograma
hist(estresse$Estresse, 
     main = "Nível de estresse das turmas de Psicologia - 2008",
     xlab = "Nível de estresse",
     ylab = "Freq.",
     col = "#b8a3f7",
     ylim = c(0,30),
     labels = TRUE)
abline(v = mean(estresse$Estresse), col = "red")

3.2.1 Estresse por morar com os pais

Em média, morar com os pais é mais estressante do que não morar. Porém, é possível observar uma dispersão maior dos dados para quem não mora com os pais.

#Estatísticas

estresse %>%  select(Estresse, Mora_pais) %>% 
  group_by(Mora_pais) %>% 
  summarise(Media = mean(Estresse), Desvio_Padrao = sd(Estresse)) %>% 
  flextable()

Mora_pais	Media	Desvio_Padrao
mora	28.11364	7.160018
não mora	27.56863	7.915188

#Boxplot
Estresse = estresse$Estresse

boxplot(Estresse~MorarPais,
        main = "Nível de Estresse - Morar com os Pais",
        col = c("#49aba8", "#0a5957"),
        ylab = "Alunos",
        xlab = "Nível de Estresse",
        horizontal = TRUE)

3.2.2 Estresse por trabalhar

Na avaliação desse tópico, verificam-se valores médios muito próximos (27,9 para “não trabalha” e 27,6 para “trabalha”). Dessa forma, ao analisar o gráfico gerado, a mediana das observações se torna mais significativa reforçando que quem não trabalha apresenta maiores níveis de estresse.

#Estatísticas

estresse %>%  select(Estresse, Trabalha) %>% 
  group_by(Trabalha) %>% 
  summarise(Media = mean(Estresse), Desvio_Padrao = sd(Estresse)) %>% 
  flextable()

Trabalha	Media	Desvio_Padrao
não trabalha	27.93220	7.380927
trabalha	27.63889	7.896302

#Boxplot
boxplot(Estresse~Trabalhar,
        main = "Nível de Estresse - Trabalhar",
        col = c("#ffabd6", "#873760"),
        ylab = "Alunos",
        xlab = "Nível de Estresse",
        horizontal = TRUE)

3.2.3 Estresse por namorar

Como avaliado em um outro momento do estudo, metade dos estudantes namoram e o nível de estresse desse grupo é maior do que o grupo que não namora, apresentando um valor médio de 28,4, enquanto quem não namora o nível de estresse médio é 27,25.

#Estatísticas

estresse %>%  select(Estresse, Namorado_a) %>% 
  group_by(Namorado_a) %>% 
  summarise(Media = mean(Estresse), Desvio_Padrao = sd(Estresse)) %>% 
  flextable()

Namorado_a	Media	Desvio_Padrao
namora	28.40426	7.311871
não namora	27.25000	7.791157

#Boxplot
boxplot(Estresse~Namorar,
        main = "Nível de Estresse - Namorar",
        col = c("#abffd2", "#406b54"),
        ylab = "Alunos",
        xlab = "Nível de Estresse",
        horizontal = TRUE)

4. CONCLUSÃO

Diversos são os fatores que desencadeiam o estresse. Para os estudantes desse estudo, foi possível avaliar três desses fatores: morar com os pais, trabalhar e namorar. Pôde-se observar que estudantes que namoram apresentaram em média maior nível de estresse que as demais variáveis. Porém, esse dado não é suficiente para realizar análises mais profundas.

De forma geral, analisando apenas o nível de estresse dos estudantes que participaram da pesquisa, encontra-se o valor médio de 27,8, evidenciando assim que a maioria dos alunos não se encontram em níveis elevados de estresse, visto que o valor médio da Escala aplicada é 30.

Nesse exercício, a linguagem R se mostrou uma excelente ferramenta para o tratamento das informações, possibilitando manipular os dados com facilidade, gerando gráficos e tabelas que contribuiram para uma melhor compreenção do estudo.

Atividade 4 - Análise bi-variada

Vanessa Manhães Almeida

25/11/2021