Esse trabalho trata-se de uma atividade proposta na quarta aula da matéria de "Estatística aplicada à Engenharia" ministrada no dia 22 de novembro de 2021 pelo professor Steven Dutt-Ross.
Estresse é uma resposta do organismo às situções vividas diariamente, que desencadeia uma série de reações químicas, disparando hormônios, entre eles a adrenalina, deixando o indivíduo “em estado de alerta”. Altos níveis de estresse são responsáveis pelo surgimento de diversas doenças, por isso avaliar situações estressantes e evitá-las é fundamental para promoção de saúde.
Estudantes que ingressam no Ensino Superior geralmente se encontram em situações de constante estresse, porque muitas vezes é necessário sair da casa dos pais, mudar de cidade, buscar alguma fonte de renda, estudar muitas matérias novas, adaptar-se à nova rotina, justificando assim a realização dessa pesquisa.
Dessa forma, esse trabalho tem por objetivo observar algumas características dos estudantes que participaram e em seguida analisar o nível de estresse explorando as ferramentas e possibilidades de aplicação da linguagem R.
Participaram da pesquisa 95 alunos de três turmas de um Curso de Psicologia de uma faculdade do Rio de Janeiro no ano de 2008.
Como instrumento para coleta de dados, foi aplicado um questionário que inicialmente caracteriza a amostra e em seguida quantifica o nível de estresse de acordo com a Escala de percepção de Estresse. Essa escala é composta por dez perguntas, onde suas respostas recebem pontuções de 1 a 5, de acordo com a frequência que o estudante passa pelas situções descritas nas perguntas, levando em consideração o último mês. Sendo assim, a menor pontuação possível será 10 e a maior será 50.
Para análise dos dados, utilizou-se o software RStudio.
Os dados coletados foram armazenados em um arquivo Excel, denominado “Questionário_Estresse”. Analizando o arquivo, observam-se três abas: “Dados”, “Descrição” e “Questionário” e que os dados de interesse se encontram na aba “Dados”. As demais abas orientam sobre o preenchimento da plinilha e apresenta o questionário aplicado.
#carregar a base de dados
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Vanessa/Documents/POSCIVIL/ESTATISTICA/Aulas/Base_de_dados-master/Questionario_Estresse.xls",
sheet = "Dados")
require(dplyr)
head(Questionario_Estresse) %>%
knitr::kable()
| Aluno | Turma | Mora_pais | RJ | Namorado_a | Trabalha | Desempenho | Estresse | Créditos | Horas_estudo |
|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 2 | 2 | 2 | 2 | 8.89 | 23 | 27 | 27 |
| 2 | 1 | 1 | 1 | 2 | 2 | 8.80 | 24 | 28 | 28 |
| 3 | 1 | 2 | 2 | 2 | 2 | 8.00 | 25 | 25 | 25 |
| 4 | 1 | 2 | 2 | 1 | 1 | 8.80 | 38 | 21 | 30 |
| 5 | 1 | 2 | 2 | 2 | 1 | 8.90 | 41 | 18 | 20 |
| 6 | 1 | 2 | 2 | 1 | 1 | 8.10 | 25 | 29 | 32 |
Observando a estrutura dos dados, trata-se de uma amostra com 95 observações em 10 variáveis numéricas.
str(Questionario_Estresse)
tbl_df [95 x 10] (S3: tbl_df/tbl/data.frame)
$ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
$ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
$ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
$ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
$ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
$ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
$ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
$ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
$ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
$ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
As variáveis “Mora_pais”, “RJ”, “Namorado_a” e “Trabalha” são do tipo qualitativa e suas respostas foram atribuídas a números. Nesse caso, se faz necessário realizar o tratamento dessas variáveis para uma abordagem melhor.
Conforme a orientação do arquivo de origem, a variável “Mora_pais” receberá as respostas “mora” e “não mora” substituindo o “1” para sim e “2” para não; a variável “RJ” receberá “RJ” e “outros”; a variável “Namorado_a” receberá “namora” e “não namora”; e a variável “Trabalha” receberá “trabalha” e “não trabalha”.
estresse = data.frame(Questionario_Estresse)
estresse$Mora_pais = ifelse(estresse$Mora_pais==1, "mora", "não mora")
estresse$RJ = ifelse(estresse$RJ==1, "RJ", "outros")
estresse$Namorado_a = ifelse(estresse$Namorado_a == 1, "namora", "não namora")
estresse$Trabalha = ifelse(estresse$Trabalha == 1, "trabalha", "não trabalha")
str(estresse)
'data.frame': 95 obs. of 10 variables:
$ Aluno : num 1 2 3 4 5 6 7 8 9 10 ...
$ Turma : num 1 1 1 1 1 1 1 1 1 1 ...
$ Mora_pais : chr "não mora" "mora" "não mora" "não mora" ...
$ RJ : chr "outros" "RJ" "outros" "outros" ...
$ Namorado_a : chr "não namora" "não namora" "não namora" "namora" ...
$ Trabalha : chr "não trabalha" "não trabalha" "não trabalha" "trabalha" ...
$ Desempenho : num 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
$ Estresse : num 23 24 25 38 41 25 41 20 26 36 ...
$ Créditos : num 27 28 25 21 18 29 26 24 20 49 ...
$ Horas_estudo: num 27 28 25 30 20 32 25 25 25 59 ...
head(estresse) %>%
knitr::kable()
| Aluno | Turma | Mora_pais | RJ | Namorado_a | Trabalha | Desempenho | Estresse | Créditos | Horas_estudo |
|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | não mora | outros | não namora | não trabalha | 8.89 | 23 | 27 | 27 |
| 2 | 1 | mora | RJ | não namora | não trabalha | 8.80 | 24 | 28 | 28 |
| 3 | 1 | não mora | outros | não namora | não trabalha | 8.00 | 25 | 25 | 25 |
| 4 | 1 | não mora | outros | namora | trabalha | 8.80 | 38 | 21 | 30 |
| 5 | 1 | não mora | outros | não namora | trabalha | 8.90 | 41 | 18 | 20 |
| 6 | 1 | não mora | outros | namora | trabalha | 8.10 | 25 | 29 | 32 |
Analisando os dados obtidos, verifica-se que 46,31% dos estudantes declaram morar com os pais e desses, 61,36% não trabalham, o que representa 28,42% do total.
Outro ponto importante, estudantes que não moram com seus pais e não trabalham representam 33,68% do estudo.
#tabelas
MorarPais = estresse$Mora_pais
Trabalhar = estresse$Trabalha
tab1 = table(Trabalhar, MorarPais)
tab10 = round(prop.table(tab1)*100,2)
require(tidyverse)
require(flextable)
#tabela
tab1 %>% data.frame() %>% flextable()
Trabalhar | MorarPais | Freq |
não trabalha | mora | 27 |
trabalha | mora | 17 |
não trabalha | não mora | 32 |
trabalha | não mora | 19 |
#tabela de freq relativa
tab10 %>% data.frame() %>% flextable()
Trabalhar | MorarPais | Freq |
não trabalha | mora | 28.42 |
trabalha | mora | 17.89 |
não trabalha | não mora | 33.68 |
trabalha | não mora | 20.00 |
#Gráfico de barras justapostas
graf10 = barplot(tab10,
main = "Gráfico relacional - Mora com os pais e Trabalha",
col = c("#49aba8", "#0a5957"),
ylim = c(0,50),
beside = TRUE)
text(graf10, tab10, labels = tab10, pos = 3, cex = 0.8)
legend(5, 50, c("não trabalha", "trabalha"), col = c("#49aba8", "#0a5957"), pch = 15)
Nesse tópico, observa-se que metade dos estudantes (50,53%) não moram com seus pais e não são naturais do Rio de Janeiro, revelando assim que esses alunos vieram de outras localidades para cursar a faculdade.
Nota-se também que 31,58% dos estudantes são naturais do Rio de Janeiro e moram com seus pais.
RJ = estresse$RJ
tab2 = table(RJ, MorarPais)
tab20 = round(prop.table(tab2)*100,2)
tab2 %>% data.frame() %>% flextable()
RJ | MorarPais | Freq |
outros | mora | 14 |
RJ | mora | 30 |
outros | não mora | 48 |
RJ | não mora | 3 |
tab20 %>% data.frame() %>% flextable()
RJ | MorarPais | Freq |
outros | mora | 14.74 |
RJ | mora | 31.58 |
outros | não mora | 50.53 |
RJ | não mora | 3.16 |
#Gráfico de barras justapostas
graf20 = barplot(tab20,
main = "Gráfico relacional - Morar com os pais e ser natural do RJ",
col = c("#b8a3f7", "#4b3787"),
ylim = c(0,60),
beside = TRUE)
text(graf20, tab20, labels = tab20, pos = 3, cex = 0.8)
legend(5.3, 50, c("outros", "RJ"), col = c("#b8a3f7", "#4b3787"), pch = 15)
Com relação à variável trabalho, 62,1% não trabalham e 37,9% trabalham. Em ambos os grupos, metade das pessoas namoram.
Namorar = estresse$Namorado_a
tab4 = table(Namorar,Trabalhar)
tab40 = round(prop.table(tab4)*100,2)
tab4 %>% data.frame() %>% flextable()
Namorar | Trabalhar | Freq |
namora | não trabalha | 29 |
não namora | não trabalha | 30 |
namora | trabalha | 18 |
não namora | trabalha | 18 |
tab40 %>% data.frame() %>% flextable()
Namorar | Trabalhar | Freq |
namora | não trabalha | 30.53 |
não namora | não trabalha | 31.58 |
namora | trabalha | 18.95 |
não namora | trabalha | 18.95 |
#Gráfico de barras justapostas
graf40 = barplot(tab40,
main = "Gráfico relacional - Trabalhar e namorar",
col = c("#abffd2", "#406b54"),
ylim = c(0,60),
beside = TRUE)
text(graf40, tab40, labels = tab40, pos = 3, cex = 0.8)
legend(5, 50, c("namora", "não namora"), col = c("#abffd2", "#406b54"), pch = 15)
A partir da aplicação da Escala de percepção de Estresse, obteve-se a variável “Estresse”, indicando o nível de estresse de cada aluno.
#Estatísticas
require(dplyr)
require(flextable)
estresse %>% select(Estresse) %>%
summarise(Media = mean(Estresse), Desvio_padrao = sd(Estresse)) %>%
flextable()
Media | Desvio_padrao |
27.82105 | 7.539935 |
#Hitograma
hist(estresse$Estresse,
main = "Nível de estresse das turmas de Psicologia - 2008",
xlab = "Nível de estresse",
ylab = "Freq.",
col = "#b8a3f7",
ylim = c(0,30),
labels = TRUE)
abline(v = mean(estresse$Estresse), col = "red")
Em média, morar com os pais é mais estressante do que não morar. Porém, é possível observar uma dispersão maior dos dados para quem não mora com os pais.
#Estatísticas
estresse %>% select(Estresse, Mora_pais) %>%
group_by(Mora_pais) %>%
summarise(Media = mean(Estresse), Desvio_Padrao = sd(Estresse)) %>%
flextable()
Mora_pais | Media | Desvio_Padrao |
mora | 28.11364 | 7.160018 |
não mora | 27.56863 | 7.915188 |
#Boxplot
Estresse = estresse$Estresse
boxplot(Estresse~MorarPais,
main = "Nível de Estresse - Morar com os Pais",
col = c("#49aba8", "#0a5957"),
ylab = "Alunos",
xlab = "Nível de Estresse",
horizontal = TRUE)
Na avaliação desse tópico, verificam-se valores médios muito próximos (27,9 para “não trabalha” e 27,6 para “trabalha”). Dessa forma, ao analisar o gráfico gerado, a mediana das observações se torna mais significativa reforçando que quem não trabalha apresenta maiores níveis de estresse.
#Estatísticas
estresse %>% select(Estresse, Trabalha) %>%
group_by(Trabalha) %>%
summarise(Media = mean(Estresse), Desvio_Padrao = sd(Estresse)) %>%
flextable()
Trabalha | Media | Desvio_Padrao |
não trabalha | 27.93220 | 7.380927 |
trabalha | 27.63889 | 7.896302 |
#Boxplot
boxplot(Estresse~Trabalhar,
main = "Nível de Estresse - Trabalhar",
col = c("#ffabd6", "#873760"),
ylab = "Alunos",
xlab = "Nível de Estresse",
horizontal = TRUE)
Como avaliado em um outro momento do estudo, metade dos estudantes namoram e o nível de estresse desse grupo é maior do que o grupo que não namora, apresentando um valor médio de 28,4, enquanto quem não namora o nível de estresse médio é 27,25.
#Estatísticas
estresse %>% select(Estresse, Namorado_a) %>%
group_by(Namorado_a) %>%
summarise(Media = mean(Estresse), Desvio_Padrao = sd(Estresse)) %>%
flextable()
Namorado_a | Media | Desvio_Padrao |
namora | 28.40426 | 7.311871 |
não namora | 27.25000 | 7.791157 |
#Boxplot
boxplot(Estresse~Namorar,
main = "Nível de Estresse - Namorar",
col = c("#abffd2", "#406b54"),
ylab = "Alunos",
xlab = "Nível de Estresse",
horizontal = TRUE)
Diversos são os fatores que desencadeiam o estresse. Para os estudantes desse estudo, foi possível avaliar três desses fatores: morar com os pais, trabalhar e namorar. Pôde-se observar que estudantes que namoram apresentaram em média maior nível de estresse que as demais variáveis. Porém, esse dado não é suficiente para realizar análises mais profundas.
De forma geral, analisando apenas o nível de estresse dos estudantes que participaram da pesquisa, encontra-se o valor médio de 27,8, evidenciando assim que a maioria dos alunos não se encontram em níveis elevados de estresse, visto que o valor médio da Escala aplicada é 30.
Nesse exercício, a linguagem R se mostrou uma excelente ferramenta para o tratamento das informações, possibilitando manipular os dados com facilidade, gerando gráficos e tabelas que contribuiram para uma melhor compreenção do estudo.