Análise do Questionário de Estresse


Carregando dados para análise:

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/marco/Desktop/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)


Verificando base de dados

head(Questionario_Estresse)
# A tibble: 6 x 10
  Aluno Turma Mora_pais    RJ Namorado_a Trabalha Desempenho Estresse Créditos
  <dbl> <dbl>     <dbl> <dbl>      <dbl>    <dbl>      <dbl>    <dbl>    <dbl>
1     1     1         2     2          2        2       8.89       23       27
2     2     1         1     1          2        2       8.8        24       28
3     3     1         2     2          2        2       8          25       25
4     4     1         2     2          1        1       8.8        38       21
5     5     1         2     2          2        1       8.9        41       18
6     6     1         2     2          1        1       8.1        25       29
# ... with 1 more variable: Horas_estudo <dbl>


Ajustando Dados
* Transformando numerações em textos

Questionario_Estresse$Mora_pais = factor(Questionario_Estresse$Mora_pais, levels = c("1","2"), labels = c("Mora","Não Mora"))
Questionario_Estresse$Namorado_a = factor(Questionario_Estresse$Namorado_a, levels = c("1","2"), labels = c("Namora","Não Namora"))
Questionario_Estresse$Trabalha = factor(Questionario_Estresse$Trabalha, levels = c("1","2"), labels = c("Trabalha","Não Trabalha"))

head(Questionario_Estresse)
# A tibble: 6 x 10
  Aluno Turma Mora_pais    RJ Namorado_a Trabalha   Desempenho Estresse Créditos
  <dbl> <dbl> <fct>     <dbl> <fct>      <fct>           <dbl>    <dbl>    <dbl>
1     1     1 Não Mora      2 Não Namora Não Traba~       8.89       23       27
2     2     1 Mora          1 Não Namora Não Traba~       8.8        24       28
3     3     1 Não Mora      2 Não Namora Não Traba~       8          25       25
4     4     1 Não Mora      2 Namora     Trabalha         8.8        38       21
5     5     1 Não Mora      2 Não Namora Trabalha         8.9        41       18
6     6     1 Não Mora      2 Namora     Trabalha         8.1        25       29
# ... with 1 more variable: Horas_estudo <dbl>

Para duas variáveis qualitativas:


#Qualitativa - mora pais, trabalha, namorado.
#Quantitativa - desempenho, estresse, crédito

uma tabela cruzada


Mora com os pais x possui relacionamento

TabPaisRela = table(Questionario_Estresse$Mora_pais,Questionario_Estresse$Namorado_a)
TabPaisRela
          
           Namora Não Namora
  Mora         19         25
  Não Mora     28         23


Mora com os pais x Trabalho

TabPaiTrab = table(Questionario_Estresse$Mora_pais,Questionario_Estresse$Trabalha)
TabPaiTrab
          
           Trabalha Não Trabalha
  Mora           17           27
  Não Mora       19           32


Possui relacionamento x Trabalho

TabRelTrab = table(Questionario_Estresse$Namorado_a,Questionario_Estresse$Trabalha)
TabRelTrab
            
             Trabalha Não Trabalha
  Namora           18           29
  Não Namora       18           30


Agora separando mais os dados, três variáveis.

Tabtripla = table(Questionario_Estresse$Mora_pais,Questionario_Estresse$Namorado_a,Questionario_Estresse$Trabalha)
Tabtripla
, ,  = Trabalha

          
           Namora Não Namora
  Mora          8          9
  Não Mora     10          9

, ,  = Não Trabalha

          
           Namora Não Namora
  Mora         11         16
  Não Mora     18         14

Agora as mesmas tabelas na formatação de proporção

round(prop.table(TabPaisRela,1)*100,1)
          
           Namora Não Namora
  Mora       43.2       56.8
  Não Mora   54.9       45.1
round(prop.table(TabPaiTrab,1)*100,1)
          
           Trabalha Não Trabalha
  Mora         38.6         61.4
  Não Mora     37.3         62.7
round(prop.table(TabRelTrab,1)*100,1)
            
             Trabalha Não Trabalha
  Namora         38.3         61.7
  Não Namora     37.5         62.5

Um gráfico de barras

barplot(TabPaiTrab, main = "Mora com os pais X Trabalho",
        beside = TRUE,col = c("black","green"), density = 45, angle = 45,
        ylim = c(0,40), 
        legend = rownames(TabPaiTrab))


para uma variável qualitativa e uma variável quantitativa

um boxplot


Verificar o níverl de estresse relacionado ao quem trabalha.

library(flextable) 
summary(Questionario_Estresse)
     Aluno          Turma          Mora_pais        RJ             Namorado_a
 Min.   : 1.0   Min.   :1.000   Mora    :44   Min.   :1.000   Namora    :47  
 1st Qu.:24.5   1st Qu.:1.000   Não Mora:51   1st Qu.:1.000   Não Namora:48  
 Median :48.0   Median :2.000                 Median :2.000                  
 Mean   :48.0   Mean   :2.074                 Mean   :1.653                  
 3rd Qu.:71.5   3rd Qu.:3.000                 3rd Qu.:2.000                  
 Max.   :95.0   Max.   :3.000                 Max.   :2.000                  
                                                                             
         Trabalha    Desempenho       Estresse        Créditos    
 Trabalha    :36   Min.   :5.820   Min.   :12.00   Min.   :15.00  
 Não Trabalha:59   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
                   Median :8.700   Median :27.00   Median :24.00  
                   Mean   :8.594   Mean   :27.82   Mean   :24.95  
                   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
                   Max.   :9.700   Max.   :44.00   Max.   :49.00  
                                                   NA's   :1      
  Horas_estudo  
 Min.   :19.00  
 1st Qu.:25.00  
 Median :30.00  
 Mean   :30.73  
 3rd Qu.:35.00  
 Max.   :60.00  
                
boxplot(Estresse~Trabalha,
        data = Questionario_Estresse,main="Gráfico 2 - Relação Estresse x Trabalho",
        col=c("lightblue","gray"), horizontal = T,
        xlab = "Nível de Estresse", ylab = "Trabalha")

Verificar o níverl de estresse relacionado a quem mora com os pais

boxplot(Estresse~Mora_pais,
        data = Questionario_Estresse,main="Gráfico 3 - Relação Estresse x Pais",
        col=c("lightgray","blue"), horizontal = T,
        xlab = "Nível de Estresse", ylab = "Mora com os pais")

Verificar o níverl de estresse relacionado a quem namora

boxplot(Estresse~Namorado_a,
        data = Questionario_Estresse,main="Gráfico 4 - Relação Estresse x Relacionamento",
        col=c("green","yellow"), horizontal = T,
        xlab = "Nível de Estresse", ylab = "Relacionamento")


Resumo geral



média


mediaest = mean(Questionario_Estresse$Estresse)
mediaest
[1] 27.82105

Moda


tabela_estresse=table(Questionario_Estresse$Estresse)
tabela_estresse

12 13 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 
 1  2  1  3  3  1  1  5  5  2  3  4  6  8  3  2  4  6  5  4  5  3  3  1  3  3 
39 40 41 42 44 
 1  1  2  2  2 

Mediana


medest=median(Questionario_Estresse$Estresse)
medest
[1] 27

Variância


Varianciaest=var(Questionario_Estresse$Estresse)
Varianciaest
[1] 56.85062

Desvio-padrão


despadest=Varianciaest^(0.5)
despadest
[1] 7.539935

Coeficiente de variação

CVest = (despadest/mediaest)*100
CVest
[1] 27.10154


Estudo complementar

Vamos criar uma nova coluna com a combinação de três variáveis, para testes a hipotese de quem morar com os pais, ter relacionamento e trabalhar, interfere no desempenho e estresse.

library(dplyr)

Questionario_Estresse = Questionario_Estresse %>%
 mutate(
  Tripla_combinacao = case_when(
  Trabalha=="Trabalha" & Namorado_a=="Namora" & Mora_pais=="Mora" ~ "Trabalha,Namora e Mora", 
  Trabalha=="Trabalha" & Namorado_a=="Namora" & Mora_pais=="Não Mora" ~ "Trabalha,Namora e Não Mora",  
  Trabalha=="Trabalha" & Namorado_a=="Não Namora" & Mora_pais=="Mora" ~ "Trabalha,Não Namora e Mora" ,
  Trabalha=="Trabalha" & Namorado_a=="Não Namora" & Mora_pais=="Não Mora" ~ "Trabalha,Não Namora e Não Mora", 
  Trabalha=="Não Trabalha" & Namorado_a=="Namora" & Mora_pais=="Mora" ~ "Não Trabalha,Namora e Mora" ,
  Trabalha=="Não Trabalha" & Namorado_a=="Namora" & Mora_pais=="Não Mora" ~ "Não Trabalha,Namora e Não Mora" ,
  Trabalha=="Não Trabalha" & Namorado_a=="Não Namora" & Mora_pais=="Mora" ~ "Não Trabalha,Não Namora e Mora" ,
  Trabalha=="Não Trabalha" & Namorado_a=="Não Namora" & Mora_pais=="Não Mora" ~ "Não Trabalha,Não Namora e Não Mora" ,
  TRUE ~ "5. Outro Caso"))

tabtriplares = table(Questionario_Estresse$Tripla_combinacao)
tabtriplares

        Não Trabalha,Namora e Mora     Não Trabalha,Namora e Não Mora 
                                11                                 18 
    Não Trabalha,Não Namora e Mora Não Trabalha,Não Namora e Não Mora 
                                16                                 14 
            Trabalha,Namora e Mora         Trabalha,Namora e Não Mora 
                                 8                                 10 
        Trabalha,Não Namora e Mora     Trabalha,Não Namora e Não Mora 
                                 9                                  9 

Para um melhor estudo, faz-se necessário aprofundamento da relação entre a tripla combinação de ambiente, relacionamento e trabalho, com relação ao desempenho e ao nível de estresse. Observasse pelos gráficos que os níveis de estresse são maiores em que possui relacionamento e em quem não trabalha, com o incremento de conhecimento na ferramenta R, podemos fazer um estudo mais aprofundado buscando identificar se existe uma relação entre estas variáveis. A distribuição da amostragem total possui uma média disperção, com o aprofundamento, podemos concentrar mais nas faixas e buscar resultados mais expressivos nos dados.