Introdução

Na atividade 4 iremos tratar sobre:

  1. Importação de dados excel,
  2. Verificar e tratar os dados,
  3. Construir tabela e tabela de proporção,
  4. Fazer o gráfico de barras em grupo;
  5. Relação do trabalho e nível de estresse;
  6. Parecer sobre o resultado.
# Importar do Excel

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/isabe/Desktop/Base_de_dados-master/Questionario_Estresse.xls", 
                                    sheet = "Dados")
View(Questionario_Estresse)

#---------------------------
# Passo 2 - Inspecionar
#---------------------------

str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
##  $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
##  $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
##  $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
##  $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
##  $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
##  $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
summary(Questionario_Estresse)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Trocando a variável quantitativa por qualitativa

Parâmetro para a tabela estresse: <== 18 nível de estresse baixo, <== 32 nível de estresse médio, >32 então nível de estresse alto

#------------------------------
# Passo 3 - Transformação dos dados
#------------------------------

Questionario_Estresse$Turma<- ifelse(Questionario_Estresse$Turma==1,"2007_2",
                                     ifelse(Questionario_Estresse$Turma==2,"2008_1","2008_2"))


Questionario_Estresse$Trabalha<- ifelse(Questionario_Estresse$Trabalha==1,"Trabalha","Não Trabalha")

Questionario_Estresse$Estresse<- ifelse(Questionario_Estresse$Estresse <=18,"Nível baixo",
                                        ifelse(Questionario_Estresse$Estresse <=32,"Nível médio", "Nível alto")) 

#------------------------------------
# Passo 4 - Olhar os dados novamente
#------------------------------------

summary(Questionario_Estresse)
##      Aluno         Turma             Mora_pais           RJ       
##  Min.   : 1.0   Length:95          Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   Class :character   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Mode  :character   Median :2.000   Median :2.000  
##  Mean   :48.0                      Mean   :1.537   Mean   :1.653  
##  3rd Qu.:71.5                      3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0                      Max.   :2.000   Max.   :2.000  
##                                                                   
##    Namorado_a      Trabalha           Desempenho      Estresse        
##  Min.   :1.000   Length:95          Min.   :5.820   Length:95         
##  1st Qu.:1.000   Class :character   1st Qu.:8.500   Class :character  
##  Median :2.000   Mode  :character   Median :8.700   Mode  :character  
##  Mean   :1.505                      Mean   :8.594                     
##  3rd Qu.:2.000                      3rd Qu.:9.050                     
##  Max.   :2.000                      Max.   :9.700                     
##                                                                       
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1
str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
##  $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Turma       : chr [1:95] "2007_2" "2007_2" "2007_2" "2007_2" ...
##  $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
##  $ Trabalha    : chr [1:95] "Não Trabalha" "Não Trabalha" "Não Trabalha" "Trabalha" ...
##  $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
##  $ Estresse    : chr [1:95] "Nível médio" "Nível médio" "Nível médio" "Nível alto" ...
##  $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
##  $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
View(Questionario_Estresse)

Criando tabelas

#-----------------------------------
# Passo 5 - Tabela
#----------------------------------

tabela_quem_trabalha <- table(Questionario_Estresse$Trabalha, Questionario_Estresse$Estresse)

tabela_quem_trabalha
##               
##                Nível alto Nível baixo Nível médio
##   Não Trabalha         16           6          37
##   Trabalha             10           5          21
#------------------------------
# Passo 6 - Tabela em proporção
#-------------------------------

prop.table(tabela_quem_trabalha,1)*100
##               
##                Nível alto Nível baixo Nível médio
##   Não Trabalha   27.11864    10.16949    62.71186
##   Trabalha       27.77778    13.88889    58.33333
prop.table(tabela_quem_trabalha,2)*100
##               
##                Nível alto Nível baixo Nível médio
##   Não Trabalha   61.53846    54.54545    63.79310
##   Trabalha       38.46154    45.45455    36.20690

Grafico de barras, alunos que trabalham e não trabalham e sua relação com o estresse

#--------------------------------------
# Passo 6 - Gráfico de barras em grupo
#--------------------------------------

barplot(tabela_quem_trabalha, main=" Gráfico - Relação Estresse e Trabalho", col= c("#f5071f", "#f76116","#f5071f", "#f76116")
        ,horiz=FALSE,beside=TRUE,legend = rownames(tabela_quem_trabalha), ylim=c(0,50),
        args.legend = list(x = "topright"))

Parecer do resultado da pesquisa

Depois de ter organizado os pontos da tabela de estresse em níveis, baixo, médio e alto, facilitou a nossa interpretação de alunos que trabalham e o grau de estresse. A tabela de números absolutos nos mostra que o número de aulunos que não trabalham e são até mais estressados, ao mesmo tempo que esses que não trabalham também marcam mais pontos no nível de estresse baixo e médio. O que quer dizer que o resultado é distribuido, ao mesmo tempo que os estudantes que não trabalham seriam em hipótese mais estressados são também os menos.

A tabela proporção nos mostra a mesma coisa, a relação de alunos que só estudam e são estressados é igual, da mesma forma obtendo um número favorável a níveis baixos de estresse. Podemos afirmar então, que nesse estudo não existe relação do trabalho com o estresse, essa variável não traz números expressivos que apontam alterações relacionadas ao fato de alunos trabalharem ou não. Como as variações são bem sutis, seria interessante utilizar o histograma.