Introdução

Para realizar a análise de uma variável qualitativa é necessário seguir os seguintes passos:

  1. Importar os arquivos e dados do excel;
  2. Observar e tratar os dados;
  3. Construir tabelas;
  4. Fazer gráficos e
  5. Interpretar os gráficos e escrever uma conclusão.

Importação dos dados

Aqui vamos adicionar os dados do excel

#--------------------------------
# primeiro passo - importacao de dados 
#--------------------------------

# importar do excel 
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/BibiPerigosa/Downloads/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)

Inspeção dos dados

Nesse momento vamos ver se o R classificou as variáveis corretamente.

#--------------------------------
# segundo passo - inspecionar dados 
#--------------------------------

str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
##  $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
##  $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
##  $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
##  $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
##  $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
##  $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
summary(Questionario_Estresse)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Tratamento dos dados

Aqui ocorre a correção dos problemas

#--------------------------------
# terceiro passo - transformacao de dados 
#--------------------------------

Questionario_Estresse$Turma <- ifelse(Questionario_Estresse$Turma==1,"2007_2",
                               ifelse(Questionario_Estresse$Turma==2,"2008_1","2008_2"))

Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"sim","nao")

Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"Natural do RJ","natural de outras cidades")

Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"sim","nao")

Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"sim","nao")

Nova observação dos dados

Agora, olhar os dados novamente

#--------------------------------
# quarto passo - analise dos dados novamente
#--------------------------------

summary(Questionario_Estresse)
##      Aluno         Turma            Mora_pais              RJ           
##  Min.   : 1.0   Length:95          Length:95          Length:95         
##  1st Qu.:24.5   Class :character   Class :character   Class :character  
##  Median :48.0   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :48.0                                                           
##  3rd Qu.:71.5                                                           
##  Max.   :95.0                                                           
##                                                                         
##   Namorado_a          Trabalha           Desempenho       Estresse    
##  Length:95          Length:95          Min.   :5.820   Min.   :12.00  
##  Class :character   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Mode  :character   Mode  :character   Median :8.700   Median :27.00  
##                                        Mean   :8.594   Mean   :27.82  
##                                        3rd Qu.:9.050   3rd Qu.:33.00  
##                                        Max.   :9.700   Max.   :44.00  
##                                                                       
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

Tabelas

Apresentação das tabelas

#--------------------------------
# quinto passo - tabelas para variavel qualitativa
#--------------------------------

tabela_turmas <- table(Questionario_Estresse$Turma)
tabela_turmas
## 
## 2007_2 2008_1 2008_2 
##     28     32     35
tabela_morapais <- table(Questionario_Estresse$Mora_pais)
tabela_morapais
## 
## nao sim 
##  51  44
tabela_namorando <- table(Questionario_Estresse$Namorado_a)
tabela_namorando
## 
## nao sim 
##  48  47
tabela_trabalha <- table(Questionario_Estresse$Trabalha)
tabela_trabalha
## 
## nao sim 
##  59  36
#--------------------------------
# quinto passo parte 2 - tabela com a proporcao
#--------------------------------

prop.table(tabela_turmas)*100
## 
##   2007_2   2008_1   2008_2 
## 29.47368 33.68421 36.84211
prop.table(tabela_morapais)*100
## 
##      nao      sim 
## 53.68421 46.31579
prop.table(tabela_namorando)*100
## 
##      nao      sim 
## 50.52632 49.47368
prop.table(tabela_trabalha)*100
## 
##      nao      sim 
## 62.10526 37.89474

Gráficos

Apresentação dos gráficos

#--------------------------------
# sexto passo - grafico de pizza
#--------------------------------

pie(tabela_turmas)

pie(tabela_turmas,main = "Turmas")

pie(tabela_turmas,col = c("#e31733","#a6293b","#750c1b"),
    main = "Turmas")

pie(tabela_morapais)

pie(tabela_morapais,main = "Mora com os pais")

pie(tabela_morapais,col = c("#1c64eb","#244c96"),
     main = "Mora com os pais")

pie(tabela_namorando)

pie(tabela_namorando,main = "Namorando")

pie(tabela_namorando,col = c("#529624","#68f20a"),
    main = "Namorando")

pie(tabela_trabalha)

pie(tabela_trabalha, main = "Trabalha")

pie(tabela_trabalha,col = c("#ed9c5a","#b55405"),
    main = "Namorando")

Interpretação dos gráficos e a conclusão:

A partir dos gráficos e tabelas apresentadas é possível observar que a maioria (cerca de 36%) dos alunos da pesquisa é da turma 2008_2, a turma 2007_2 tem cerca de 29% dos alunos totais e a turma 2008_1, aproximadamente 33%. Com o gráfico “Morando com os pais”, 53% dos alunos afirmam que não moram e 46% que sim. Já com o gráfico “Namorando”, 50% dos alunos estão solteiros e 49% dos alunos são comprometidos. E com o gráfico “Trabalha” entende-se que 50% dos alunos que responderam o questionário não trabalha e 49% trabalha.