Atividade 4 - Duas variáveis qualitativas

Para começar, o primeiro passo é fazer a importação da tabela

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Israel/Documents/Documentos/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)

O segundo passo é o tratamento dos dados

Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1, 
                                          "Sim","Nao")


Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1, "Natural do Rj",
                                   "Natural de outras cidades")

Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,
                                           "Sim","Nao")


Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,
                                         "Sim", "Nao")


Questionario_Estresse$Turma <- ifelse(Questionario_Estresse$Turma==1,"2007_2",
                                      ifelse(Questionario_Estresse$Turma==2,"2008_1",
                                             "2008_2"))

Terceiro passo é a verificação

summary(Questionario_Estresse)
##      Aluno         Turma            Mora_pais              RJ           
##  Min.   : 1.0   Length:95          Length:95          Length:95         
##  1st Qu.:24.5   Class :character   Class :character   Class :character  
##  Median :48.0   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :48.0                                                           
##  3rd Qu.:71.5                                                           
##  Max.   :95.0                                                           
##                                                                         
##   Namorado_a          Trabalha           Desempenho       Estresse    
##  Length:95          Length:95          Min.   :5.820   Min.   :12.00  
##  Class :character   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Mode  :character   Mode  :character   Median :8.700   Median :27.00  
##                                        Mean   :8.594   Mean   :27.82  
##                                        3rd Qu.:9.050   3rd Qu.:33.00  
##                                        Max.   :9.700   Max.   :44.00  
##                                                                       
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

Quarto passo é a criação das tabelas

tabela_trabalho <- table(Questionario_Estresse$Trabalha,
                         Questionario_Estresse$Turma)
tabela_trabalho
##      
##       2007_2 2008_1 2008_2
##   Nao     13     26     20
##   Sim     15      6     15
tabela_pais <- table(Questionario_Estresse$Mora_pais,
                     Questionario_Estresse$Turma)
tabela_pais
##      
##       2007_2 2008_1 2008_2
##   Nao     16     19     16
##   Sim     12     13     19

Quinto passo é a criação de tabelas com proporções

prop.table(tabela_trabalho,1)*100
##      
##         2007_2   2008_1   2008_2
##   Nao 22.03390 44.06780 33.89831
##   Sim 41.66667 16.66667 41.66667
prop.table(tabela_trabalho,2)*100
##      
##         2007_2   2008_1   2008_2
##   Nao 46.42857 81.25000 57.14286
##   Sim 53.57143 18.75000 42.85714
prop.table(tabela_pais)*100
##      
##         2007_2   2008_1   2008_2
##   Nao 16.84211 20.00000 16.84211
##   Sim 12.63158 13.68421 20.00000

Sexto passo é a criação de gráfico de barras por turmas

COR <- c ("pink","purple")
barplot(tabela_trabalho, main = "Gráfico 1 - Trabalho por turma",
        col = COR, horiz= FALSE, beside = TRUE,
        legend = rownames(tabela_trabalho))

COR2 <- c ("orange","green")
barplot(tabela_pais, main = "Gráfico 2 - Moram no Brasil por turma",
        col = COR2, horiz= FALSE, beside = TRUE,
        legend = rownames(tabela_pais))

Conclusão

A criação das tabelas gira em torno das turmas. A intenção é descobrir a quantidade de alunos de cada turma que moram no país e a quantidade de alunos que trabalham. Através da tabela de proporção é possível ter uma dimensão em porcentagem.

Já o gráfico de barras demonstra de forma mais visual a mesma relação das tabelas com os que trabalham e os que moram no país, em cada uma das três turmas.

De acordo com os dados, no gráfico 2, a maioria dos alunos não moram no país nas turmas de 2007_2 e 2008_1, apenas na turma 2008_2 é que a maioria dos alunos moram no país. Em relação ao gráfico 1, em 2007_2 a maioria trabalhava mas a quantidade era quase que dividida, enquanto que em 2008_1 a grande maioria não trabalha. E em 2008_2 a maior parte ainda não trabalha mas em comparação com2008_1 o número de alunos que trabalhavam aumentou.