Introdução

Atividade referente à disciplina de estatística aplicada às ciências humanas e sociais, da turma de administração pública, 2021.2.

Atividade 04: Fazer uma públicação no rpubs de uma análise de duas variáveis categóricas com:

 1. gráfico de barras por grupo;   
 2. tabela e,   
 3. tabela com proporções.   
 

 

tese:

   . Entre os estudantes que trabalham, os que não são naturais do Rio de Janeiro são a maioria.   
 

Variável-chave: Trabalha

 

Passo 1: Carregando a base de dados

Para dar início a análise é preciso carregar a base de dados que será utilizada.

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/julia/Base_de_dados-master/Questionario_Estresse.xls", 
                                    sheet = "Dados")

Passo 2: verificando os dados

str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
##  $ Aluno       : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Turma       : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Mora_pais   : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ RJ          : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
##  $ Namorado_a  : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
##  $ Trabalha    : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
##  $ Desempenho  : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
##  $ Estresse    : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
##  $ Créditos    : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
##  $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...

Passo 3: transformando os dados que irei usar

Após verificar os dados estarei transformando-os para que possa utilizá-los.

Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1, "Natural do RJ", "Natural de outra cidade")

Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1, "Trabalha", "Não trabalha")

Passo 4: análise descritiva dos dados

summary(Questionario_Estresse)
##      Aluno          Turma         Mora_pais          RJ           
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Length:95         
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   Class :character  
##  Median :48.0   Median :2.000   Median :2.000   Mode  :character  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537                     
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000                     
##  Max.   :95.0   Max.   :3.000   Max.   :2.000                     
##                                                                   
##    Namorado_a      Trabalha           Desempenho       Estresse    
##  Min.   :1.000   Length:95          Min.   :5.820   Min.   :12.00  
##  1st Qu.:1.000   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Median :2.000   Mode  :character   Median :8.700   Median :27.00  
##  Mean   :1.505                      Mean   :8.594   Mean   :27.82  
##  3rd Qu.:2.000                      3rd Qu.:9.050   3rd Qu.:33.00  
##  Max.   :2.000                      Max.   :9.700   Max.   :44.00  
##                                                                    
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

Passo 5: criando tabela para análise

Utilizando do comando %>% estarei criando a tabela de números absolutos dos estudantes que trabalham e sua naturalidade, cruzando os dados da base de dados Questionario_Estresse.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
tabela_Trabalha <- Questionario_Estresse %>% select(Trabalha,RJ)%>% table()
tabela_Trabalha
##               RJ
## Trabalha       Natural de outra cidade Natural do RJ
##   Não trabalha                      40            19
##   Trabalha                          22            14

Passo 6: criando o gráfico de barras por grupo

Com a tabela criada, estarei dando continuidade a criação do gráfico de barras com o comando barplot, mostrando a naturalidade dos estudantes que trabalham.

COR <- c("#D2691E","#9ACD32","#D2691E","#9ACD32")
grafico_1 <- barplot(tabela_Trabalha, main = "Naturalidade dos estudantes que trabalham",
        col = COR,
        horiz= FALSE, beside = TRUE,
        ylim = c(0,100),
        legend = rownames(tabela_Trabalha))
contagem <- (tabela_Trabalha)
rotulo <- paste0(contagem)
text(grafico_1, 0, rotulo,cex=1,pos=3,col = "white")

Resultados:

Conforme os dados do gráfico:

. Dos 95 estudantes entrevistados, 62 são naturais de outras cidades e 33 são naturais do RJ;   
. Dos 62 estudantes naturais de outras cidades, 40 não trabalham e 22 trabalham;      
. Dos 33 naturais do Rio de Janeiro, 19 não trabalham e 14 estão trabalhando.   

Os dados evidenciam que há mais estudantes que são naturais de outras cidades trabalhando.

Passo 7: criando a tabela de proporções

Criando a tabela para ver o equivalente percentual dos dados descobertos.

tabela_trabalha_prop <- Questionario_Estresse %>% select(Trabalha, RJ)%>% table()%>%
  prop.table(1)%>%round(2)
tabela_trabalha_prop
##               RJ
## Trabalha       Natural de outra cidade Natural do RJ
##   Não trabalha                    0.68          0.32
##   Trabalha                        0.61          0.39

Resultado:

. Dos 62 estudantes que são naturais de outras cidades, 61% está trabalhando;
. Enquanto que dos 33 estudantes naturais do Rio de Janeiro, 39% está trabalhando.   

 

Conclusão

Conforme os dados apresentados, a tese apresentada é real, o percentual de estudantes naturais de outras cidades que estão trabalhando é maior ao comparar com os estudantes naturais do Rio de Janeiro.