Introdução
Atividade referente à disciplina de estatística aplicada às ciências humanas e sociais, da turma de administração pública, 2021.2.
Atividade 04: Fazer uma públicação no rpubs de uma análise de duas variáveis categóricas com:
1. gráfico de barras por grupo;
2. tabela e,
3. tabela com proporções.
tese:
. Entre os estudantes que trabalham, os que não são naturais do Rio de Janeiro são a maioria.
Variável-chave: Trabalha
Passo 1: Carregando a base de dados
Para dar início a análise é preciso carregar a base de dados que será utilizada.
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/julia/Base_de_dados-master/Questionario_Estresse.xls",
sheet = "Dados")Passo 2: verificando os dados
str(Questionario_Estresse)## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
## $ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
## $ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
## $ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
## $ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
## $ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
## $ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
## $ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
## $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
Passo 3: transformando os dados que irei usar
Após verificar os dados estarei transformando-os para que possa utilizá-los.
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1, "Natural do RJ", "Natural de outra cidade")
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1, "Trabalha", "Não trabalha")Passo 4: análise descritiva dos dados
summary(Questionario_Estresse)## Aluno Turma Mora_pais RJ
## Min. : 1.0 Min. :1.000 Min. :1.000 Length:95
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 Class :character
## Median :48.0 Median :2.000 Median :2.000 Mode :character
## Mean :48.0 Mean :2.074 Mean :1.537
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000
##
## Namorado_a Trabalha Desempenho Estresse
## Min. :1.000 Length:95 Min. :5.820 Min. :12.00
## 1st Qu.:1.000 Class :character 1st Qu.:8.500 1st Qu.:22.50
## Median :2.000 Mode :character Median :8.700 Median :27.00
## Mean :1.505 Mean :8.594 Mean :27.82
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :2.000 Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
Passo 5: criando tabela para análise
Utilizando do comando %>% estarei criando a tabela de números absolutos dos estudantes que trabalham e sua naturalidade, cruzando os dados da base de dados Questionario_Estresse.
library(dplyr)##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
tabela_Trabalha <- Questionario_Estresse %>% select(Trabalha,RJ)%>% table()
tabela_Trabalha## RJ
## Trabalha Natural de outra cidade Natural do RJ
## Não trabalha 40 19
## Trabalha 22 14
Passo 6: criando o gráfico de barras por grupo
Com a tabela criada, estarei dando continuidade a criação do gráfico de barras com o comando barplot, mostrando a naturalidade dos estudantes que trabalham.
COR <- c("#D2691E","#9ACD32","#D2691E","#9ACD32")
grafico_1 <- barplot(tabela_Trabalha, main = "Naturalidade dos estudantes que trabalham",
col = COR,
horiz= FALSE, beside = TRUE,
ylim = c(0,100),
legend = rownames(tabela_Trabalha))
contagem <- (tabela_Trabalha)
rotulo <- paste0(contagem)
text(grafico_1, 0, rotulo,cex=1,pos=3,col = "white")Resultados:
Conforme os dados do gráfico:
. Dos 95 estudantes entrevistados, 62 são naturais de outras cidades e 33 são naturais do RJ;
. Dos 62 estudantes naturais de outras cidades, 40 não trabalham e 22 trabalham;
. Dos 33 naturais do Rio de Janeiro, 19 não trabalham e 14 estão trabalhando.
Os dados evidenciam que há mais estudantes que são naturais de outras cidades trabalhando.
Passo 7: criando a tabela de proporções
Criando a tabela para ver o equivalente percentual dos dados descobertos.
tabela_trabalha_prop <- Questionario_Estresse %>% select(Trabalha, RJ)%>% table()%>%
prop.table(1)%>%round(2)
tabela_trabalha_prop## RJ
## Trabalha Natural de outra cidade Natural do RJ
## Não trabalha 0.68 0.32
## Trabalha 0.61 0.39
Resultado:
. Dos 62 estudantes que são naturais de outras cidades, 61% está trabalhando;
. Enquanto que dos 33 estudantes naturais do Rio de Janeiro, 39% está trabalhando.
Conclusão
Conforme os dados apresentados, a tese apresentada é real, o percentual de estudantes naturais de outras cidades que estão trabalhando é maior ao comparar com os estudantes naturais do Rio de Janeiro.