Atividade 4 - Duas variáveis qualitativas
Para começar, o primeiro passo é fazer a importação da tabela
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Israel/Documents/Documentos/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)
O segundo passo é o tratamento dos dados
Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,
"Sim","Nao")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1, "Natural do Rj",
"Natural de outras cidades")
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,
"Sim","Nao")
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,
"Sim", "Nao")
Questionario_Estresse$Turma <- ifelse(Questionario_Estresse$Turma==1,"2007_2",
ifelse(Questionario_Estresse$Turma==2,"2008_1",
"2008_2"))
Terceiro passo é a verificação
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Length:95 Length:95 Length:95
## 1st Qu.:24.5 Class :character Class :character Class :character
## Median :48.0 Mode :character Mode :character Mode :character
## Mean :48.0
## 3rd Qu.:71.5
## Max. :95.0
##
## Namorado_a Trabalha Desempenho Estresse
## Length:95 Length:95 Min. :5.820 Min. :12.00
## Class :character Class :character 1st Qu.:8.500 1st Qu.:22.50
## Mode :character Mode :character Median :8.700 Median :27.00
## Mean :8.594 Mean :27.82
## 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
Quarto passo é a criação das tabelas
tabela_trabalho <- table(Questionario_Estresse$Trabalha,
Questionario_Estresse$Turma)
tabela_trabalho
##
## 2007_2 2008_1 2008_2
## Nao 13 26 20
## Sim 15 6 15
tabela_pais <- table(Questionario_Estresse$Mora_pais,
Questionario_Estresse$Turma)
tabela_pais
##
## 2007_2 2008_1 2008_2
## Nao 16 19 16
## Sim 12 13 19
Sexto passo é a criação de gráfico de barras por turmas
COR <- c ("pink","purple")
barplot(tabela_trabalho, main = "Gráfico 1 - Trabalho por turma",
col = COR, horiz= FALSE, beside = TRUE,
legend = rownames(tabela_trabalho))

COR2 <- c ("orange","green")
barplot(tabela_pais, main = "Gráfico 2 - Moram no Brasil por turma",
col = COR2, horiz= FALSE, beside = TRUE,
legend = rownames(tabela_pais))

Conclusão
A criação das tabelas gira em torno das turmas. A intenção é descobrir a quantidade de alunos de cada turma que moram no país e a quantidade de alunos que trabalham. Através da tabela de proporção é possível ter uma dimensão em porcentagem.
Já o gráfico de barras demonstra de forma mais visual a mesma relação das tabelas com os que trabalham e os que moram no país, em cada uma das três turmas.
De acordo com os dados, no gráfico 2, a maioria dos alunos não moram no país nas turmas de 2007_2 e 2008_1, apenas na turma 2008_2 é que a maioria dos alunos moram no país. Em relação ao gráfico 1, em 2007_2 a maioria trabalhava mas a quantidade era quase que dividida, enquanto que em 2008_1 a grande maioria não trabalha. E em 2008_2 a maior parte ainda não trabalha mas em comparação com2008_1 o número de alunos que trabalhavam aumentou.