Para realizar a análise de uma variável qualitativa é necessário seguir os seguintes passos:
Aqui vamos adicionar os dados do excel
#--------------------------------
# primeiro passo - importacao de dados
#--------------------------------
# importar do excel
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/BibiPerigosa/Downloads/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)
Nesse momento vamos ver se o R classificou as variáveis corretamente.
#--------------------------------
# segundo passo - inspecionar dados
#--------------------------------
str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
## $ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
## $ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
## $ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
## $ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
## $ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
## $ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
## $ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
## $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
Aqui ocorre a correção dos problemas
#--------------------------------
# terceiro passo - transformacao de dados
#--------------------------------
Questionario_Estresse$Turma <- ifelse(Questionario_Estresse$Turma==1,"2007_2",
ifelse(Questionario_Estresse$Turma==2,"2008_1","2008_2"))
Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"sim","nao")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"Natural do RJ","natural de outras cidades")
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"sim","nao")
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"sim","nao")
Agora, olhar os dados novamente
#--------------------------------
# quarto passo - analise dos dados novamente
#--------------------------------
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Length:95 Length:95 Length:95
## 1st Qu.:24.5 Class :character Class :character Class :character
## Median :48.0 Mode :character Mode :character Mode :character
## Mean :48.0
## 3rd Qu.:71.5
## Max. :95.0
##
## Namorado_a Trabalha Desempenho Estresse
## Length:95 Length:95 Min. :5.820 Min. :12.00
## Class :character Class :character 1st Qu.:8.500 1st Qu.:22.50
## Mode :character Mode :character Median :8.700 Median :27.00
## Mean :8.594 Mean :27.82
## 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
Apresentação das tabelas
#--------------------------------
# quinto passo - tabelas para variavel qualitativa
#--------------------------------
tabela_turmas <- table(Questionario_Estresse$Turma)
tabela_turmas
##
## 2007_2 2008_1 2008_2
## 28 32 35
tabela_morapais <- table(Questionario_Estresse$Mora_pais)
tabela_morapais
##
## nao sim
## 51 44
tabela_namorando <- table(Questionario_Estresse$Namorado_a)
tabela_namorando
##
## nao sim
## 48 47
tabela_trabalha <- table(Questionario_Estresse$Trabalha)
tabela_trabalha
##
## nao sim
## 59 36
#--------------------------------
# quinto passo parte 2 - tabela com a proporcao
#--------------------------------
prop.table(tabela_turmas)*100
##
## 2007_2 2008_1 2008_2
## 29.47368 33.68421 36.84211
prop.table(tabela_morapais)*100
##
## nao sim
## 53.68421 46.31579
prop.table(tabela_namorando)*100
##
## nao sim
## 50.52632 49.47368
prop.table(tabela_trabalha)*100
##
## nao sim
## 62.10526 37.89474
Apresentação dos gráficos
#--------------------------------
# sexto passo - grafico de pizza
#--------------------------------
pie(tabela_turmas)
pie(tabela_turmas,main = "Turmas")
pie(tabela_turmas,col = c("#e31733","#a6293b","#750c1b"),
main = "Turmas")
pie(tabela_morapais)
pie(tabela_morapais,main = "Mora com os pais")
pie(tabela_morapais,col = c("#1c64eb","#244c96"),
main = "Mora com os pais")
pie(tabela_namorando)
pie(tabela_namorando,main = "Namorando")
pie(tabela_namorando,col = c("#529624","#68f20a"),
main = "Namorando")
pie(tabela_trabalha)
pie(tabela_trabalha, main = "Trabalha")
pie(tabela_trabalha,col = c("#ed9c5a","#b55405"),
main = "Namorando")
A partir dos gráficos e tabelas apresentadas é possível observar que a maioria (cerca de 36%) dos alunos da pesquisa é da turma 2008_2, a turma 2007_2 tem cerca de 29% dos alunos totais e a turma 2008_1, aproximadamente 33%. Com o gráfico “Morando com os pais”, 53% dos alunos afirmam que não moram e 46% que sim. Já com o gráfico “Namorando”, 50% dos alunos estão solteiros e 49% dos alunos são comprometidos. E com o gráfico “Trabalha” entende-se que 50% dos alunos que responderam o questionário não trabalha e 49% trabalha.