Nessa atividade usei a base de dados “Questionario_Estresse.xlsx”, onde peguei uma variável qualitativa e representei seus dados em uma tabela, tabela de proporção e um gráfico de pizza. Abaixo todos os passos do processo:
Importar os dados do excel.
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Rica Meira/Desktop/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)
Identificar quais variáveis estão corretamente classificadas entre qualitativas e quantitativas.
str(Questionario_Estresse)
## tibble [95 x 10] (S3: tbl_df/tbl/data.frame)
## $ Aluno : num [1:95] 1 2 3 4 5 6 7 8 9 10 ...
## $ Turma : num [1:95] 1 1 1 1 1 1 1 1 1 1 ...
## $ Mora_pais : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ RJ : num [1:95] 2 1 2 2 2 2 2 1 1 1 ...
## $ Namorado_a : num [1:95] 2 2 2 1 2 1 2 1 2 2 ...
## $ Trabalha : num [1:95] 2 2 2 1 1 1 2 1 1 1 ...
## $ Desempenho : num [1:95] 8.89 8.8 8 8.8 8.9 8.1 9.2 8.5 8.7 8.3 ...
## $ Estresse : num [1:95] 23 24 25 38 41 25 41 20 26 36 ...
## $ Créditos : num [1:95] 27 28 25 21 18 29 26 24 20 49 ...
## $ Horas_estudo: num [1:95] 27 28 25 30 20 32 25 25 25 59 ...
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
Corrigir as variáveis que não foram corretamente classificadas.
Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==2,"Sim","Não")
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Min. :1.000 Length:95 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 Class :character 1st Qu.:1.000
## Median :48.0 Median :2.000 Mode :character Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.653
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000
##
## Namorado_a Trabalha Desempenho Estresse
## Min. :1.000 Min. :1.000 Min. :5.820 Min. :12.00
## 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50
## Median :2.000 Median :2.000 Median :8.700 Median :27.00
## Mean :1.505 Mean :1.621 Mean :8.594 Mean :27.82
## 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :2.000 Max. :2.000 Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
tabela_mp <- table(Questionario_Estresse$Mora_pais)
tabela_mp
##
## Não Sim
## 44 51
prop.table(tabela_mp)*100
##
## Não Sim
## 46.31579 53.68421
Interpretação do gráfico: O gráfico de pizza divide os dados em setores, o que deixa a visualização mais fácil. No gráfico abaixo temos a representação dos alunos que participaram da pesquisa, onde os mesmos responderam se moram ou não com os pais. O gráfico mostra que 46% não moram com os pais, já 54% moram com os pais.
pie(tabela_mp,col = c("gold","royalblue"),
main = "Os alunos moram com os pais?")