Nesse trabalho irei colocar meus aprendizados da segunda aula de estatística. A base de dados a ser utilizada e analisada é o “Questionário Estresse”, na seguinte ordem:
*Em ambos os gráficos será utilizada uma variável qualitativa nominal.
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Maria Clara Queiroz/Downloads/Questionario_Estresse.xls",
sheet = "Dados")
View(Questionario_Estresse)
Nesse trabalho irei colocar meus aprendizados da segunda aula de estatística. A base de dados a ser utilizada e analisada é o “Questionário Estresse”, na seguinte ordem:
*Em ambos os gráficos será utilizada uma variável qualitativa nominal.
Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais==1,"Sim","Não")
Questionario_Estresse$RJ <- ifelse(Questionario_Estresse$RJ==1,"Natural do RJ","Natural de outras cidades")
Questionario_Estresse$Namorado_a <- ifelse(Questionario_Estresse$Namorado_a==1,"Sim","Não")
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha==1,"Sim","Não")
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Min. :1.000 Length:95 Length:95
## 1st Qu.:24.5 1st Qu.:1.000 Class :character Class :character
## Median :48.0 Median :2.000 Mode :character Mode :character
## Mean :48.0 Mean :2.074
## 3rd Qu.:71.5 3rd Qu.:3.000
## Max. :95.0 Max. :3.000
##
## Namorado_a Trabalha Desempenho Estresse
## Length:95 Length:95 Min. :5.820 Min. :12.00
## Class :character Class :character 1st Qu.:8.500 1st Qu.:22.50
## Mode :character Mode :character Median :8.700 Median :27.00
## Mean :8.594 Mean :27.82
## 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
tabela_turma <- table(Questionario_Estresse$Turma)
tabela_turma
##
## 1 2 3
## 28 32 35
tabela_pais <- table(Questionario_Estresse$Mora_pais)
tabela_pais
##
## Não Sim
## 51 44
tabela_RJ <- table(Questionario_Estresse$RJ)
tabela_RJ
##
## Natural de outras cidades Natural do RJ
## 62 33
tabela_nam <- table(Questionario_Estresse$Namorado_a)
tabela_nam
##
## Não Sim
## 48 47
tabela_trab <- table(Questionario_Estresse$Trabalha)
tabela_trab
##
## Não Sim
## 59 36
tabela_desemp <- table(Questionario_Estresse$Desempenho)
tabela_desemp
##
## 5.82 5.9 6 6.5 6.6 7 7.5 7.7 7.8 8 8.1 8.2 8.3 8.4 8.48 8.5
## 1 1 1 1 1 2 1 1 1 5 2 1 2 2 1 14
## 8.53 8.55 8.6 8.64 8.7 8.79 8.8 8.82 8.89 8.9 8.94 8.96 9 9.03 9.07 9.08
## 1 1 4 1 4 1 8 1 2 3 1 1 5 1 1 1
## 9.09 9.1 9.12 9.2 9.29 9.3 9.33 9.36 9.39 9.4 9.44 9.45 9.5 9.6 9.7
## 1 1 1 2 2 2 1 2 1 3 1 1 1 2 1
tabela_estresse <- table(Questionario_Estresse$Estresse)
tabela_estresse
##
## 12 13 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
## 1 2 1 3 3 1 1 5 5 2 3 4 6 8 3 2 4 6 5 4 5 3 3 1 3 3
## 39 40 41 42 44
## 1 1 2 2 2
tabela_creditos <- table(Questionario_Estresse$Créditos)
tabela_creditos
##
## 15 17 18 19 20 21 23 24 25 26 27 28 29 30 32 49
## 1 1 1 1 11 2 9 24 2 10 10 14 2 4 1 1
tabela_horas <- table(Questionario_Estresse$Horas_estudo)
tabela_horas
##
## 19 20 21 23 24 25 26 27 28 29 30 32 33 34 35 36 40 44 59 60
## 1 6 1 2 6 9 4 1 6 4 18 5 6 1 6 6 8 3 1 1
# Proporção da quantidade de alunos na turma
prop.table(tabela_turma)*100
##
## 1 2 3
## 29.47368 33.68421 36.84211
# Proporção da quantidade de alunos que moram com os pais
prop.table(tabela_pais)*100
##
## Não Sim
## 53.68421 46.31579
# Proporção da quantidade de alunos que são naturais do Rio de Janeiro ou de outras cidades
prop.table(tabela_RJ)*100
##
## Natural de outras cidades Natural do RJ
## 65.26316 34.73684
# Proporção da quantidade de alunos que namoram
prop.table(tabela_nam)*100
##
## Não Sim
## 50.52632 49.47368
# Proporção da quantidade de alunos que trabalham
prop.table(tabela_trab)*100
##
## Não Sim
## 62.10526 37.89474
# Proporção do desempenho
prop.table(tabela_desemp)*100
##
## 5.82 5.9 6 6.5 6.6 7 7.5 7.7
## 1.052632 1.052632 1.052632 1.052632 1.052632 2.105263 1.052632 1.052632
## 7.8 8 8.1 8.2 8.3 8.4 8.48 8.5
## 1.052632 5.263158 2.105263 1.052632 2.105263 2.105263 1.052632 14.736842
## 8.53 8.55 8.6 8.64 8.7 8.79 8.8 8.82
## 1.052632 1.052632 4.210526 1.052632 4.210526 1.052632 8.421053 1.052632
## 8.89 8.9 8.94 8.96 9 9.03 9.07 9.08
## 2.105263 3.157895 1.052632 1.052632 5.263158 1.052632 1.052632 1.052632
## 9.09 9.1 9.12 9.2 9.29 9.3 9.33 9.36
## 1.052632 1.052632 1.052632 2.105263 2.105263 2.105263 1.052632 2.105263
## 9.39 9.4 9.44 9.45 9.5 9.6 9.7
## 1.052632 3.157895 1.052632 1.052632 1.052632 2.105263 1.052632
# Proporção dos níveis de estresse
prop.table(tabela_estresse)*100
##
## 12 13 15 16 17 18 19 20
## 1.052632 2.105263 1.052632 3.157895 3.157895 1.052632 1.052632 5.263158
## 21 22 23 24 25 26 27 28
## 5.263158 2.105263 3.157895 4.210526 6.315789 8.421053 3.157895 2.105263
## 29 30 31 32 33 34 35 36
## 4.210526 6.315789 5.263158 4.210526 5.263158 3.157895 3.157895 1.052632
## 37 38 39 40 41 42 44
## 3.157895 3.157895 1.052632 1.052632 2.105263 2.105263 2.105263
# Proporção da quantidade de créditos
prop.table(tabela_creditos)*100
##
## 15 17 18 19 20 21 23 24
## 1.063830 1.063830 1.063830 1.063830 11.702128 2.127660 9.574468 25.531915
## 25 26 27 28 29 30 32 49
## 2.127660 10.638298 10.638298 14.893617 2.127660 4.255319 1.063830 1.063830
# Proporção de horas de estudo
prop.table(tabela_horas)*100
##
## 19 20 21 23 24 25 26 27
## 1.052632 6.315789 1.052632 2.105263 6.315789 9.473684 4.210526 1.052632
## 28 29 30 32 33 34 35 36
## 6.315789 4.210526 18.947368 5.263158 6.315789 1.052632 6.315789 6.315789
## 40 44 59 60
## 8.421053 3.157895 1.052632 1.052632
#### Gráfico das turmas
pie(tabela_turma, col=c("lightpink", "violet", "lightblue"))
pie(tabela_pais, col = c("salmon", "lightgreen"))
pie(tabela_RJ, col = c("lightcoral", "cyan2"))
pie(tabela_nam, col=c("grey50", "red2"))
pie(tabela_trab, col = c("steelblue2", "springgreen3"))
não foram utulizadas no gráfico pizza, devido à quantidade de dados que deixavam a leitura confusa.
O gráfico de barras é mais adequado para demonstrar as variáveis: “Desempenho”, “Estresse”, “Créditos” e “Horas de Estudo”.
#### Desempenho
barplot(tabela_desemp, main = "Desempenho", ylab = "Número de alunos", xlab = "Notas", col = c("violetred2"))
help("barplot")
## starting httpd help server ... done
#### Estresse
barplot(tabela_estresse, main = "Níveis de estresse", ylab = "Número de alunos", xlab = "Níveis de estresse", col = c("tomato2"))
#### Créditos
barplot(tabela_creditos, main = "Créditos", ylab = "Número de alunos", xlab = "Número de créditos", col = c("mistyrose"))
#### Horas de estudo semanais
barplot(tabela_horas, main = "Horas de estudo semanais", ylab = "Número de alunos", xlab = "Horas por semana", col = c("yellow"))
Mas também é possível utilizar o gráfico em barras com as variáveis que usamos no gráfico de pizza anteriormente:
#### Turmas
barplot(tabela_turma, main = "Quantidade de alunos em cada turma", ylab = "Número de alunos", col = c("turquoise"))
#### Alunos que moram com os pais
barplot(tabela_pais, main = "Alunos que moram com os pais", ylab = "Número de alunos", col = c("tan"))
#### Onde foram naturalizados
barplot(tabela_RJ, main = "Em qual cidade os alunos foram naturalizados?", ylab = "Número de alunos", col = c("plum1", "plum3"))
#### Namoram
barplot(tabela_nam, main = "Quantidade de alunos que namoram", ylab = "Número de alunos", col = c("rosybrown2", "red2"))
#### Trabalham
barplot(tabela_trab, main = "Quantidade de alunos que trabalham", ylab = "Número de alunos", col = c("khaki4", "lightgreen"))
A partir da observação e análise das tabelas foi possível perceber que os 95 alunos da pesquisa foram divididos entre três turmas, a 1, 2 e 3, cada uma com aproximadamente 29%, 33% e 36% respectivamente, e mais da metade dos alunos não mora com os pais.
A maior diferença identificada entre os alunos é que quase ⅔ do total de alunos é natural de outras cidades que não são o Rio de Janeiro. E os números mais aproximados encontrados foram em relação ao namoro, que não empatou apenas por uma pessoa, vencendo em quantidade as pessoas que não namoram.
Já no tópico do desempenho, apenas 10 dos 95 alunos obtiveram uma nota menor que 8,0, a nota mais recorrente foi 8,5, a menor foi 5,8 e a maior 9,7. As horas gastas por semana dedicadas ao estudo vão de 19 a 60, e a quantidade de horas mais recorrente para a dedicação aos estudos é de 30 horas semanais, os quais aproximadamente 18% dos alunos responderam essa carga, que dá por volta de 4 horas por dia. E a partir desses dados é possível deduzir que a maioria dos alunos são dedicados, devido às suas notas e às horas de estudo semanais.
Sobre o número de créditos, a menor quantidade registrada foram de 15 e a maior de 49, e o mais comum - que é ainda mais perceptível no gráfico de barras - foi pegar mais de 20 créditos, sendo 24 créditos o número mais frequente. E dos níveis de estresse o mais baixo foi de 12 e o mais alto de 44, sendo o mais recorrente o nível 26, que está acima da média obtida (27).
Em relação às análises, as variáveis com poucos resultados são preferíveis de serem observadas utilizando o gráfico de pizza. Já as variáveis com muitos resultados tanto a tabela quanto o gráfico de barras são uma excelente opção (a tabela é melhor quando se é necessário analisar os valores exatos, como os de desempenho).