Foi realizada uma análise das respostas à pergunta “Mora com os pais?” em que as respostas possíveis eram “Sim” ou “Não”.
As etapas que constituíram a análise foram:
1 - Carregar a base de dados;
2 - Corrigir a variável para qualitativa;
3 - Modificar a forma como os dados são apresentados, por meio da função ifelse para melhorar o entendimento do gráfico;
4 - Visualizar o gráfico de barras;
5 - Criar tabela;
6 - Conclusões sobre a variável.
library(readxl)
Questionario_Estresse <- read_excel("Questionario_Estresse.xls",
sheet = "Dados")
Questionario_Estresse$Mora_pais <- as.factor(Questionario_Estresse$Mora_pais)
Questionario_Estresse$Mora_pais<- ifelse(Questionario_Estresse$Mora_pais=="1","Sim","Não")
table(Questionario_Estresse$Mora_pais)
##
## Não Sim
## 51 44
barplot(table(Questionario_Estresse$Mora_pais),
col=c("#f70505","#05f018"),
horiz = TRUE,
main = "Mora com os pais?")
prop.table(table(Questionario_Estresse$Mora_pais))*100
##
## Não Sim
## 53.68421 46.31579
A partir do gráfico de barras é possível concluir que 44 alunos responderam que moram com os pais e 51 que não moram com os pais. Logo, 46.32% dos alunos moram com os pais e 53.68% não moram.
Foi elaborado um histograma para analisar as notas dos respondentes da pesquisa. A pergunta era: “Nota média estimada até o momento (valor de 0 a 10)”. Pelo formato do histograma é possível concluir que a distribuição é assimétrica.
Mais de 30 alunos possuem notas entre 8.5 e 9.0 e este intervalo é a moda da observação. Após a elaboração do histograma, foram calculadas a média e a mediana dos valores e verificados os valores mínimo e máximo das notas.
Média: 8.593789
Mediana: 8.7
Menor nota: 5.82
Maior nota: 9.7
hist(Questionario_Estresse$Desempenho,
col = "#0b0fe0",
main = "Histograma \n Desempenho",
breaks = 6,
xlim = c(5,10),
)
mean(Questionario_Estresse$Desempenho)
## [1] 8.593789
median(Questionario_Estresse$Desempenho)
## [1] 8.7
min(Questionario_Estresse$Desempenho)
## [1] 5.82
max(Questionario_Estresse$Desempenho)
## [1] 9.7
Foi gerado um boxplot com os dados sobre o número de horas de estudo.
Observando o boxplot é possível concluir que:
1 - A mediana, expressa pela linha central, é 30.
2 - A variância e a amplitude são pequenas.
3 - A variável Horas_estudo tem dois outliers.
boxplot(Questionario_Estresse$Horas_estudo, col="red", main="Horas de Estudo")
Por meio da análise da base de dados Questionario_Estresse, conclui-se que:
1 - A maioria dos alunos não mora com os pais.
2 - Os alunos apresentam, em sua maioria, bom desempenho.
3 - A variável Horas_estudo possui dois outliers, o que representa que dois alunos estudam muito mais horas que o restante da amostra.