O presente relatório visa analisar dois tipos de variáveis presentes na base de dados “Questionario_Estresse”. A primeira análise será realizada com duas variáveis qualitativa (Mora com os Pais e Natural do Rio de Janeiro). Será avaliada a relação do aluno morar com os pais e ser natural do Rio de Janeiro. A segunda análise será realizada com três variáveis quantitativas (Desempenho, Horas de estudo e Estresse). Será avaliada a relação do desempenho do aluno com as horas de estudo empregadas em seu dia a dia e o estresse gerado.
Sendo possível observar que a maioria dos alunos não mora com os pais (54%).
Foram analisadas duas variáveis qualitativas Mora com os pais natural do Rio de Janeiro. Ao elaborar o gráfico, foi possível observar que a cor cinza compoem a parcela dos alunos que mora com os pais e a cor rosa compoem a parcela de alunos que não moram com os pais.
Questionario_Estresse$Mora_pais = ifelse(Questionario_Estresse$Mora_pais=="1",
"Sim","Não")
Questionario_Estresse$RJ = ifelse(Questionario_Estresse$RJ=="1",
"Natural do RJ","Natural de outras cidades")
tabela1=table(Questionario_Estresse$RJ , Questionario_Estresse$Mora_pais)
mosaicplot(~ RJ+Mora_pais, data = Questionario_Estresse, color=c("gray","pink"),main="Mora com os pais por Natural do RJ")## barplot
tabela <- table(Questionario_Estresse$Mora_pais, Questionario_Estresse$RJ) ## get the cross tab
barplot(tabela, beside = TRUE, legend = levels(unique(Questionario_Estresse$RJ)),main="Mora com os pais por Natural do RJ",col=c("gray","pink")) ##plotAtravés dos referidos gráficos é possível observar que a maioria dos alunos, naturais do RJ, moram com os pais e a maioria dos alunos que são de outros estados não moram com os pais.
Foram elaboradas 3 tabelas com as duas variáveis qualitativas Mora com os pais e Natural do Rio de Janeiro.
Natural de outras cidades Natural do RJ
Não 50.5 3.2
Sim 14.7 31.6
A tabela 1 relaciona a porcentagem entre as duas variáveis (Mora com os pais e Natural do Rio)
Natural de outras cidades Natural do RJ
Não 0.941 0.059
Sim 0.318 0.682
A tabela 2 faz uma relação entre as porcentagens das duas variáveis por linha.
Natural de outras cidades Natural do RJ
Não 0.774 0.091
Sim 0.226 0.909
A tabela 3 faz uma relação entre as porcentagens das duas variáveis por coluna.
Pôde-se concluir que a maioria dos alunos não moram com os pais e não são naturais do RJ.
#--------------------------------------------------------------------------------------------------------------------
# Duas variáveis quantitativas
#--------------------------------------------------------------------------------------------------------------------
plot(Questionario_Estresse$Desempenho,Questionario_Estresse$Horas_estudo, pch=20, col = "pink", main = "Diagrama de dispersão entre Desempenho e Horas de estudo")
abline(lm(Horas_estudo~Desempenho,data=Questionario_Estresse), col = "black", lty=4)plot(Questionario_Estresse$Desempenho,Questionario_Estresse$Estresse, pch=20, col = "purple", main = "Diagrama de dispersão entre Desempenho e Estresse")
abline(lm(Estresse~Desempenho,data=Questionario_Estresse), col = "black", lty=4)plot(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Estresse, pch=20, col = "orange", main = "Diagrama de Horas de estudo e Estresse")
abline(lm(Estresse~Horas_estudo,data=Questionario_Estresse), col = "black", lty=4)correlacoes = cor(Questionario_Estresse[,c("Horas_estudo","Desempenho","Estresse")])
# correlacoes
library(corrplot)
corrplot(correlacoes, method="number")Conclui-se que todas as correlações observadas são positivas, porém há pouca relação entre cada uma das variáveis.Todas as matrizes de correlações possuem outliers, evidenciando assim a baixa correlação entre elas.