Neste relatório,foram analisadas variáveis contidas na base de dados “Questionario_Estresse”, a qual reúne a resposta de 95 alunos sobre um questionário para avaliar o estresse. Para isso, inicialmente foi necessário carregar os dados da sheet “Dados” do arquivo no formato .xls, para o ambiente do R.
library(readxl)
Questionario_Estresse <- read_excel("Questionario_Estresse.xls",
sheet = "Dados")
Foram analisadas as duas variáveis qualitativas Trabalha e Mora_pais e elaborado um gráfico mosaic para visualização dos dados em conjunto. A cor verde indica o número de respondentes que mora com os pais e a cor azul, aqueles que não moram com os pais.
Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha == 1, "Trabalha","Não trabalha")
Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais == 1, "Mora com os pais","Não mora com os pais")
mosaicplot(~Trabalha +Mora_pais, data = Questionario_Estresse, color=c("lightgreen","skyblue"))
Por meio do gráfico, é possível concluir que:
- A maior parte não mora com os pais.
- A maior parte não trabalha.
- O número de alunos que trabalham e moram com os pais é bem parecida com a que trabalha e não mora com os pais, de maneira que apenas analisando o gráfico não se pode afirmar qual das duas porcentagens é maior.
- A maior parte total dos alunos não trabalha e não mora com os pais.
Para uma melhor compreensão dos dados e do gráfico mosaic acima, foram elaboradas tabelas com as duas variáveis qualitativas Trabalha e Mora_pais. Foi criada uma tabela e em seguida utilizou-se o comando prop.table para gerar as tabelas.
A primeira tabela relaciona as porcentagens das duas variáveis em conjunto.Assim:
- 28% do total de 95 alunos mora com os pais e não trabalha.
- 18% do total de 95 alunos mora com os pais e trabalha.
- 34% do total de 95 alunos não mora com os pais e não trabalha.
- 20% do total de 95 alunos não mora com os pais e trabalha.
tabela1<-table(Questionario_Estresse$Trabalha, Questionario_Estresse$Mora_pais)
prop.table(tabela1)*100
Mora com os pais Não mora com os pais
Não trabalha 28 34
Trabalha 18 20
A segunda tabela relaciona as porcentagens das duas variáveis por linha, ou seja, avalia os dados separadamente sobre aqueles que trabalham e aqueles que não trabalham. Assim:
- 46% dos que não trabalham, moram com os pais.
- 54% dos que não trabalham, não moram com os pais.
- 47% dos que trabalham, moram com os pais.
- 53% dos que trabalham, não moram com os pais.
prop.table(tabela1,1)*100
Mora com os pais Não mora com os pais
Não trabalha 46 54
Trabalha 47 53
A terceira tabela relaciona as porcentagens das duas variáveis por coluna, ou seja, avalia os dados separadamente sobre aqueles que moram e aqueles que não moram com os pais. Assim:
- 61% dos que moram com os pais, não trabalham.
- 39% dos que moram com os pais, trabalham.
- 63% dos que não moram com os pais, não trabalham.
- 37% dos que não moram com os pais, trabalham.
prop.table(tabela1,2)*100
Mora com os pais Não mora com os pais
Não trabalha 61 63
Trabalha 39 37
Em resumo, as conclusões obtidas por meio das tabelas 2 e 3 são:
- A maior parte dos que não trabalham, não moram com os pais.
- A maior parte dos que trabalham, não moram com os pais.
- A maior parte dos que moram com os pais, não trabalham.
- A maior parte dos que não moram com os pais, não trabalham.
A avaliação das variáveis em separado confirmam a observação em conjunto das duas variáveis na amostra total apresentada na tabela 1, a qual foi: a maior parte dos 95 entrevistados não mora com os pais e não trabalha.
Foram analisadas as duas variáveis quantitativas Horas_estudo e Estresse.
O Diagrama de Dispersão possibilita a visualização do conjunto de dados simultaneamente. No eixo x estão os valores de Horas_estudo e no eixo y, os valores de Estresse. Por meio do comando abline foi criada uma linha de tendência.
plot(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Estresse, pch=19, col="purple")
#criar linha de tendência
abline(lm(Estresse~Horas_estudo, data=Questionario_Estresse), col="red", lty=5)
Por meio do gráfico, é possível concluir que:
A matriz de correlação analítica permite a visualização gráfica e do valor numérico do coeficiente de correlação entre variáveis. Foi avaliada a correlação entre as variáveis Horas_estudo, Estresse e Desempenho.
library(corrplot)
MC <-cor(Questionario_Estresse[,c("Horas_estudo","Estresse","Desempenho")])
corrplot.mixed(MC)
A partir da matriz de correlação é possível concluir que:
- A correlação entre Horas_estudo e Estresse é r= 0,3 e possui grau fraco de associação (0,25 < r < 0,5 grau fraco de associação).
- A correlação entre Horas_estudo e Desempenho é r= 0,22 e possui baixa associação (0 < r < 0,25 baixa ou nenhuma associação).
- A correlação entre Estresse e Desempenho é r= 0,08 e possui baixa ou nenhuma associação (0 < r < 0,25 baixa ou nenhuma associação).