Carregar dados

Neste relatório,foram analisadas variáveis contidas na base de dados “Questionario_Estresse”, a qual reúne a resposta de 95 alunos sobre um questionário para avaliar o estresse. Para isso, inicialmente foi necessário carregar os dados da sheet “Dados” do arquivo no formato .xls, para o ambiente do R.

library(readxl)
Questionario_Estresse <- read_excel("Questionario_Estresse.xls", 
                                    sheet = "Dados")

Gráfico para duas variáveis qualitativas: mosaic

Foram analisadas as duas variáveis qualitativas Trabalha e Mora_pais e elaborado um gráfico mosaic para visualização dos dados em conjunto. A cor verde indica o número de respondentes que mora com os pais e a cor azul, aqueles que não moram com os pais.

Questionario_Estresse$Trabalha <- ifelse(Questionario_Estresse$Trabalha == 1, "Trabalha","Não trabalha")
Questionario_Estresse$Mora_pais <- ifelse(Questionario_Estresse$Mora_pais == 1, "Mora com os pais","Não mora com os pais")
mosaicplot(~Trabalha +Mora_pais, data = Questionario_Estresse, color=c("lightgreen","skyblue"))

Conclusão

Por meio do gráfico, é possível concluir que:
- A maior parte não mora com os pais.
- A maior parte não trabalha.
- O número de alunos que trabalham e moram com os pais é bem parecida com a que trabalha e não mora com os pais, de maneira que apenas analisando o gráfico não se pode afirmar qual das duas porcentagens é maior.
- A maior parte total dos alunos não trabalha e não mora com os pais.

Tabelas com duas variáveis categóricas

Para uma melhor compreensão dos dados e do gráfico mosaic acima, foram elaboradas tabelas com as duas variáveis qualitativas Trabalha e Mora_pais. Foi criada uma tabela e em seguida utilizou-se o comando prop.table para gerar as tabelas.

Tabela 1

A primeira tabela relaciona as porcentagens das duas variáveis em conjunto.Assim:
- 28% do total de 95 alunos mora com os pais e não trabalha.
- 18% do total de 95 alunos mora com os pais e trabalha.
- 34% do total de 95 alunos não mora com os pais e não trabalha.
- 20% do total de 95 alunos não mora com os pais e trabalha.

tabela1<-table(Questionario_Estresse$Trabalha, Questionario_Estresse$Mora_pais)

prop.table(tabela1)*100
              
               Mora com os pais Não mora com os pais
  Não trabalha               28                   34
  Trabalha                   18                   20

Tabela 2

A segunda tabela relaciona as porcentagens das duas variáveis por linha, ou seja, avalia os dados separadamente sobre aqueles que trabalham e aqueles que não trabalham. Assim:
- 46% dos que não trabalham, moram com os pais.
- 54% dos que não trabalham, não moram com os pais.
- 47% dos que trabalham, moram com os pais.
- 53% dos que trabalham, não moram com os pais.

prop.table(tabela1,1)*100
              
               Mora com os pais Não mora com os pais
  Não trabalha               46                   54
  Trabalha                   47                   53

Tabela 3

A terceira tabela relaciona as porcentagens das duas variáveis por coluna, ou seja, avalia os dados separadamente sobre aqueles que moram e aqueles que não moram com os pais. Assim:
- 61% dos que moram com os pais, não trabalham.
- 39% dos que moram com os pais, trabalham.
- 63% dos que não moram com os pais, não trabalham.
- 37% dos que não moram com os pais, trabalham.

prop.table(tabela1,2)*100
              
               Mora com os pais Não mora com os pais
  Não trabalha               61                   63
  Trabalha                   39                   37

Conclusão

Em resumo, as conclusões obtidas por meio das tabelas 2 e 3 são:
- A maior parte dos que não trabalham, não moram com os pais.
- A maior parte dos que trabalham, não moram com os pais.
- A maior parte dos que moram com os pais, não trabalham.
- A maior parte dos que não moram com os pais, não trabalham.

A avaliação das variáveis em separado confirmam a observação em conjunto das duas variáveis na amostra total apresentada na tabela 1, a qual foi: a maior parte dos 95 entrevistados não mora com os pais e não trabalha.

Variáveis quantitativas

Foram analisadas as duas variáveis quantitativas Horas_estudo e Estresse.

Diagrama de Dispersão

O Diagrama de Dispersão possibilita a visualização do conjunto de dados simultaneamente. No eixo x estão os valores de Horas_estudo e no eixo y, os valores de Estresse. Por meio do comando abline foi criada uma linha de tendência.

plot(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Estresse, pch=19, col="purple")
#criar linha de tendência
abline(lm(Estresse~Horas_estudo, data=Questionario_Estresse), col="red", lty=5)

Conclusão

Por meio do gráfico, é possível concluir que:

  • As variáveis Horas_estudo e Estresse têm padrão de correlação linear positiva e com grau fraco de associação.
  • Uma função linear não é o melhor ajuste para os dados, pois a forma que os pontos estão distribuídos no plano cartesiano não se assemelham a uma reta.
  • Há pessoas que estudam poucas horas e possuem alto nível de estresse; que estudam muitas horas e têm alto nível de estresse e que estudam poucas horas e possuem baixo nível de estresse.Entretanto, quem estuda muitas horas tende a ter nível maior de estresse (aqueles que estudam muitas horas não tem baixo nível de estresse).

Matriz de correlação

A matriz de correlação analítica permite a visualização gráfica e do valor numérico do coeficiente de correlação entre variáveis. Foi avaliada a correlação entre as variáveis Horas_estudo, Estresse e Desempenho.

library(corrplot)
MC <-cor(Questionario_Estresse[,c("Horas_estudo","Estresse","Desempenho")])
corrplot.mixed(MC)

Conclusão

A partir da matriz de correlação é possível concluir que:
- A correlação entre Horas_estudo e Estresse é r= 0,3 e possui grau fraco de associação (0,25 < r < 0,5 grau fraco de associação).
- A correlação entre Horas_estudo e Desempenho é r= 0,22 e possui baixa associação (0 < r < 0,25 baixa ou nenhuma associação).
- A correlação entre Estresse e Desempenho é r= 0,08 e possui baixa ou nenhuma associação (0 < r < 0,25 baixa ou nenhuma associação).