Passo 1 - carregar base de dados
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/clara/OneDrive/Documentos/basededados/Questionario_Estresse.xls",
sheet = "Dados")
View(Questionario_Estresse)
Passo 2 - conferir dados
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ Namorado_a
## Min. : 1.0 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:24.5 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :48.0 Median :2.000 Median :2.000 Median :2.000 Median :2.000
## Mean :48.0 Mean :2.074 Mean :1.537 Mean :1.653 Mean :1.505
## 3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :95.0 Max. :3.000 Max. :2.000 Max. :2.000 Max. :2.000
##
## Trabalha Desempenho Estresse Créditos
## Min. :1.000 Min. :5.820 Min. :12.00 Min. :15.00
## 1st Qu.:1.000 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
## Median :2.000 Median :8.700 Median :27.00 Median :24.00
## Mean :1.621 Mean :8.594 Mean :27.82 Mean :24.95
## 3rd Qu.:2.000 3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :2.000 Max. :9.700 Max. :44.00 Max. :49.00
## NA's :1
## Horas_estudo
## Min. :19.00
## 1st Qu.:25.00
## Median :30.00
## Mean :30.73
## 3rd Qu.:35.00
## Max. :60.00
##
Passo 3 - visualização de dados
Diagrama de dispersão - para duas variáveis quantitativas
par(bg="snow")
par(cex=1.0)
plot(Questionario_Estresse$Desempenho, Questionario_Estresse$Horas_estudo, pch=16, col="pink",
main = "Gráfico 1 - diagrama de dispersão entre desempenho e horas de estudo",
ylab = "Horas de estudo", xlab = "Desempenho")
abline(lsfit(Questionario_Estresse$Desempenho, Questionario_Estresse$Horas_estudo), col="red")

Passo 4 - matriz de correlação de duas variáveis quantitativas
cor(Questionario_Estresse$Desempenho, Questionario_Estresse$Horas_estudo)
## [1] 0.2231532
Passo 5 - interpretação de dados
No passo 1, foi realizado o carregamento da base de dados através do Import Dataset, pois a base de dados veio do Excel. No passo 2, foi preciso verificar os dados para saber se precisava de alguma correção. Como possuia mais de duas variáveis quantitativas, não foi necessário. No passo 3, criei o primeiro diagrama de dispersão. E no passo 4, a matriz de correlação de duas variáveis quantitativas.
No passo 3, pode-se perceber uma leve relação entre mais horas de estudo e maior desempenho. A partir do 4 passo, é possível identificar que o gráfico representa o coeficiente de correlação de 0,2231532 e por isso, a correlação é fraca positiva.