Passo 1 - carregar base de dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/clara/OneDrive/Documentos/basededados/Questionario_Estresse.xls", 
                                    sheet = "Dados")
View(Questionario_Estresse)

Passo 2 - conferir dados

summary(Questionario_Estresse)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Passo 3 - visualização de dados

Diagrama de dispersão - para duas variáveis quantitativas

par(bg="snow")
par(cex=1.0)
plot(Questionario_Estresse$Desempenho, Questionario_Estresse$Horas_estudo, pch=16, col="pink",
     main = "Gráfico 1 - diagrama de dispersão entre desempenho e horas de estudo",
     ylab = "Horas de estudo", xlab = "Desempenho")
abline(lsfit(Questionario_Estresse$Desempenho, Questionario_Estresse$Horas_estudo), col="red")

Passo 4 - matriz de correlação de duas variáveis quantitativas

cor(Questionario_Estresse$Desempenho, Questionario_Estresse$Horas_estudo)
## [1] 0.2231532

Passo 5 - interpretação de dados

No passo 1, foi realizado o carregamento da base de dados através do Import Dataset, pois a base de dados veio do Excel. No passo 2, foi preciso verificar os dados para saber se precisava de alguma correção. Como possuia mais de duas variáveis quantitativas, não foi necessário. No passo 3, criei o primeiro diagrama de dispersão. E no passo 4, a matriz de correlação de duas variáveis quantitativas.

No passo 3, pode-se perceber uma leve relação entre mais horas de estudo e maior desempenho. A partir do 4 passo, é possível identificar que o gráfico representa o coeficiente de correlação de 0,2231532 e por isso, a correlação é fraca positiva.