Cruzamento de duas variáveis quantitativas

Carregar e inspecionar base de dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Igor/Desktop/Base_de_dados-master/Questionario_Estresse.xls")

summary(Questionario_Estresse)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Diagrama de dispersão de duas variáveis quantitativas

par(bg="lightgreen")
par(cex=1.2)
plot(Questionario_Estresse$Horas_estudo, Questionario_Estresse$Estresse, pch=17, col = "purple",
     main = "Diagrama Dispersão \n Horas de Estudo x Estresse",
     ylab = "Estresse", xlab = "Horas de Estudo")
abline(lsfit(Questionario_Estresse$Horas_estudo, Questionario_Estresse$Estresse),col="purple")

Matriz de Correlação

names (Questionario_Estresse)
##  [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado_a"  
##  [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
selecao = c("Desempenho","Estresse")

cor_estresse = cor(Questionario_Estresse[,selecao])
cor_estresse
##            Desempenho   Estresse
## Desempenho 1.00000000 0.08257246
## Estresse   0.08257246 1.00000000
library(corrplot)
## corrplot 0.92 loaded
par(bg = "lightblue")
par(cex=0.6)
corrplot(cor_estresse, method="pie")

Conclusão

No primeiro gráfico podemos observar o cruzamento entre as variáveis horas de estudo e estresse, que nos mostra um gráfico com pouca ou nenhuma correlação, ou seja, uma Correlação Fraca.

Notamos no segundo gráfico que a associação entre as mesmas variáveis faz o valor ser igual 1, tornando-as semelhantes. No resultado da correlação entre Desempenho e Horas de estudo se deu o coeficiente 0.22, sendo uma correlação considerada fraca, ou seja, existe baixa ou nenhuma correlação entre desempenho e horas de estudo nesse caso.