Passo 01 - Carregamento

Aqui vou carregar as bibliotecas e a base de dados escolhida para a realização da atividade:

# PASSO 00 - Carregar bibliotecas
library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
library(corrplot)
corrplot 0.90 loaded
# PASSO 01 - Importação das Bases de Dados
library(readxl)
Quest <- read_excel("C:/Users/Samsung/Desktop/01_ Pedro Henrique Miceli/01_ Escolaridade/07_ UNIRIO/02_ UNIRIO 2021.1/05_ TME0018_ Estatistica ACS/00 - Base de dados/Questionario_Estresse.xls")
head(Quest)
# A tibble: 6 x 10
  Aluno Turma Mora_pais    RJ Namorado_a Trabalha Desempenho Estresse Créditos
  <dbl> <dbl>     <dbl> <dbl>      <dbl>    <dbl>      <dbl>    <dbl>    <dbl>
1     1     1         2     2          2        2       8.89       23       27
2     2     1         1     1          2        2       8.8        24       28
3     3     1         2     2          2        2       8          25       25
4     4     1         2     2          1        1       8.8        38       21
5     5     1         2     2          2        1       8.9        41       18
6     6     1         2     2          1        1       8.1        25       29
# ... with 1 more variable: Horas_estudo <dbl>

Passo 02 - Diagramas

Aqui, vou realizar os diagramas de 3 variáveis quantitativas, escolhidas para saber qual desses será utilizado:

# PASSO 02 - Diagrama de Dispersão - De duas variáveis quantitativas
names(Quest)
 [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado_a"  
 [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
par(bg="darkgray")
plot(Quest$Estresse, Quest$Desempenho, pch=19,col="yellow", main = "Gráfico 01", ylab = "Desempenho", xlab = "Estresse")
abline(lsfit(Quest$Estresse, Quest$Desempenho), col="darkgreen")

par(bg="darkgray")
plot(Quest$Estresse, Quest$Horas_estudo, pch=19,col="yellow", main = "Gráfico 02", ylab = "Horas de Estudo", xlab = "Estresse")
abline(lsfit(Quest$Estresse, Quest$Horas_estudo), col="darkgreen")

par(bg="darkgray")
plot(Quest$Desempenho, Quest$Horas_estudo, pch=19,col="yellow", main = "Gráfico 03", ylab = "Horas de Estudo", xlab = "Desempenho")
abline(lsfit(Quest$Desempenho, Quest$Horas_estudo), col="darkgreen")

Passo 03 - Correlação

Aqui vou realizar a correlação das variáveis quantitativas escolhidas:

# PASSO 03 - Correlações das Variáveis
par(bg="darkgray")
plot(Quest$Desempenho, Quest$Horas_estudo, pch=19,col="yellow", main = "Gráfico 03", ylab = "Horas de Estudo", xlab = "Desempenho")
abline(lsfit(Quest$Desempenho, Quest$Horas_estudo), col="darkgreen")

cor(Quest$Desempenho, Quest$Horas_estudo)   # Correlação Linear Positiva Baixa  (= 0,22)
[1] 0.2231532
cor(Quest$Estresse, Quest$Desempenho)       # Correlação Linear Positiva Baixa  (= 0,08)
[1] 0.08257246
cor(Quest$Estresse, Quest$Horas_estudo)     # Correlação Linear Positiva Fraco  (= 0,30)
[1] 0.303917

Passo 04 - Matriz de Correlação

Nesse penúltimo passo, realizei duas matrizes de correlaçao, a primeira com as duas variáveis escolhidas, e a segunda com as três variáveis quantitativas, que foram analisádas durante a montagem da atividade:

# PASSO 04 - Matriz de Correlação (MC)
MC1 <- Quest %>% select(Desempenho,Horas_estudo) %>% cor()
MC1
##              Desempenho Horas_estudo
## Desempenho    1.0000000    0.2231532
## Horas_estudo  0.2231532    1.0000000
corrplot(MC1)

corrplot.mixed(MC1)

MC2 <- Quest %>% select(Desempenho,Horas_estudo,Estresse) %>% cor()
MC2
##              Desempenho Horas_estudo   Estresse
## Desempenho   1.00000000    0.2231532 0.08257246
## Horas_estudo 0.22315316    1.0000000 0.30391699
## Estresse     0.08257246    0.3039170 1.00000000
corrplot(MC2)

corrplot.mixed(MC2)

Passo 05 - Interpretação

Nesse quinto e último passo, vamos fazer a interpretação/análise do Diagrama de dispersão e do coeficiente de correlação de Estresse

No Diagrama de dispersão (Passo 02), podemos ver 3 gráficos, onde no primeiro foi feito a comparação entre “Estresse” x “Desempenho”, onde vemos um coeficiente de correlação (0,08) baixissima, quase nula (beirando o 0) e que temos alunos com notas baixa com pouco estresse, alunos com notas altas com pouco, médio ou muito estresse, e alunos estressados com notas baixas. Depois vemos o segundo gráfico, com a comparação entre “Estresse” x “Horas_estudo”, onde vemos um coeficiente de correlação (0,30) mais alta, mas que é um coeficiente considerado fraco. No terceiro gráfico, comparamos as “Horas_Estudo” x “Desempenho”, e vimos um coeficiente de correlação (0,22) baixo, mas que continua sendo mais alto do que o Gráfico 01

No terceiro passo, fiz as coeficientes de correlação dos Gráficos do Passo 02, onde descobrimos os coeficientes com: 0,08, 0,30 e 0,22. No quarto passo, fiz a Matriz de correlação que nem foi realizado em aula mas com a adição da segunda matriz com as 3 variáveis analisadas. onde vemos os coeficientes de correlação, tanto das duas variáveis escolhidas, quanto das 3 em questão.

Conclusão

Dessa forma, podemos concluir a maior parte do que foi ensinado em aula.

. . .