Aqui vou carregar as bibliotecas e a base de dados escolhida para a realização da atividade:
# PASSO 00 - Carregar bibliotecas
library(dplyr)
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
library(corrplot)corrplot 0.90 loaded
# PASSO 01 - Importação das Bases de Dados
library(readxl)
Quest <- read_excel("C:/Users/Samsung/Desktop/01_ Pedro Henrique Miceli/01_ Escolaridade/07_ UNIRIO/02_ UNIRIO 2021.1/05_ TME0018_ Estatistica ACS/00 - Base de dados/Questionario_Estresse.xls")
head(Quest)# A tibble: 6 x 10
Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1 1 2 2 2 2 8.89 23 27
2 2 1 1 1 2 2 8.8 24 28
3 3 1 2 2 2 2 8 25 25
4 4 1 2 2 1 1 8.8 38 21
5 5 1 2 2 2 1 8.9 41 18
6 6 1 2 2 1 1 8.1 25 29
# ... with 1 more variable: Horas_estudo <dbl>
Aqui, vou realizar os diagramas de 3 variáveis quantitativas, escolhidas para saber qual desses será utilizado:
# PASSO 02 - Diagrama de Dispersão - De duas variáveis quantitativas
names(Quest) [1] "Aluno" "Turma" "Mora_pais" "RJ" "Namorado_a"
[6] "Trabalha" "Desempenho" "Estresse" "Créditos" "Horas_estudo"
par(bg="darkgray")
plot(Quest$Estresse, Quest$Desempenho, pch=19,col="yellow", main = "Gráfico 01", ylab = "Desempenho", xlab = "Estresse")
abline(lsfit(Quest$Estresse, Quest$Desempenho), col="darkgreen")par(bg="darkgray")
plot(Quest$Estresse, Quest$Horas_estudo, pch=19,col="yellow", main = "Gráfico 02", ylab = "Horas de Estudo", xlab = "Estresse")
abline(lsfit(Quest$Estresse, Quest$Horas_estudo), col="darkgreen")par(bg="darkgray")
plot(Quest$Desempenho, Quest$Horas_estudo, pch=19,col="yellow", main = "Gráfico 03", ylab = "Horas de Estudo", xlab = "Desempenho")
abline(lsfit(Quest$Desempenho, Quest$Horas_estudo), col="darkgreen")Aqui vou realizar a correlação das variáveis quantitativas escolhidas:
# PASSO 03 - Correlações das Variáveis
par(bg="darkgray")
plot(Quest$Desempenho, Quest$Horas_estudo, pch=19,col="yellow", main = "Gráfico 03", ylab = "Horas de Estudo", xlab = "Desempenho")
abline(lsfit(Quest$Desempenho, Quest$Horas_estudo), col="darkgreen")cor(Quest$Desempenho, Quest$Horas_estudo) # Correlação Linear Positiva Baixa (= 0,22)[1] 0.2231532
cor(Quest$Estresse, Quest$Desempenho) # Correlação Linear Positiva Baixa (= 0,08)[1] 0.08257246
cor(Quest$Estresse, Quest$Horas_estudo) # Correlação Linear Positiva Fraco (= 0,30)[1] 0.303917
Nesse penúltimo passo, realizei duas matrizes de correlaçao, a primeira com as duas variáveis escolhidas, e a segunda com as três variáveis quantitativas, que foram analisádas durante a montagem da atividade:
# PASSO 04 - Matriz de Correlação (MC)
MC1 <- Quest %>% select(Desempenho,Horas_estudo) %>% cor()
MC1## Desempenho Horas_estudo
## Desempenho 1.0000000 0.2231532
## Horas_estudo 0.2231532 1.0000000
corrplot(MC1)corrplot.mixed(MC1)MC2 <- Quest %>% select(Desempenho,Horas_estudo,Estresse) %>% cor()
MC2## Desempenho Horas_estudo Estresse
## Desempenho 1.00000000 0.2231532 0.08257246
## Horas_estudo 0.22315316 1.0000000 0.30391699
## Estresse 0.08257246 0.3039170 1.00000000
corrplot(MC2)corrplot.mixed(MC2)Nesse quinto e último passo, vamos fazer a interpretação/análise do Diagrama de dispersão e do coeficiente de correlação de Estresse
No Diagrama de dispersão (Passo 02), podemos ver 3 gráficos, onde no primeiro foi feito a comparação entre “Estresse” x “Desempenho”, onde vemos um coeficiente de correlação (0,08) baixissima, quase nula (beirando o 0) e que temos alunos com notas baixa com pouco estresse, alunos com notas altas com pouco, médio ou muito estresse, e alunos estressados com notas baixas. Depois vemos o segundo gráfico, com a comparação entre “Estresse” x “Horas_estudo”, onde vemos um coeficiente de correlação (0,30) mais alta, mas que é um coeficiente considerado fraco. No terceiro gráfico, comparamos as “Horas_Estudo” x “Desempenho”, e vimos um coeficiente de correlação (0,22) baixo, mas que continua sendo mais alto do que o Gráfico 01
No terceiro passo, fiz as coeficientes de correlação dos Gráficos do Passo 02, onde descobrimos os coeficientes com: 0,08, 0,30 e 0,22. No quarto passo, fiz a Matriz de correlação que nem foi realizado em aula mas com a adição da segunda matriz com as 3 variáveis analisadas. onde vemos os coeficientes de correlação, tanto das duas variáveis escolhidas, quanto das 3 em questão.
Dessa forma, podemos concluir a maior parte do que foi ensinado em aula.
. . .