Passo 1 - Carregar as bibliotecas
library(readxl)
library(corrplot)
## corrplot 0.90 loaded
library(rio)
Passo 2 - Carregar a base de dados
Questionario_Estresse <- read_excel("H:/Faculdade/ESTATISTICA/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)
Visualização
head(Questionario_Estresse)
## # A tibble: 6 x 10
## Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 1 2 2 2 2 8.89 23 27
## 2 2 1 1 1 2 2 8.8 24 28
## 3 3 1 2 2 2 2 8 25 25
## 4 4 1 2 2 1 1 8.8 38 21
## 5 5 1 2 2 2 1 8.9 41 18
## 6 6 1 2 2 1 1 8.1 25 29
## # ... with 1 more variable: Horas_estudo <dbl>
Passo 3 - Digrama de de dispersão
DUAS VARIÁVEIS QUANTITATIVAS
par(bg="lightyellow")
plot(Questionario_Estresse$Turma, Questionario_Estresse$Horas_estudo,pch=19,col="red",
main = "Gráfico I",ylab = "Horas de Estudo",xlab = "Turma")
abline(lsfit(Questionario_Estresse$Turma,Questionario_Estresse$Horas_estudo),col="black")

Passo 4 - Descobrindo a correlação
cor(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Turma)
## [1] -0.2870679
Passo 5 - Visualização da matriz de correlação (FALHA)
Relatório:
Na primeira etapa passamos pelo carregamento das bibliotecas, seguindo do carregamento da base de dados, onde ocorreu a escolha das variáveis que seria utilizada no trabalho. Escolhi a relação de Horas de Estudos x Turma.
Na análise, reparei que existiam dados de 3 turmas, com tempo de estudos (em horas) dividido por cada aluno. Podemos então à principio ver que a turma 1 possúi a sua grande maioria de alunos estudando cerca de 40h pra baixo, tendo descaques para apenas 3 marcações acima disso. Já a turma 2 tem seus alunos estudando cerca de 15 a 45 horas, vale lembrar que os dados são realizados por alunos, individualmente. Para fechar, a turmar 3 tem seus alunos estudando abaixo de 40 horas.
Seguindo o trabalho logo após a análise do gráfico, fiz uma avaliação com a ajuda do traçado, para descobrir a relação existente e vista na aula, detectei o número -0.2870679 como resultado, esse número fica mais próximo ao 0, logo, não existe relação.
Para finalizar, fui desenvolver a visualização da matriz de correlação, porém, houve um erro, tentei de diversas vezes solucionar, com várias tentativas e pesquisas, porém, sem sucesso. O erro apresentado era esse -Error in Questionario_Estresse %>% select(Aluno, Turma, Desempenho, Créditos, : could not find function “%>%”-. Sendo assim, decidi entregar até aqui e buscar a resolução junto ao professor.