Carregando as bibliotecas

library(readxl)
library(dplyr)
library(corrplot)

Carregando bases de dados

load("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\CARROS.RData")

QE <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\Questionario_Estresse.xls")
View(QE)

Limpeza de dados

QE_sem_missing= na.omit(QE)

Análise de duas variáveis quantitativas

Covariância

x = c(2,3,4,5,5,6,7,8)
y = c(4,7,9,10,11,11,13,15)
cor(x,y)
## [1] 0.980871
plot(x,y)
abline(lsfit(x,y))

Questão de análise

Quem estuda passa na prova?

Quem estuda é mais estressado?

Quem tem mais créditos estuda mais?

Quem tem muito crédito tem menor desempenho?

Variáveis resposta (variáveis de interesse, eixo y): desempenho (questões 1 e 4), estresse (questão 2) e horas de estudo (questão 3). Variáveis explicativas: horas de estudo (questões 1 e 2), créditos (questão 3 e 4)

Análise dos dados

Quem estuda passa na prova?

plot(QE$Horas_estudo, QE$Desempenho, xlab = ("Horas de estudo"), ylab = ("Desempenho"), main = ("Diagrama de dispersão entre desempenho e horas de estudo"), col = "royalblue", pch = 17)
abline(lsfit(QE$Horas_estudo, QE$Desempenho), col = "green")

cor(QE$Horas_estudo,QE$Desempenho)
## [1] 0.2231532

Horas de estudo aumentam desempenho mas não tanto. Correlação positiva e fraca.

Quem estuda é mais estressado?

plot(QE$Estresse, QE$Horas_estudo, xlab = ("Estresse"), ylab = ("Horas de estudo"), main = ("Diagrama de dispersão entre horas de estudo e estresse"), col = "darkred", pch = 15)
abline(lsfit(QE$Estresse, QE$Horas_estudo), col = "blue")

cor(QE$Estresse,QE$Horas_estudo)
## [1] 0.303917

Correlação positiva e fraca.

Quem tem mais créditos estuda mais?

plot(QE_sem_missing$Horas_estudo, QE_sem_missing$Créditos, xlab = ("Horas de estudo"), ylab = ("Créditos"), main = ("Diagrama de dispersão entre créditos e horas de estudo"), col = "darkgreen", pch = 20)
abline(lsfit(QE_sem_missing$Créditos, QE_sem_missing$Horas_estudo), col = "purple")

cor(QE_sem_missing$Horas_estudo,QE_sem_missing$Créditos)
## [1] 0.4984399

Correlação positiva e moderada.

Quem tem muito crédito tem menor desempenho?

plot(QE_sem_missing$Desempenho, QE_sem_missing$Créditos, xlab = ("Desempenho"), ylab = ("Créditos"), main = ("Diagrama de dispersão entre créditos e desempenho"), col = "brown", pch = 20)
abline(lsfit(QE_sem_missing$Créditos, QE_sem_missing$Horas_estudo), col = "darkgreen")

cor(QE_sem_missing$Desempenho,QE_sem_missing$Créditos)
## [1] 0.08631523

Correlação insignificante.

Todas as variáveis juntas

QE %>% select(Horas_estudo, Desempenho, Créditos, Estresse) %>%
  filter(!is.na(Créditos))%>% cor() %>% corrplot()

Análise dos carros

Carros que fazem muitos km/L são mais caros?

plot(CARROS$Kmporlitro, CARROS$Preco, xlab = "Km/L", ylab = "Preço", main = "Diagrama de dispersão entre Km/L e preço", col = "skyblue", pch = 17)
abline(lsfit(CARROS$Kmporlitro, CARROS$Preco), col = "darkred")

CARROS %>% select(Kmporlitro, Preco) %>% cor()
##            Kmporlitro      Preco
## Kmporlitro  1.0000000 -0.8475514
## Preco      -0.8475514  1.0000000

Quanto mais eficiente o carro mais barato ele é. Correlação negativa e forte.

Quanto maior o HP maior o preço?

plot(CARROS$HP, CARROS$Preco, xlab = "Horsepower", ylab = "Preço", main = "Diagrama de dispersão entre horsepower e preço", col = "black", pch = 15)
abline(lsfit(CARROS$HP, CARROS$Preco), col = "green")

CARROS %>% select(HP, Preco) %>% cor()
##              HP     Preco
## HP    1.0000000 0.7909486
## Preco 0.7909486 1.0000000

Quanto mais cavalos de potência mais caro é o carro. Correlação positiva e forte.

Peso não tem impacto no preço?

plot(CARROS$Peso, CARROS$Preco, xlab = "Peso", ylab = "Preço", main = "Diagrama de dispersão entre peso e preço", col = "brown", pch = 20)
abline(lsfit(CARROS$Peso, CARROS$Preco), col = "purple")

CARROS %>% select(Peso, Preco) %>% cor()
##            Peso     Preco
## Peso  1.0000000 0.8879799
## Preco 0.8879799 1.0000000

Quão mais pesado o carro mais caro ele é. Correlação positiva e forte.

Todas as variáveis em conjunto

CARROS %>% select(Peso, Preco, HP, Kmporlitro) %>% cor%>% corrplot.mixed()