Importando as bases de dados

library(readxl)
library(flextable)

## Warning: package 'flextable' was built under R version 4.2.3

library(dplyr)

## Warning: package 'dplyr' was built under R version 4.2.3

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

QE = read_excel("C:/Users/eduar/Base_de_dados-master/Questionario_Estresse.xls",
                sheet = "Dados")
names(QE)

##  [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado_a"  
##  [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"

colnames(QE)[9] = 'Creditos'

load("C:/Users/eduar/Base_de_dados-master/CARROS.RData")

#Mostrar a base de dados

head(QE) %>%  flextable() %>% theme_tron_legacy()

Aluno	Turma	Mora_pais	RJ	Namorado_a	Trabalha	Desempenho	Estresse	Creditos	Horas_estudo
1	1	2	2	2	2	8.89	23	27	27
2	1	1	1	2	2	8.80	24	28	28
3	1	2	2	2	2	8.00	25	25	25
4	1	2	2	1	1	8.80	38	21	30
5	1	2	2	2	1	8.90	41	18	20
6	1	2	2	1	1	8.10	25	29	32

head(CARROS) %>% flextable() %>% theme_tron_legacy()

Kmporlitro	Cilindros	Preco	HP	Amperagem_circ_eletrico	Peso	RPM	Tipodecombustivel	TipodeMarcha	NumdeMarchas	NumdeValvulas
21.0	6	160	110	3.90	2.620	16.46	0	1	4	4
21.0	6	160	110	3.90	2.875	17.02	0	1	4	4
22.8	4	108	93	3.85	2.320	18.61	1	1	4	1
21.4	6	258	110	3.08	3.215	19.44	1	0	3	1
18.7	8	360	175	3.15	3.440	17.02	0	0	3	2
18.1	6	225	105	2.76	3.460	20.22	1	0	3	1

DUAS VARIAVEIS QUANTITATIVAS

x=c(2,3,4,5,5,6,7,8)
y=c(4,7,9,10,11,11,13,15)

cor(x,y)

## [1] 0.980871

Hipóteses

quem estuda tira uma nota boa
quem estuda é estressado
quem faz muito credito tira uma nota ruim
quem faz muito crédito estuda mais

plot(QE$Horas_estudo, QE$Desempenho)
abline(lsfit(QE$Horas_estudo, QE$Desempenho))

cor(QE$Horas_estudo, QE$Desempenho)

## [1] 0.2231532

plot(QE$Horas_estudo, QE$Desempenho, 
     col="red", 
     pch=19,
     main = "Diagrama de dispersão",
     xlab = "Horas de estudo da semana",
     ylab = "Nota da prova")
abline(lsfit(QE$Horas_estudo, QE$Desempenho), col="blue")

Hipotese 1:

library(ggplot2)

## Warning: package 'ggplot2' was built under R version 4.2.3

library(dplyr)
QE %>% select(Horas_estudo, Desempenho) %>% ggplot(aes(x=Horas_estudo, y=Desempenho)) +
  geom_point() +
  theme_minimal()

# a correlação é positiva fraca (que é a linha) # quanto mais as horas de estudo, maior a nota final na disciplina # vale a pena estudar (mas não de forma exagerada, porque o desempenho cai se ficar muitas horas estudando direto) # a correlação é de 0,22 (correlação fraca)

Hipotese 2:

plot(QE$Horas_estudo, QE$Estresse, 
     col="red", 
     pch=19,
     main = "Diagrama de dispersão",
     xlab = "Horas de estudo da semana",
     ylab = "Estresse do aluno")
abline(lsfit(QE$Horas_estudo, QE$Estresse), col="blue")

cor(QE$Horas_estudo, QE$Estresse)

## [1] 0.303917

Correlação de 0,30 (positiva e fraca)

Quanto mais ele estuda, mais estressado tende a ser

#Hipotese 3:

plot(QE$Creditos, QE$Desempenho, 
     col="red", 
     pch=19,
     main = "Diagrama de dispersão",
     xlab = "Créditos",
     ylab = "nota do aluno")
abline(lsfit(QE$Creditos, QE$Desempenho), col="blue")

## Warning in lsfit(QE$Creditos, QE$Desempenho): 1 missing value deleted

cor(QE$Creditos, QE$Desempenho)

## [1] NA

library(dplyr)
QE_sem_missing = QE %>% filter(is.na(Creditos)) #não quero isso
QE_sem_missing = QE %>% filter(!is.na(Creditos)) #quero a negação
cor(QE_sem_missing$Creditos, QE_sem_missing$Desempenho)

## [1] 0.08631523

a correlação é muito proóxima de zero. isto é

não são correlacionados

a quantidade de créditos não tem impacto na nota

Hipotese NÃO verificada

# Hipotese 4:

r plot(QE$Creditos, QE$Horas_estudo, col="red", pch=19, main = "Diagrama de dispersão", xlab = "Créditos", ylab = "nota do aluno") abline(lsfit(QE$Creditos, QE$Horas_estudo), col="blue")

## Warning in lsfit(QE$Creditos, QE$Horas_estudo): 1 missing value deleted

r cor(QE$Creditos, QE$Horas_estudo)

## [1] NA

#Outra mabeira de correlacionar

QE %>% select(Creditos, Horas_estudo) %>%
  filter(!is.na(Creditos)) %>%
  cor()

##               Creditos Horas_estudo
## Creditos     1.0000000    0.4984399
## Horas_estudo 0.4984399    1.0000000

library(corrplot)

## Warning: package 'corrplot' was built under R version 4.2.3

## corrplot 0.92 loaded

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot(method = "square")

a diagonal = 1(correlação maxima) toda correlação positiva é azul e negativa é vermelha e quando é proxima de zero é branca(correlação fraca)

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot(method = "number")

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot(method = "pie")

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot(method = "color")

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot(method = "shade")

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot.mixed()

Hipoteses

quanto maior Km/ml mais caro o carro
quanto maior Hp mais caro o carro
o Peso não tem influencia no preço

#Variavel resposta: preço #Variaveis explicativas: km/l, hp, peso

names(CARROS)

##  [1] "Kmporlitro"              "Cilindros"              
##  [3] "Preco"                   "HP"                     
##  [5] "Amperagem_circ_eletrico" "Peso"                   
##  [7] "RPM"                     "Tipodecombustivel"      
##  [9] "TipodeMarcha"            "NumdeMarchas"           
## [11] "NumdeValvulas"

CARROS %>% select(Kmporlitro, HP, Peso, Preco, RPM)

##                     Kmporlitro  HP  Peso Preco   RPM
## Mazda RX4                 21.0 110 2.620 160.0 16.46
## Mazda RX4 Wag             21.0 110 2.875 160.0 17.02
## Datsun 710                22.8  93 2.320 108.0 18.61
## Hornet 4 Drive            21.4 110 3.215 258.0 19.44
## Hornet Sportabout         18.7 175 3.440 360.0 17.02
## Valiant                   18.1 105 3.460 225.0 20.22
## Duster 360                14.3 245 3.570 360.0 15.84
## Merc 240D                 24.4  62 3.190 146.7 20.00
## Merc 230                  22.8  95 3.150 140.8 22.90
## Merc 280                  19.2 123 3.440 167.6 18.30
## Merc 280C                 17.8 123 3.440 167.6 18.90
## Merc 450SE                16.4 180 4.070 275.8 17.40
## Merc 450SL                17.3 180 3.730 275.8 17.60
## Merc 450SLC               15.2 180 3.780 275.8 18.00
## Cadillac Fleetwood        10.4 205 5.250 472.0 17.98
## Lincoln Continental       10.4 215 5.424 460.0 17.82
## Chrysler Imperial         14.7 230 5.345 440.0 17.42
## Fiat 128                  32.4  66 2.200  78.7 19.47
## Honda Civic               30.4  52 1.615  75.7 18.52
## Toyota Corolla            33.9  65 1.835  71.1 19.90
## Toyota Corona             21.5  97 2.465 120.1 20.01
## Dodge Challenger          15.5 150 3.520 318.0 16.87
## AMC Javelin               15.2 150 3.435 304.0 17.30
## Camaro Z28                13.3 245 3.840 350.0 15.41
## Pontiac Firebird          19.2 175 3.845 400.0 17.05
## Fiat X1-9                 27.3  66 1.935  79.0 18.90
## Porsche 914-2             26.0  91 2.140 120.3 16.70
## Lotus Europa              30.4 113 1.513  95.1 16.90
## Ford Pantera L            15.8 264 3.170 351.0 14.50
## Ferrari Dino              19.7 175 2.770 145.0 15.50
## Maserati Bora             15.0 335 3.570 301.0 14.60
## Volvo 142E                21.4 109 2.780 121.0 18.60

CARROS %>% select(Kmporlitro, HP, Peso, Preco, RPM) %>% cor() %>% corrplot(method = "square")

CARROS %>% select(Kmporlitro, HP, Peso, Preco, RPM) %>% cor() %>% corrplot(method = "number")

CARROS %>% select(Kmporlitro, HP, Peso, Preco, RPM) %>% cor() %>% corrplot.mixed()

#quanto maior o peso do carro, maior tende a ser o peso desse carro

Aula 6 - Duas Variaveis Quantitativas

Eduarda Loureiro

11/05/2023