Importando as bases de dados

library(readxl)
library(flextable)
## Warning: package 'flextable' was built under R version 4.2.3
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
QE = read_excel("C:/Users/eduar/Base_de_dados-master/Questionario_Estresse.xls",
                sheet = "Dados")
names(QE)
##  [1] "Aluno"        "Turma"        "Mora_pais"    "RJ"           "Namorado_a"  
##  [6] "Trabalha"     "Desempenho"   "Estresse"     "Créditos"     "Horas_estudo"
colnames(QE)[9] = 'Creditos'

load("C:/Users/eduar/Base_de_dados-master/CARROS.RData")

#Mostrar a base de dados

head(QE) %>%  flextable() %>% theme_tron_legacy()

Aluno

Turma

Mora_pais

RJ

Namorado_a

Trabalha

Desempenho

Estresse

Creditos

Horas_estudo

1

1

2

2

2

2

8.89

23

27

27

2

1

1

1

2

2

8.80

24

28

28

3

1

2

2

2

2

8.00

25

25

25

4

1

2

2

1

1

8.80

38

21

30

5

1

2

2

2

1

8.90

41

18

20

6

1

2

2

1

1

8.10

25

29

32

head(CARROS) %>% flextable() %>% theme_tron_legacy()

Kmporlitro

Cilindros

Preco

HP

Amperagem_circ_eletrico

Peso

RPM

Tipodecombustivel

TipodeMarcha

NumdeMarchas

NumdeValvulas

21.0

6

160

110

3.90

2.620

16.46

0

1

4

4

21.0

6

160

110

3.90

2.875

17.02

0

1

4

4

22.8

4

108

93

3.85

2.320

18.61

1

1

4

1

21.4

6

258

110

3.08

3.215

19.44

1

0

3

1

18.7

8

360

175

3.15

3.440

17.02

0

0

3

2

18.1

6

225

105

2.76

3.460

20.22

1

0

3

1

DUAS VARIAVEIS QUANTITATIVAS

x=c(2,3,4,5,5,6,7,8)
y=c(4,7,9,10,11,11,13,15)

cor(x,y)
## [1] 0.980871

Hipóteses

  1. quem estuda tira uma nota boa
  2. quem estuda é estressado
  3. quem faz muito credito tira uma nota ruim
  4. quem faz muito crédito estuda mais
plot(QE$Horas_estudo, QE$Desempenho)
abline(lsfit(QE$Horas_estudo, QE$Desempenho))

cor(QE$Horas_estudo, QE$Desempenho)
## [1] 0.2231532
plot(QE$Horas_estudo, QE$Desempenho, 
     col="red", 
     pch=19,
     main = "Diagrama de dispersão",
     xlab = "Horas de estudo da semana",
     ylab = "Nota da prova")
abline(lsfit(QE$Horas_estudo, QE$Desempenho), col="blue")

Hipotese 1:

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
library(dplyr)
QE %>% select(Horas_estudo, Desempenho) %>% ggplot(aes(x=Horas_estudo, y=Desempenho)) +
  geom_point() +
  theme_minimal()

# a correlação é positiva fraca (que é a linha) # quanto mais as horas de estudo, maior a nota final na disciplina # vale a pena estudar (mas não de forma exagerada, porque o desempenho cai se ficar muitas horas estudando direto) # a correlação é de 0,22 (correlação fraca)

Hipotese 2:

plot(QE$Horas_estudo, QE$Estresse, 
     col="red", 
     pch=19,
     main = "Diagrama de dispersão",
     xlab = "Horas de estudo da semana",
     ylab = "Estresse do aluno")
abline(lsfit(QE$Horas_estudo, QE$Estresse), col="blue")

cor(QE$Horas_estudo, QE$Estresse)
## [1] 0.303917

Correlação de 0,30 (positiva e fraca)

Quanto mais ele estuda, mais estressado tende a ser

#Hipotese 3:

plot(QE$Creditos, QE$Desempenho, 
     col="red", 
     pch=19,
     main = "Diagrama de dispersão",
     xlab = "Créditos",
     ylab = "nota do aluno")
abline(lsfit(QE$Creditos, QE$Desempenho), col="blue")
## Warning in lsfit(QE$Creditos, QE$Desempenho): 1 missing value deleted

cor(QE$Creditos, QE$Desempenho)
## [1] NA
library(dplyr)
QE_sem_missing = QE %>% filter(is.na(Creditos)) #não quero isso
QE_sem_missing = QE %>% filter(!is.na(Creditos)) #quero a negação
cor(QE_sem_missing$Creditos, QE_sem_missing$Desempenho)
## [1] 0.08631523

a correlação é muito proóxima de zero. isto é

não são correlacionados

a quantidade de créditos não tem impacto na nota

Hipotese NÃO verificada

# Hipotese 4:
r plot(QE$Creditos, QE$Horas_estudo, col="red", pch=19, main = "Diagrama de dispersão", xlab = "Créditos", ylab = "nota do aluno") abline(lsfit(QE$Creditos, QE$Horas_estudo), col="blue")
## Warning in lsfit(QE$Creditos, QE$Horas_estudo): 1 missing value deleted
r cor(QE$Creditos, QE$Horas_estudo)
## [1] NA

#Outra mabeira de correlacionar

QE %>% select(Creditos, Horas_estudo) %>%
  filter(!is.na(Creditos)) %>%
  cor()
##               Creditos Horas_estudo
## Creditos     1.0000000    0.4984399
## Horas_estudo 0.4984399    1.0000000
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.2.3
## corrplot 0.92 loaded
QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot(method = "square")

a diagonal = 1(correlação maxima) toda correlação positiva é azul e negativa é vermelha e quando é proxima de zero é branca(correlação fraca)

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot(method = "number")

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot(method = "pie")

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot(method = "color")

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot(method = "shade")

QE %>% select(Creditos, Horas_estudo, Desempenho, Estresse) %>%
  filter(!is.na(Creditos)) %>% cor() %>% corrplot.mixed()

Hipoteses

  1. quanto maior Km/ml mais caro o carro
  2. quanto maior Hp mais caro o carro
  3. o Peso não tem influencia no preço

#Variavel resposta: preço #Variaveis explicativas: km/l, hp, peso

names(CARROS)
##  [1] "Kmporlitro"              "Cilindros"              
##  [3] "Preco"                   "HP"                     
##  [5] "Amperagem_circ_eletrico" "Peso"                   
##  [7] "RPM"                     "Tipodecombustivel"      
##  [9] "TipodeMarcha"            "NumdeMarchas"           
## [11] "NumdeValvulas"
CARROS %>% select(Kmporlitro, HP, Peso, Preco, RPM)
##                     Kmporlitro  HP  Peso Preco   RPM
## Mazda RX4                 21.0 110 2.620 160.0 16.46
## Mazda RX4 Wag             21.0 110 2.875 160.0 17.02
## Datsun 710                22.8  93 2.320 108.0 18.61
## Hornet 4 Drive            21.4 110 3.215 258.0 19.44
## Hornet Sportabout         18.7 175 3.440 360.0 17.02
## Valiant                   18.1 105 3.460 225.0 20.22
## Duster 360                14.3 245 3.570 360.0 15.84
## Merc 240D                 24.4  62 3.190 146.7 20.00
## Merc 230                  22.8  95 3.150 140.8 22.90
## Merc 280                  19.2 123 3.440 167.6 18.30
## Merc 280C                 17.8 123 3.440 167.6 18.90
## Merc 450SE                16.4 180 4.070 275.8 17.40
## Merc 450SL                17.3 180 3.730 275.8 17.60
## Merc 450SLC               15.2 180 3.780 275.8 18.00
## Cadillac Fleetwood        10.4 205 5.250 472.0 17.98
## Lincoln Continental       10.4 215 5.424 460.0 17.82
## Chrysler Imperial         14.7 230 5.345 440.0 17.42
## Fiat 128                  32.4  66 2.200  78.7 19.47
## Honda Civic               30.4  52 1.615  75.7 18.52
## Toyota Corolla            33.9  65 1.835  71.1 19.90
## Toyota Corona             21.5  97 2.465 120.1 20.01
## Dodge Challenger          15.5 150 3.520 318.0 16.87
## AMC Javelin               15.2 150 3.435 304.0 17.30
## Camaro Z28                13.3 245 3.840 350.0 15.41
## Pontiac Firebird          19.2 175 3.845 400.0 17.05
## Fiat X1-9                 27.3  66 1.935  79.0 18.90
## Porsche 914-2             26.0  91 2.140 120.3 16.70
## Lotus Europa              30.4 113 1.513  95.1 16.90
## Ford Pantera L            15.8 264 3.170 351.0 14.50
## Ferrari Dino              19.7 175 2.770 145.0 15.50
## Maserati Bora             15.0 335 3.570 301.0 14.60
## Volvo 142E                21.4 109 2.780 121.0 18.60
CARROS %>% select(Kmporlitro, HP, Peso, Preco, RPM) %>% cor() %>% corrplot(method = "square")

CARROS %>% select(Kmporlitro, HP, Peso, Preco, RPM) %>% cor() %>% corrplot(method = "number")

CARROS %>% select(Kmporlitro, HP, Peso, Preco, RPM) %>% cor() %>% corrplot.mixed()

#quanto maior o peso do carro, maior tende a ser o peso desse carro