Razão de chances

dados = matrix(c(74, 17, 77, 32), ncol = 2)

dimnames(dados) <- list(voto = c("Normal", "Menção Honrosa"),
                       sexo = c("Masculino", "Feminino"))
dados
##                 sexo
## voto             Masculino Feminino
##   Normal                74       77
##   Menção Honrosa        17       32
odds_m = 17/74

odds_f = 32/77

odds_f/odds_m
## [1] 1.809015

As mulhres tem uma chance de 80% maior do que a dos homens de receber uma menção honrosa!

dados = matrix(c(69, 13, 33, 2), ncol = 2)
dimnames(dados) <- list(sexo = c("Feminino", "Masculino"),
                        voto = c("Kelmon", "Não Kelmon"))
dados
##            voto
## sexo        Kelmon Não Kelmon
##   Feminino      69         33
##   Masculino     13          2
mosaicplot(dados, color = c("darkred","gold"), xlab ="Sexo",
           ylab = "Voto no candidato padre")

dados = data.frame(x=c(2,3,4,5,5,6,7,8),
                   y=c(4,7,9,10,11,11,13,15))

cor(dados$x,dados$y)
## [1] 0.980871

Carregar a base de dados

load("C:/Users/furta/OneDrive/Base_de_dados-master/CARROS.RData")

Inspecionar a base de dados

str(CARROS)
## 'data.frame':    32 obs. of  11 variables:
##  $ Kmporlitro             : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
##  $ Cilindros              : num  6 6 4 6 8 6 8 4 4 6 ...
##  $ Preco                  : num  160 160 108 258 360 ...
##  $ HP                     : num  110 110 93 110 175 105 245 62 95 123 ...
##  $ Amperagem_circ_eletrico: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
##  $ Peso                   : num  2.62 2.88 2.32 3.21 3.44 ...
##  $ RPM                    : num  16.5 17 18.6 19.4 17 ...
##  $ Tipodecombustivel      : num  0 0 1 1 0 1 0 1 1 1 ...
##  $ TipodeMarcha           : num  1 1 1 0 0 0 0 0 0 0 ...
##  $ NumdeMarchas           : num  4 4 4 3 3 3 3 4 4 4 ...
##  $ NumdeValvulas          : num  4 4 1 1 2 1 4 2 2 4 ...
##  - attr(*, "variable.labels")= chr [1:11] "Km por litro" "Número de Cilindros" "Preço" "HP = Horse Power (potência do motor)" ...
summary((CARROS))
##    Kmporlitro      Cilindros         Preco             HP       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##  Amperagem_circ_eletrico      Peso            RPM        Tipodecombustivel
##  Min.   :2.760           Min.   :1.513   Min.   :14.50   Min.   :0.0000   
##  1st Qu.:3.080           1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000   
##  Median :3.695           Median :3.325   Median :17.71   Median :0.0000   
##  Mean   :3.597           Mean   :3.217   Mean   :17.85   Mean   :0.4375   
##  3rd Qu.:3.920           3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000   
##  Max.   :4.930           Max.   :5.424   Max.   :22.90   Max.   :1.0000   
##   TipodeMarcha     NumdeMarchas   NumdeValvulas  
##  Min.   :0.0000   Min.   :3.000   Min.   :1.000  
##  1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000  
##  Median :0.0000   Median :4.000   Median :2.000  
##  Mean   :0.4062   Mean   :3.688   Mean   :2.812  
##  3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :1.0000   Max.   :5.000   Max.   :8.000
Hipoteses/Questões

1. Carro com muito HP tem um preço caro?

2. Quanto maior o km/l menor o preço do carro?

3. Quanto mais pesado o carro, mais caro o carro?

4. RPM e amperagem nao tem impacto no preço do carro?

# Operacionalizar
# Variavel resposta(variavel dependente) # Preço do carro
# Variáveis independentes # Hp, km/l, peso, RPM e amperagem

Análise da base de dados

plot(CARROS$HP, CARROS$Preco, col= "red", pch=19, 
     main = "Gráfico 1 - Diagrama de dispersão",
     xlab = "Cavalos de potencia",
     ylab = "Preço do carro")
abline(lsfit(CARROS$HP, CARROS$Preco), col="darkred", lwd=2)

cor(CARROS$HP, CARROS$Preco)
## [1] 0.7909486

Hipotese confirmada. Quanto maior o HP, maior o preço.

A correlação foi de 0,79 onde o máximo é 1.

  plot(CARROS$Kmporlitro, CARROS$Preco, col= "red", pch=19, 
       main = "Gráfico 2 - Diagrama de dispersão",
       xlab = "Km/l",
       ylab = "Preço do carro")
abline(lsfit(CARROS$Kmporlitro, CARROS$Preco), col="lightblue", lwd=2)

cor(CARROS$Kmporlitro, CARROS$Preco)
## [1] -0.8475514

Hipotese confirmada

  plot(CARROS$Peso, CARROS$Preco, col= "red", pch=19, 
       main = "Gráfico 3 - Diagrama de dispersão",
       xlab = "Peso",
       ylab = "Preço do carro")
abline(lsfit(CARROS$Peso, CARROS$Preco), col="lightblue", lwd=2)

cor(CARROS$Peso, CARROS$Preco)
## [1] 0.8879799

Hipotese confirmada


library(dplyr)
## Warning: pacote 'dplyr' foi compilado no R versão 4.4.1
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union
library(corrplot)
## Warning: pacote 'corrplot' foi compilado no R versão 4.4.1
## corrplot 0.95 loaded
CARROS %>% select(Preco,Kmporlitro,HP,Peso,Amperagem_circ_eletrico,RPM) %>%
  cor() %>% corrplot(method = "number")

library(leaflet)
## Warning: pacote 'leaflet' foi compilado no R versão 4.4.1
leaflet() %>%
  addTiles() %>%
  addMarkers(lng = -43.1688316, lat = -22.954937,
  popup = "Estou aqui no CCET/UNIRIO <br> <br>0 R é demais")