Carregando a base de dados CARROS e Pokemon.

load("C:/Users/VIC NOTE/Documents/Ciencia Politica/8 Periodo/Estatistica/bases_curso_estatistica/Base_de_dados-master/CARROS.RData")
load("C:/Users/VIC NOTE/Documents/Ciencia Politica/8 Periodo/Estatistica/bases_curso_estatistica/Base_de_dados-master/df_pokemon.RData")

Transformação das variaveis.

CARROS$Tipodecombustivel <-ifelse(CARROS$Tipodecombustivel==0,"Gas","Alc")
CARROS$TipodeMarcha <- ifelse(CARROS$TipodeMarcha==0,"Auto","Manual")

Operador PIPE.

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
CARROS %>%
  pull(Tipodecombustivel) %>%
  table () %>%
  prop.table()
## .
##    Alc    Gas 
## 0.4375 0.5625
CARROS %>%
  group_by(Tipodecombustivel) %>%
  summarize(media=mean(Preco),mediana=median(Preco),desvio_padrao=sd(Preco),tamanho=n())
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 2 x 5
##   Tipodecombustivel media mediana desvio_padrao tamanho
##   <chr>             <dbl>   <dbl>         <dbl>   <int>
## 1 Alc                132.    121.          56.9      14
## 2 Gas                307.    311          107.       18

km/litro por tipo de marcha.

CARROS %>%
  group_by(TipodeMarcha) %>%
  summarize(media=mean(Kmporlitro),desvio_padrao=sd(Kmporlitro),tamanho=n())
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 2 x 4
##   TipodeMarcha media desvio_padrao tamanho
##   <chr>        <dbl>         <dbl>   <int>
## 1 Auto          17.1          3.83      19
## 2 Manual        24.4          6.17      13

hp por tipo de marcha.

CARROS %>%
  group_by(TipodeMarcha) %>%
  summarize(media=mean(HP),desvio_padrao=sd(HP),tamanho=n())
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 2 x 4
##   TipodeMarcha media desvio_padrao tamanho
##   <chr>        <dbl>         <dbl>   <int>
## 1 Auto          160.          53.9      19
## 2 Manual        127.          84.1      13

Peso por tipo de marcha.

CARROS %>%
  group_by(TipodeMarcha) %>%
  summarize(media=mean(Peso),desvio_padrao=sd(Peso),tamanho=n())
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 2 x 4
##   TipodeMarcha media desvio_padrao tamanho
##   <chr>        <dbl>         <dbl>   <int>
## 1 Auto          3.77         0.777      19
## 2 Manual        2.41         0.617      13

Multivariada.

CARROS %>%
  group_by(Tipodecombustivel, TipodeMarcha) %>%
  summarize(media=mean(Preco),mediana=median(Preco),desvio_padrao=sd(Preco),tamanho=n())
## `summarise()` regrouping output by 'Tipodecombustivel' (override with `.groups` argument)
## # A tibble: 4 x 6
## # Groups:   Tipodecombustivel [2]
##   Tipodecombustivel TipodeMarcha media mediana desvio_padrao tamanho
##   <chr>             <chr>        <dbl>   <dbl>         <dbl>   <int>
## 1 Alc               Auto         175.     168.          49.1       7
## 2 Alc               Manual        89.8     79           18.8       7
## 3 Gas               Auto         358.     355           71.8      12
## 4 Gas               Manual       206.     160           95.2       6

Pegar o ataque e o ataque especial e fazer uma analise por esse grupo de ovo, responder que grupo tem o melhor ataque médio e agrupar sempre pela variável qualitativa e summarize pela quantitativa.

tabela_pokemon <-df %>%
  group_by(egg_group_1) %>%
  summarize(media=mean(attack),mediana=median(attack))
## `summarise()` ungrouping output (override with `.groups` argument)

Agrupar sempre pela variável qualitativa e summarize pela quantitativa.

tabela_pokemon <-df %>%
  group_by(egg_group_1) %>%
  summarize(media=mean(attack),mediana=median(attack))
## `summarise()` ungrouping output (override with `.groups` argument)
tabela_pokemon2 <-df %>%
  group_by(egg_group_1) %>%
  summarize(media=mean(special_attack),mediana=median(special_attack))
## `summarise()` ungrouping output (override with `.groups` argument)
datatable(tabela_pokemon)
datatable(tabela_pokemon2)

Defesa por tipo 1.

tabela_pokemon3 <-df %>%
  group_by(type_1) %>%
  summarize(media=mean(defense),mediana=median(defense)) %>%
  arrange(desc(media))
## `summarise()` ungrouping output (override with `.groups` argument)
datatable(tabela_pokemon3)

Defesa especial por tipo 2.

tabela_pokemon4 <-df %>%
  group_by(type_2) %>%
  summarize(media=mean(special_defense),mediana=median(special_defense), desvio_padrao=sd(special_defense)) %>% 
  arrange(desc(media))
## `summarise()` ungrouping output (override with `.groups` argument)
tabela_pokemon4$media <-round(tabela_pokemon4$media,2)
tabela_pokemon4$desvio_padrao <-round(tabela_pokemon4$desvio_padrao,2)

datatable(tabela_pokemon4)

Criaçao de Gráfico Boxplot CARROS.

boxplot(CARROS$Preco~CARROS$Tipodecombustivel, col=c("green", "red"))

boxplot(CARROS$Kmporlitro~CARROS$Tipodecombustivel, col=c("yellow","blue"))

Criação de Gráfico Boxplot Pokemon.*

par(cex=0.5)
boxplot(df$attack~df$type_1, col="red")

par(cex=0.5)
boxplot(df$special_attack~df$type_1, col="royalblue")

par(cex=0.5)
boxplot(df$special_defense~df$type_1, col="green")

Analise do Boxplot "CARROS x Tipo de Combustivel

Na mediana o carro a alcool é mais barato que o carro a gasolina. Em todas as distribuicoes (1º quartil, 3º quartil e mediana) o carro a gasolina é mais caro que o a alcool.

No boxplot é possivel extrair 3 informaçoes dele: 1º - Vc pode comparar as medidas de posicao ( pode comparar dizendo que uma é maior que a outra); 2º - Se é assimetrico ou simétrico e é notorio a simetria no carro a gasolina e assimetria no carro a alcool; 3º - As bolinhas que aparecem embaixo do boxplot do carro a gasolina sao os outliers (um valor que foge da normalidade), e nesse caso especifico ha dois.

No Boxplot cruzando variaveis de km/L e Tipo de Combustivel é possivel observar que o carro a alcool tem a mediana maior que do carro a gasolina, o carro a alcool faz mais km/l em todas as distribuicoes que o carro a gasolina. Os 2 tipos de carro são assimetricos, o primeiro quartil é muito proximo a mediana nos dois tipos, no carro a gasolina tem um outlier, a distancia do zero ate o inicio do grafico é maior no carro a gasolina do que no carro a alcool o que significa que o desvio padrao do carro a alcool é maior que o carro a gasolina.

Analisando o Boxplot Pokemon

O melhor ataque é o tipo que tem a maior mediana e no gráfico em questão é o “fighting” e o ataque mais fraco, aquele com a menor mediana é o “fairy”. O tipo “fairy”tem dois outliers, o “normal” tem 2 tambem, o “psychic” tem um e o “steel” tem um outlier tambem. O tipo “normal” tem uma distribuicao simetrica, enquanto o “fairy” e o “steel” sao assimetricos. Alem das medianas, outliers, simetria e assimetria, é possivel observar a variancia. A variancia do tipo “normal”é grande e mais diversificado de pokemons enquanto a do tipo “poison”, é bem mais concentrado em torno da mediana e tudo parecido.

O melhor ataque especial, que tem a maior mediana é do “Flying” e o pior ataque é do “Fighting”. Temos a presença de outliers nos: bug;fighting; ground; normal;rock; steel e water.Há uma variancia com grande diversidade de pokemons no dragon e no psychic e uma concentração no gound. No caso de simetria os exemplos sao o psychic e o grass.