Carregando a base de dados CARROS e Pokemon.
load("C:/Users/VIC NOTE/Documents/Ciencia Politica/8 Periodo/Estatistica/bases_curso_estatistica/Base_de_dados-master/CARROS.RData")
load("C:/Users/VIC NOTE/Documents/Ciencia Politica/8 Periodo/Estatistica/bases_curso_estatistica/Base_de_dados-master/df_pokemon.RData")
Operador PIPE.
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
CARROS %>%
pull(Tipodecombustivel) %>%
table () %>%
prop.table()
## .
## Alc Gas
## 0.4375 0.5625
CARROS %>%
group_by(Tipodecombustivel) %>%
summarize(media=mean(Preco),mediana=median(Preco),desvio_padrao=sd(Preco),tamanho=n())
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 2 x 5
## Tipodecombustivel media mediana desvio_padrao tamanho
## <chr> <dbl> <dbl> <dbl> <int>
## 1 Alc 132. 121. 56.9 14
## 2 Gas 307. 311 107. 18
km/litro por tipo de marcha.
CARROS %>%
group_by(TipodeMarcha) %>%
summarize(media=mean(Kmporlitro),desvio_padrao=sd(Kmporlitro),tamanho=n())
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 2 x 4
## TipodeMarcha media desvio_padrao tamanho
## <chr> <dbl> <dbl> <int>
## 1 Auto 17.1 3.83 19
## 2 Manual 24.4 6.17 13
hp por tipo de marcha.
CARROS %>%
group_by(TipodeMarcha) %>%
summarize(media=mean(HP),desvio_padrao=sd(HP),tamanho=n())
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 2 x 4
## TipodeMarcha media desvio_padrao tamanho
## <chr> <dbl> <dbl> <int>
## 1 Auto 160. 53.9 19
## 2 Manual 127. 84.1 13
Peso por tipo de marcha.
CARROS %>%
group_by(TipodeMarcha) %>%
summarize(media=mean(Peso),desvio_padrao=sd(Peso),tamanho=n())
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 2 x 4
## TipodeMarcha media desvio_padrao tamanho
## <chr> <dbl> <dbl> <int>
## 1 Auto 3.77 0.777 19
## 2 Manual 2.41 0.617 13
Multivariada.
CARROS %>%
group_by(Tipodecombustivel, TipodeMarcha) %>%
summarize(media=mean(Preco),mediana=median(Preco),desvio_padrao=sd(Preco),tamanho=n())
## `summarise()` regrouping output by 'Tipodecombustivel' (override with `.groups` argument)
## # A tibble: 4 x 6
## # Groups: Tipodecombustivel [2]
## Tipodecombustivel TipodeMarcha media mediana desvio_padrao tamanho
## <chr> <chr> <dbl> <dbl> <dbl> <int>
## 1 Alc Auto 175. 168. 49.1 7
## 2 Alc Manual 89.8 79 18.8 7
## 3 Gas Auto 358. 355 71.8 12
## 4 Gas Manual 206. 160 95.2 6
Pegar o ataque e o ataque especial e fazer uma analise por esse grupo de ovo, responder que grupo tem o melhor ataque médio e agrupar sempre pela variável qualitativa e summarize pela quantitativa.
tabela_pokemon <-df %>%
group_by(egg_group_1) %>%
summarize(media=mean(attack),mediana=median(attack))
## `summarise()` ungrouping output (override with `.groups` argument)
Agrupar sempre pela variável qualitativa e summarize pela quantitativa.
tabela_pokemon <-df %>%
group_by(egg_group_1) %>%
summarize(media=mean(attack),mediana=median(attack))
## `summarise()` ungrouping output (override with `.groups` argument)
tabela_pokemon2 <-df %>%
group_by(egg_group_1) %>%
summarize(media=mean(special_attack),mediana=median(special_attack))
## `summarise()` ungrouping output (override with `.groups` argument)
datatable(tabela_pokemon)
datatable(tabela_pokemon2)
Defesa por tipo 1.
tabela_pokemon3 <-df %>%
group_by(type_1) %>%
summarize(media=mean(defense),mediana=median(defense)) %>%
arrange(desc(media))
## `summarise()` ungrouping output (override with `.groups` argument)
datatable(tabela_pokemon3)
Defesa especial por tipo 2.
tabela_pokemon4 <-df %>%
group_by(type_2) %>%
summarize(media=mean(special_defense),mediana=median(special_defense), desvio_padrao=sd(special_defense)) %>%
arrange(desc(media))
## `summarise()` ungrouping output (override with `.groups` argument)
tabela_pokemon4$media <-round(tabela_pokemon4$media,2)
tabela_pokemon4$desvio_padrao <-round(tabela_pokemon4$desvio_padrao,2)
datatable(tabela_pokemon4)
Criaçao de Gráfico Boxplot CARROS.
boxplot(CARROS$Preco~CARROS$Tipodecombustivel, col=c("green", "red"))

boxplot(CARROS$Kmporlitro~CARROS$Tipodecombustivel, col=c("yellow","blue"))

Criação de Gráfico Boxplot Pokemon.*
par(cex=0.5)
boxplot(df$attack~df$type_1, col="red")

par(cex=0.5)
boxplot(df$special_attack~df$type_1, col="royalblue")

par(cex=0.5)
boxplot(df$special_defense~df$type_1, col="green")

Analise do Boxplot "CARROS x Tipo de Combustivel
Na mediana o carro a alcool é mais barato que o carro a gasolina. Em todas as distribuicoes (1º quartil, 3º quartil e mediana) o carro a gasolina é mais caro que o a alcool.
No Boxplot cruzando variaveis de km/L e Tipo de Combustivel é possivel observar que o carro a alcool tem a mediana maior que do carro a gasolina, o carro a alcool faz mais km/l em todas as distribuicoes que o carro a gasolina. Os 2 tipos de carro são assimetricos, o primeiro quartil é muito proximo a mediana nos dois tipos, no carro a gasolina tem um outlier, a distancia do zero ate o inicio do grafico é maior no carro a gasolina do que no carro a alcool o que significa que o desvio padrao do carro a alcool é maior que o carro a gasolina.
Analisando o Boxplot Pokemon
O melhor ataque é o tipo que tem a maior mediana e no gráfico em questão é o “fighting” e o ataque mais fraco, aquele com a menor mediana é o “fairy”. O tipo “fairy”tem dois outliers, o “normal” tem 2 tambem, o “psychic” tem um e o “steel” tem um outlier tambem. O tipo “normal” tem uma distribuicao simetrica, enquanto o “fairy” e o “steel” sao assimetricos. Alem das medianas, outliers, simetria e assimetria, é possivel observar a variancia. A variancia do tipo “normal”é grande e mais diversificado de pokemons enquanto a do tipo “poison”, é bem mais concentrado em torno da mediana e tudo parecido.
O melhor ataque especial, que tem a maior mediana é do “Flying” e o pior ataque é do “Fighting”. Temos a presença de outliers nos: bug;fighting; ground; normal;rock; steel e water.Há uma variancia com grande diversidade de pokemons no dragon e no psychic e uma concentração no gound. No caso de simetria os exemplos sao o psychic e o grass.