library(readxl)
library(flextable)
library(dplyr)
library(RColorBrewer)
load("~/Base_de_dados-master/df_pokemon.RData")
Qualitativa (Tipo 1 de Pokemon) versus quantitativo(defesa do Pokemon)
df%>%select(defense,type_1)%>%group_by(type_1)%>%summarise(Média=mean(defense),mediana=median(defense),desvio_padrão=sd(defense),mínimo=min(defense),máximo=max(defense))%>%flextable()%>%theme_vanilla()
type_1 | Média | mediana | desvio_padrão | mínimo | máximo |
bug | 67.69841 | 55.0 | 32.22333 | 30 | 230 |
dark | 67.92857 | 67.5 | 23.79687 | 30 | 115 |
dragon | 79.12500 | 85.0 | 22.61841 | 35 | 121 |
electric | 59.08333 | 58.5 | 20.35313 | 15 | 115 |
fairy | 65.70588 | 66.0 | 18.97948 | 28 | 95 |
fighting | 64.28000 | 62.0 | 18.32012 | 30 | 95 |
fire | 63.69565 | 59.0 | 21.34673 | 37 | 140 |
flying | 61.66667 | 70.0 | 23.62908 | 35 | 80 |
ghost | 76.82609 | 65.0 | 34.80028 | 30 | 145 |
grass | 69.36364 | 65.0 | 23.95549 | 30 | 131 |
ground | 82.16667 | 82.0 | 31.89323 | 25 | 140 |
ice | 71.04348 | 70.0 | 35.11084 | 15 | 184 |
normal | 57.79570 | 60.0 | 22.34928 | 5 | 120 |
poison | 68.82143 | 67.0 | 21.06613 | 35 | 120 |
psychic | 65.15217 | 62.5 | 26.43732 | 15 | 130 |
rock | 98.50000 | 98.5 | 36.42132 | 40 | 200 |
steel | 119.40909 | 115.5 | 33.28185 | 70 | 200 |
water | 70.48571 | 68.0 | 25.57986 | 20 | 180 |
summary(df$defense)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.00 50.00 65.00 70.67 85.00 230.00
COR=brewer.pal(15,"Set3")
COR
## [1] "#8DD3C7" "#FFFFB3" "#BEBADA" "#FB8072" "#80B1D3" "#FDB462" "#B3DE69"
## [8] "#FCCDE5" "#D9D9D9" "#BC80BD" "#CCEBC5" "#FFED6F"
par(cex=0.6)
boxplot(df$defense~df$type_1,col=COR,ylim=c(0,250),xlab="Tipo de Pokemon",ylab="Defesa",main="Gráfico boxplot da defesa pelo tipo de Pokemon")
Análise dos dados tratados
Por meio da base de dados df_pokemon foram analisadas as variáveis tipo de Pokemon e defesa e por meio dessa analise algumas informações podem ser observadas, por exemplo, a presença de outliers no bug, fire,ice, normal, psychic, rock e water. Também é possível perceber que os grupos com maior dispersão são ghost, ground, rock e steel, ou seja, esses grupos apresentam uma diversidade maior do nível de defesa. Dentro do boxplot um conjunto de dados terá uma distribuição simétrica quando a linha da mediana estiver no centro do retângulo, fato que só pode ser observado no tipo ground, dark e rock fora isso todos os outros são assimétricos.Vale ressaltar que a mediana é a medida de tendência central mais indicada quando os dados possuem distribuição assimétrica, uma vez que a média aritmética é influenciada pelos valores extremos (outliers). Nesse contexto, pode-se analisar, também, o desvio padrão sendo os maiores do rock,ice, ghost,steel,bug e ground. Já a média é maior a do tipo steel seguida pelo rock e ground, as maiores medianas também são desses 3 grupos.Pode-se observar que as maiores defesas são do tipo steel.