PASSO 1 - CARREGAR AS BASES

library(readr)
FullData <- read_csv("C:/Users/info/Desktop/Base_de_dados-master/complete-fifa-2017-player-dataset-global/FullData.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   .default = col_double(),
##   Name = col_character(),
##   Nationality = col_character(),
##   National_Position = col_character(),
##   Club = col_character(),
##   Club_Position = col_character(),
##   Club_Joining = col_character(),
##   Height = col_character(),
##   Weight = col_character(),
##   Preffered_Foot = col_character(),
##   Birth_Date = col_character(),
##   Preffered_Position = col_character(),
##   Work_Rate = col_character()
## )
## i Use `spec()` for the full column specifications.

PASSO 2 - Estatísticas Drible

Podemos ver abaixo nas estatísticas o valor Mínimo, Máximo, Mediana e Media em Dribbling dos jogadores do Fifa. É importante analisar a diferença entre a Média e Mediana, visto que temos alguns outliers com alto valor, acima de 90. Como poderemos ver no gráfico do passo 3.

summary(FullData$Dribbling)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     4.0    47.0    60.0    54.8    68.0    97.0

PASSO 3 - Histograma com Outliers

Abaixo, podemos observar que temos dois outliers claros: Menor que 5 e Maior que 90. Como dito anteriormente, outliers de valores altos acabam elevando o valor da média. Outra informação importante, é que a maioria de jogadores se concentram no terceiro quartil.

hist(FullData$Dribbling, col = "darkgreen", main = "Quantidade de jogadores na variável Dribbling do Fifa")