library(readr)
FullData <- read_csv("C:/Users/info/Desktop/Base_de_dados-master/complete-fifa-2017-player-dataset-global/FullData.csv")
##
## -- Column specification --------------------------------------------------------
## cols(
## .default = col_double(),
## Name = col_character(),
## Nationality = col_character(),
## National_Position = col_character(),
## Club = col_character(),
## Club_Position = col_character(),
## Club_Joining = col_character(),
## Height = col_character(),
## Weight = col_character(),
## Preffered_Foot = col_character(),
## Birth_Date = col_character(),
## Preffered_Position = col_character(),
## Work_Rate = col_character()
## )
## i Use `spec()` for the full column specifications.
Podemos ver abaixo nas estatísticas o valor Mínimo, Máximo, Mediana e Media em Dribbling dos jogadores do Fifa. É importante analisar a diferença entre a Média e Mediana, visto que temos alguns outliers com alto valor, acima de 90. Como poderemos ver no gráfico do passo 3.
summary(FullData$Dribbling)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 4.0 47.0 60.0 54.8 68.0 97.0
Abaixo, podemos observar que temos dois outliers claros: Menor que 5 e Maior que 90. Como dito anteriormente, outliers de valores altos acabam elevando o valor da média. Outra informação importante, é que a maioria de jogadores se concentram no terceiro quartil.
hist(FullData$Dribbling, col = "darkgreen", main = "Quantidade de jogadores na variável Dribbling do Fifa")