#Introdução

Aqui vamos olhar a base de dados:

library(readr)
FifaData <- read_csv("C:/Users/Usuario/Desktop/Base_de_dados-master/FifaData.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   .default = col_double(),
##   Name = col_character(),
##   Nationality = col_character(),
##   National_Position = col_character(),
##   Club = col_character(),
##   Club_Position = col_character(),
##   Club_Joining = col_character(),
##   Height = col_character(),
##   Weight = col_character(),
##   Preffered_Foot = col_character(),
##   Birth_Date = col_character(),
##   Preffered_Position = col_character(),
##   Work_Rate = col_character()
## )
## i Use `spec()` for the full column specifications.
View(FifaData)

Aqui vamos colocar um resumo dos dados:

summary(FifaData$Rating)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   45.00   62.00   66.00   66.17   71.00   94.00

Aqui vamos colocar o histograma:

hist(FifaData$Rating, col = "royalblue",
     main = "Histograma baseado no overall dos jogadores",
     xlab = "rating",
     ylab = "número de jogadores",
     ylim = c(0,6000))

A partir desse gráfico podemos perceber que apenas 25% dos jogadores possuem um rate maior que 71 e também apenas 25% possuem um overall inferior a 62. Sendo um jogo com diversas ligas e campeonatos, podemos notar que há um equilíbrio no rating dos jogadores, visto que há um elevado número de jogadores com uma avaliação em torno de 60 e 70. Ademais, é válido observar que mais de 5000 jogadores possuem um rating ao redor de 65 e 70, enquanto pouco mais de 1000 possuem um overall entre 75 e 80. Esse fato surpreende ainda mais quando analisamos a partir de 80, sendo nítido que nem 500 jogadores têm um rate maior que esse número.

Aqui vamos colocar o boxplot:

boxplot(FifaData$Rating, col = "red",
        main="boxplot baseado no overall dos jogadores")

Podemos notar que a linha preta é a mediana do gráfico, a qual é representada no valor de 66. Também é válido analisar que a parte em vermelho dentro do retângulo representa a maior quantidade de jogadores com estas avaliações, ou seja, entre 65 e 70 aproximadamente é onde apresenta mais atletas. Além disso, vale ressaltar os outliers, que são os valores mais discrepantes da base de dados. Como foi visto no gráfico do histograma, os números mínimos e máximos são os que se destacam por aparecerem menos vezes, e a partir do boxplot, podemos notar que valores abaixo de 50 e acima de 85 aproximadamente são os outliers, visto que poucos esportistas possuem um overall tão elevado ou tão baixo.