#Introdução
Aqui vamos olhar a base de dados:
library(readr)
FifaData <- read_csv("C:/Users/Usuario/Desktop/Base_de_dados-master/FifaData.csv")
##
## -- Column specification --------------------------------------------------------
## cols(
## .default = col_double(),
## Name = col_character(),
## Nationality = col_character(),
## National_Position = col_character(),
## Club = col_character(),
## Club_Position = col_character(),
## Club_Joining = col_character(),
## Height = col_character(),
## Weight = col_character(),
## Preffered_Foot = col_character(),
## Birth_Date = col_character(),
## Preffered_Position = col_character(),
## Work_Rate = col_character()
## )
## i Use `spec()` for the full column specifications.
View(FifaData)
Aqui vamos colocar um resumo dos dados:
summary(FifaData$Rating)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 45.00 62.00 66.00 66.17 71.00 94.00
Aqui vamos colocar o histograma:
hist(FifaData$Rating, col = "royalblue",
main = "Histograma baseado no overall dos jogadores",
xlab = "rating",
ylab = "número de jogadores",
ylim = c(0,6000))
A partir desse gráfico podemos perceber que apenas 25% dos jogadores possuem um rate maior que 71 e também apenas 25% possuem um overall inferior a 62. Sendo um jogo com diversas ligas e campeonatos, podemos notar que há um equilíbrio no rating dos jogadores, visto que há um elevado número de jogadores com uma avaliação em torno de 60 e 70. Ademais, é válido observar que mais de 5000 jogadores possuem um rating ao redor de 65 e 70, enquanto pouco mais de 1000 possuem um overall entre 75 e 80. Esse fato surpreende ainda mais quando analisamos a partir de 80, sendo nítido que nem 500 jogadores têm um rate maior que esse número.
Aqui vamos colocar o boxplot:
boxplot(FifaData$Rating, col = "red",
main="boxplot baseado no overall dos jogadores")
Podemos notar que a linha preta é a mediana do gráfico, a qual é representada no valor de 66. Também é válido analisar que a parte em vermelho dentro do retângulo representa a maior quantidade de jogadores com estas avaliações, ou seja, entre 65 e 70 aproximadamente é onde apresenta mais atletas. Além disso, vale ressaltar os outliers, que são os valores mais discrepantes da base de dados. Como foi visto no gráfico do histograma, os números mínimos e máximos são os que se destacam por aparecerem menos vezes, e a partir do boxplot, podemos notar que valores abaixo de 50 e acima de 85 aproximadamente são os outliers, visto que poucos esportistas possuem um overall tão elevado ou tão baixo.