A presente atividade busca analisar a variável quantitativa “penalties” do banco de dados FullData.
library(readr)
FullData <- read_csv("Base_de_dados-master/complete-fifa-2017-player-dataset-global/FullData.csv")
##
## ── Column specification ────────────────────────────────────────────────────────
## cols(
## .default = col_double(),
## Name = col_character(),
## Nationality = col_character(),
## National_Position = col_character(),
## Club = col_character(),
## Club_Position = col_character(),
## Club_Joining = col_character(),
## Height = col_character(),
## Weight = col_character(),
## Preffered_Foot = col_character(),
## Birth_Date = col_character(),
## Preffered_Position = col_character(),
## Work_Rate = col_character()
## )
## ℹ Use `spec()` for the full column specifications.
# FullData
summary(FullData$Penalties)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7.00 39.00 50.00 49.17 61.00 96.00
# Histograma
hist(FullData$Penalties, col="#de8181", main = "Histograma da variável penalties", ylim = c(0,2500))
Ao observar o gráfico da referida variável, verifica-se uma baixa assimetria, sendo a mesma mais notória nas extremidades. As maiores frequências, numa escala de 0 a 2500, estão dispostas no intervalo entre 40 e 65, do eixo x, que contabiliza o número de penalties, numa escala de 0 a 100, enquanto as menores estão nos intervalos < 10, e > 80. O valor mínimo de penalties é 7 e o máximo é 96. Além disso, a média e a mediana dos valores da variável em questão são, respectivamente, 49.17 e 50. Há outliers no dado em análise, uma vez que existem valores que se encontram fora do intervalo entre o limite superior (82,17) e o limite inferior (16,17). Nesse sentido, por haver a presença de outliers, a mediana mostra-se como melhor opção estatística, uma vez que a média é sensível aos outliers.