Análise de dados quantitativos

Introdução

A presente atividade busca analisar a variável quantitativa “penalties” do banco de dados FullData.

Carregamento do banco de dados

library(readr)
FullData <- read_csv("Base_de_dados-master/complete-fifa-2017-player-dataset-global/FullData.csv")
## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   .default = col_double(),
##   Name = col_character(),
##   Nationality = col_character(),
##   National_Position = col_character(),
##   Club = col_character(),
##   Club_Position = col_character(),
##   Club_Joining = col_character(),
##   Height = col_character(),
##   Weight = col_character(),
##   Preffered_Foot = col_character(),
##   Birth_Date = col_character(),
##   Preffered_Position = col_character(),
##   Work_Rate = col_character()
## )
## ℹ Use `spec()` for the full column specifications.

Estatísticas descritivas

Média, mediana, mínimo e máximo
# FullData
summary(FullData$Penalties)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    7.00   39.00   50.00   49.17   61.00   96.00

Histograma

# Histograma
hist(FullData$Penalties, col="#de8181", main = "Histograma da variável penalties", ylim = c(0,2500))

Análise

Ao observar o gráfico da referida variável, verifica-se uma baixa assimetria, sendo a mesma mais notória nas extremidades. As maiores frequências, numa escala de 0 a 2500, estão dispostas no intervalo entre 40 e 65, do eixo x, que contabiliza o número de penalties, numa escala de 0 a 100, enquanto as menores estão nos intervalos < 10, e > 80. O valor mínimo de penalties é 7 e o máximo é 96. Além disso, a média e a mediana dos valores da variável em questão são, respectivamente, 49.17 e 50. Há outliers no dado em análise, uma vez que existem valores que se encontram fora do intervalo entre o limite superior (82,17) e o limite inferior (16,17). Nesse sentido, por haver a presença de outliers, a mediana mostra-se como melhor opção estatística, uma vez que a média é sensível aos outliers.