Primeiro, foi importada a base de dados de um arquivo do tipo CSV.
# -----------------------------------------------
# Carregar o banco de dados
# -----------------------------------------------
library(readr)
FifaData <- read_csv("C:/Users/berna_y/Documents/#Mestrado UFF/1º Período/Estatística Aplicada à Engenharia/Base_de_dados-master/FifaData.csv")
## Rows: 17588 Columns: 53
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
## dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Neste caso, ao conferir os dados, verificou-se que não existiam inconsistências a serem tratadas.
Foi feito um gráfico do tipo histograma com a variável “idade” dos jogadores da base de dados.
# -----------------------------------------------
# Histograma
# -----------------------------------------------
hist(FifaData$Age,
col = "skyblue",
main = "Gráfico 1 - Histograma da Idade dos Jogadores",
xlab = "idade dos jogadores",
ylab = "frequência")
Também foi feito um gráfico do tipo boxplot com a variável “idade” dos jogadores da base de dados.
# -----------------------------------------------
# Boxplot
# -----------------------------------------------
boxplot(FifaData$Age,col = "red",
main = "Gráfico 2 - Boxplot da Idade dos Jogadores")
Por fim, foram gerados para análise a média, o desvio-padrão, a mediana e os quartis dessa variável “idade”.
# -----------------------------------------------
# Análise Descritiva
# -----------------------------------------------
mean(FifaData$Age)
## [1] 25.46031
sd(FifaData$Age)
## [1] 4.680217
median(FifaData$Age)
## [1] 25
summary(FifaData$Age)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 17.00 22.00 25.00 25.46 29.00 47.00
A partir dos gráficos gerados e da análise descritiva, é possível concluir que:
1- A média de idade dos jogadores é de 25,46 anos, o que se aproxima da mediana (25 anos) e indica que não há outliers nos dados dessa variável;
2- O desvio-padrão (sd = 4,68) não é elevado nessa análise, o que sugere dados mais homogêneos de idade dentre os 17.588 jogadores analisados na pesquisa;
3- A idade mínima dos jogadores analisados é 17 anos e a máxima 47 anos. Ao observar os quartis, verifica-se que 25% dos jogadores possuem até 22 anos e 25% dos jogadores possuem entre 29 e 47 anos;
4- Pela análise do histograma, pode-se dizer que este é unimodal, assimétrico à direita e que a maior concentração de idade dos jogadores está entre 22 e 24 anos;
5- No gráfico de boxplot confirma-se a assimetria detectada para a variável idade, pois a densidade dos dados entre o primeiro quartil e a mediana é maior do que entre a mediana e o terceiro quartil.