Carregar a base de dados

Primeiro, foi importada a base de dados de um arquivo do tipo CSV.

# -----------------------------------------------
# Carregar o banco de dados
# -----------------------------------------------

library(readr)
FifaData <- read_csv("C:/Users/berna_y/Documents/#Mestrado UFF/1º Período/Estatística Aplicada à Engenharia/Base_de_dados-master/FifaData.csv")
## Rows: 17588 Columns: 53
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
## dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Tratamento dos dados

Neste caso, ao conferir os dados, verificou-se que não existiam inconsistências a serem tratadas.

Histograma

Foi feito um gráfico do tipo histograma com a variável “idade” dos jogadores da base de dados.

# -----------------------------------------------
# Histograma
# -----------------------------------------------

hist(FifaData$Age,
     col = "skyblue",
     main = "Gráfico 1 - Histograma da Idade dos Jogadores",
     xlab = "idade dos jogadores",
     ylab = "frequência")

Boxplot

Também foi feito um gráfico do tipo boxplot com a variável “idade” dos jogadores da base de dados.

# -----------------------------------------------
# Boxplot
# -----------------------------------------------

boxplot(FifaData$Age,col = "red",
        main = "Gráfico 2 - Boxplot da Idade dos Jogadores")

Análise Descritiva

Por fim, foram gerados para análise a média, o desvio-padrão, a mediana e os quartis dessa variável “idade”.

# -----------------------------------------------
# Análise Descritiva
# -----------------------------------------------

mean(FifaData$Age)
## [1] 25.46031
sd(FifaData$Age)
## [1] 4.680217
median(FifaData$Age)
## [1] 25
summary(FifaData$Age)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   17.00   22.00   25.00   25.46   29.00   47.00

Conclusão

A partir dos gráficos gerados e da análise descritiva, é possível concluir que:

1- A média de idade dos jogadores é de 25,46 anos, o que se aproxima da mediana (25 anos) e indica que não há outliers nos dados dessa variável;

2- O desvio-padrão (sd = 4,68) não é elevado nessa análise, o que sugere dados mais homogêneos de idade dentre os 17.588 jogadores analisados na pesquisa;

3- A idade mínima dos jogadores analisados é 17 anos e a máxima 47 anos. Ao observar os quartis, verifica-se que 25% dos jogadores possuem até 22 anos e 25% dos jogadores possuem entre 29 e 47 anos;

4- Pela análise do histograma, pode-se dizer que este é unimodal, assimétrico à direita e que a maior concentração de idade dos jogadores está entre 22 e 24 anos;

5- No gráfico de boxplot confirma-se a assimetria detectada para a variável idade, pois a densidade dos dados entre o primeiro quartil e a mediana é maior do que entre a mediana e o terceiro quartil.