Tomada de Decisão de um Clube Europeu

Resumo: Um clube Europeu de Futebol federado a FIFA tem apresentado desempenho inferior ao esperado. Após várias temporadas sem obter exito em seu campeonato regional, decidiu contratar um Ciêntista de Dados para avaliar as opções existentes no mercado. Seus sócios torcedores alegavam que o time tinha idade avançada e que os jogadores estavam velhos para o esporte e pareciam não apresentar “raça” ou velocidade. Prontamente o ciêntista de dados pois se avaliar a situação.

1ª Hipótese: Jogadores mais novos são mais rápidos?

Importando dados:

library(readr)
FifaData <- read_csv("G:/Meu Drive/MESTRADO/ESTATISTICA/Base_de_dados-master/FifaData.csv")
## Rows: 17588 Columns: 53
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (12): Name, Nationality, National_Position, Club, Club_Position, Club_Jo...
## dbl (41): National_Kit, Club_Kit, Contract_Expiry, Rating, Age, Weak_foot, S...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(FifaData)

O Cientista de Dados fez um Diagrama de dispersão de dados para analisar esta hipótese.

# Diagrama de Dispersão da Idade dos Jogadores
plot(FifaData$Age,FifaData$Speed, col="lightblue",pch=20, xlab= "Idade", ylab= "Velocidade")
abline(lsfit(FifaData$Age,FifaData$Speed),col="blue")

cor(FifaData$Age,FifaData$Speed)
## [1] -0.1684175

Análise: Ao estudar esta hipótese foi possível verificar que sim, há uma tendência de jogadores mais novos possuirem maior velocidade.

2ª Hipótese: Jogadores mais novos tem mais aceleração ?

O Cientista de Dados não tinha como medir a “raça” de um jogador, mas relacionou com a aceleração então fez um Diagrama de dispersão de dados para analisar esta hipótese.

# Diagrama de Dispersão da Idade dos Jogadores
plot(FifaData$Age,FifaData$Acceleration, col="lightblue",pch=20, xlab= "Idade", ylab= "Aceleração")
abline(lsfit(FifaData$Age,FifaData$Acceleration),col="blue")

cor(FifaData$Age,FifaData$Acceleration)
## [1] -0.1759384

Análise: Após analisar a segunda hipótese, observou que o sócio-torcedores também acertaram em relação ao seus palpites, isto é, o diagrama de dispersão dos jogadores da Base de dados também apontavam para a tendência que jogadores mais velhos também possuiam menos aceleração.

3ª Hipótese: Jogadores mais novos tem mais agilidade ?

O Cientista também decidiu analisar outra váriavel que intuitivamente lhe parecia se correlacionar com as anteriores, Agilidade, isto é, a habilidade de mudar a posição do corpo de maneira eficaz.

# Diagrama de Dispersão da Idade dos Jogadores
plot(FifaData$Age,FifaData$Agility, col="lightblue",pch=20, xlab= "Idade", ylab= "Agilidade")
abline(lsfit(FifaData$Age,FifaData$Agility),col="blue")

cor(FifaData$Age,FifaData$Agility)
## [1] -0.01945646

Análise: Após analisar a terceira hipótese, observou que a correlação entre a idade e a agilidade não era tão evidente.

Melhor Escolha

Com recursos limitados o clube, afinal já não ganhava um campeonato faz tempo, decidiram contratar um jogador cuja a caracteristica tivesse maior correlação com a idade. Além disso, o jogador deveria ter menos de 30 anos.

library(corrplot)
## corrplot 0.92 loaded
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
FifaData %>% select(Age,Speed,Acceleration,Agility) %>% 
  filter(Age <30) %>%
  cor() %>% corrplot()

Conclusão: Após alicar o filtro reduzindo a idade dos jogares apenas para 30 anos, observou-se uma mudança de cenário. A agilidade passou a ser a caracteristica com a correlação mais forte com a idade, entre as outras três.Observou-se também que a correlação entre Agilidade, Aceleração e Velocidade é forte. Então o ciêntista de dados opitou por escolher um Jogador Jovem e ágil, partindo da primicia que a escolha deveria ser da caracteristica com maior correlação com a idade. Sendo a correlação entre as outras caracteristicas forte, o ciêntista julgou a escolha como excelênte.