A indústria de videogames vem crescendo nos últimos anos e hoje já é o maior segmento de entretenimento no mundo, superando inclusive a indústria cinematográfica. São notáveis os grandes investimentos e alto nível de detalhamento, em especial nos jogos de futebol. A confiança na base de dados dos jogos é tanta, que canais de comunicação e clubes já se utilizam dos games para analisar jogadores e servir de critério para contratações (vide links abaixo).
O exemplo mais famoso talvez seja do atual atacante da seleção brasileira e do Liverpool Roberto Firmino que, em 2011, foi contratado através de avaliação via videogame pelo Hoffenheim da Alemanha, por 4 milhões de euros, enquanto era jogador do Figueirense, que jogava a Série B do Brasileirão na época.
Portanto, o objeto deste estudo se faz relevante, ao passo que iremos nos debruçar sobre atributos dos jogadores dentro de um game e tentar achar critérios que façam com que alguns jogadores se sobressaiam em relação a outros e, com isso, também estaremos traçando um paralelo com a vida real.
O objetivo deste trabalho é analisar a base de dados do jogo eletrônico “Fifa 19” e realizar a comparação do overall dos jogadores em relação a determinadas variáveis, para testar a hipótese de que os melhores jogadores são bons com a perna ruim e possuem alto valor de “composure / frieza”, ao mesmo tempo que os “skill moves” não são tão relevantes para tal. Analisaremos também se o pé preferido e a idade têm relevância nessa comparação.
Os dados representam os atributos de todos os jogadores registrados no jogo eletrônico “Fifa 19”, com base no site especializado “https://sofifa.com/”.
Fonte do arquivo “.csv”:
https://www.kaggle.com/karangadiya/fifa19
1- Overall:
Variável quantitativa discreta, com valor de 45 a 99, que representa a qualidade geral do jogadores, levando em conta os principais atributos em relação a posição que o jogador joga.
2- Weak Foot (Perna Ruim):
Variável quantitativa discreta, com valor de 1 a 5, que representa a capacidade do jogador em utilizar a perna ruim, seja para chutes, passes ou cruzamentos.
3- Skill Moves (Habilidade):
Variável quantitativa discreta, com valor de 1 a 5, que representa a capacidade do jogadore realizar determinados dribles e sua eficiência.
4- Composure (Frieza):
Variável quantitativa discreta, com valor de 1 a 99, que representa a capacidade mental do jogador de realizar ações sob pressão (sob marcação apertada, cara a cara com goleiro, com fadiga, etc.)
5- Age (Idade):
Variável quantitativa contínua, com valor de 15 a 45, que representa o tempo de vida de cada jogador.
6- Preferred Foot (Perna Preferida):
Variável qualitativa nominal, que representa a perna preferida do jogador. Direita ou esquerda.
18.207 linhas que representam os jogadores registrados no jogo.
Neste estudo serão utilizados boxplots, diagramas de dispersão e gráfico de barra.
Boxplot: serve para medir as medianas (valor que indica o centro da distribuição) das variáveis, aferir a amplitude dos dados (valores máximos e mínimos), analisar a simetria dos conjuntos, e expor a presença de outliers (que são pontos fora da “caixa”).
Diagrama de Dispersão: gráfico que analisa a relação entre duas (ou mais) variáveis quantitativas (uma de efeito, chamada de variável dependente, e outras de causa, chamadas variáveis independentes), se há correlação positiva, negativa ou nula.
Gráfico de Barras: é utilizado para realizar comparações entre as categorias de uma variável qualitativa ou quantitativa discreta.
fifa19$`Preferred Foot`<-as.factor(fifa19$`Preferred Foot`)
levels(fifa19$`Preferred Foot`) <- c('Esquerda', 'Direita')
boxplot(fifa19$Overall~fifa19$`Preferred Foot`, col= c("red", "blue"), xlab= "Perna Preferida", ylab= "Overall", main= "Overall por Perna Preferida")
Pelo Boxplot acima, podemos notar que as medianas de ambas as pernas se situam próximas e pouco abaixo do Overall 70, a amplitude e simetria são semelhantes, e a disposição dos outliers também é similar. Logo, não parecem ser um critério relevante para o estudo.
plot(fifa19$Overall~fifa19$Composure, col= "orange", xlab= "Frieza", ylab= "Overall", main= "Overall por Frieza")
abline(lm(fifa19$Overall~fifa19$Composure))
O Diagrama de Dispersão acima apresenta uma curva de crescimento que demonstra que quanto maior o valor de Frieza (variável independente), maior o Overall (variável dependente). Ou seja, há uma correlação positiva entre as variáveis, que demonstra que os jogadores mais frios são os mais bem avaliados.
fifa19$`Weak Foot`<-as.factor(fifa19$`Weak Foot`)
boxplot(fifa19$Overall~fifa19$`Weak Foot`, col= "green", xlab= "Pé Ruim", ylab= "Overall", main= "Overall por Pé Ruim")
O Boxplot acima nos mostra que as medianas das categorias 4 e 5 são maiores que das categorias 1, 2 e 3. Assim como os valores mínimos e máximos das categorias 4 e 5 são superiores às categorias 1, 2 e 3. Porém as categorias 2 e 3 possuem uma quantidade considerável de outliers com Overall acima de 80. Ou seja, esse critério parece relevante, mas se queremos definir critérios para os melhores dos melhores, é interessante restringir essa análise a jogadores com Overall mais alto.
O Boxplot acima restringe a comparação a jogadores com Overall entre 83 e 100. Neste cenário, ainda podemos observar que as medianas e valores máximos de Pé Ruim 4 e 5 estão acima dos demais. Logo, podemos concluir que ser ambidestro é um critério pertinente para aferição da qualidade dos jogadores.
fifa19$`Skill Moves`<-as.factor(fifa19$`Skill Moves`)
boxplot(fifa19$Overall~fifa19$`Skill Moves`, col= "lightblue", xlab= "Skill Moves", ylab= "Overall", main= "Overall por Skill Moves")
O Boxplot de Skill Moves se assemelha ao de Pé Ruim. Os jogadores das categorias 4 e 5 possuem medianas e valores mínimos e máximos superiores aos demais, porém há um considerável número de outliers nas categorias inferiores. Ou seja, esse critério parece relevante. Portanto, iremos restringir da mesma forma a análise a jogadores com Overall 83 ou mais para uma apuração mais qualificada.
Ao restringir a análise a jogadores com Overall 83 ou mais, podemos perceber que as medianas e valores mínimo e máximos das categorias se apresentam de forma irregular. A mediana da categoria 2 é próxima da mediana da categoria 5 e maior que as demais. A mediana da categoria 3 está acima da mediana da categoria 4, cuja mediana é similar a da categoria 1, com o adendo de possuir valor máximo menor que a de 1.
Ou seja, podemos concluir que o alto nível de habilidade dos jogadores pode ser um indicativo de que estão acima da média geral, mas no nicho dos melhores, esse critério não possui muita correspondência.
fifa19$Age<-as.factor(fifa19$Age)
boxplot(fifa19$Overall~fifa19$Age, col= "skyblue", xlab= "Idade", ylab= "Overall", main= "Overall por Idade", las=2)
O gráfico apresenta uma crescente de Overall até os 27 anos, e depois se mantém praticamente num mesmo padrão até os 34 anos. De 35 em diante, há um comportamento irregular.
Ou seja, podemos interpretar que até os 27 anos, os jogadores estão numa fase de evolução, e a partir dos 27 a maioria chega no seu auge, se mantendo por lá até os 34 anos. Para tentar entender melhor o comportamento dos jogadores acima dos 34 anos, podemos fazer um corte na quantidade de atletas que continuam atuando, para analisar o fator aposentadoria.
Analisando o gráfico de barra acima, em consonância com o boxplot anterior de Overall por Idade, podemos perceber que há uma drástica queda no número de atletas ao avançar da idade. Queda drástica essa que não é acompanhada pela queda nos Overalls em jogadores acima de 34 anos.
Partindo do entendimento comum de que a partir dos 35 anos os jogadores estão em fase de aposentadoria, muito em parte pelo declínio físico natural do ser humano, apenas os jogadores que conseguem manter um desempenho bom, mesmo que inferior ao seu auge, continuam a jogar.
Sendo assim, a instabilidade do boxplot de Overall por idade após os 34 anos pode indicar que apostar em atletas mais experientes é arriscado, já que poucos continuam atuando e nada garante que os que permanecem conseguirão manter o nível por muito tempo.
Resumindo as análises, os critérios que se mostraram relevantes para aferição do Overall dos jogadores são os seguintes:
1- Frieza
2- Pé Ruim
3- Idade.
Após as análises das variáveis, podemos dizer que:
Logo, se o seu time está à procura de boa contratações, deve focar em atletas ambidestros, frios e balzaquianos entre 27 e 34 anos.