Renato Villela e Gustavo Keoma
05 de dezembro de 2019
Renato Villela e Gustavo Keoma
05 de dezembro de 2019
A indústria de videogames vem crescendo nos últimos anos e hoje já é o maior segmento de entretenimento no mundo, superando inclusive a indústria cinematográfica. São notáveis os grandes investimentos e alto nível de detalhamento, em especial nos jogos de futebol. A confiança na base de dados dos jogos é tanta, que canais de comunicação e clubes já se utilizam dos games para analisar jogadores e servir de critério para contratações (vide links abaixo).
O exemplo mais famoso talvez seja do atual atacante da seleção brasileira e do Liverpool Roberto Firmino que, em 2011, foi contratado através de avaliação via videogame pelo Hoffenheim da Alemanha, por 4 milhões de euros, enquanto era jogador do Figueirense, que jogava a Série B do Brasileirão na época.
Portanto, o objeto deste estudo se faz relevante, ao passo que iremos nos debruçar sobre atributos dos jogadores dentro de um game e tentar achar critérios que façam com que alguns jogadores se sobressaiam em relação a outros e, com isso, também estaremos traçando um paralelo com a vida real.
O objetivo deste trabalho é analisar a base de dados do jogo eletrônico “Fifa 19” e realizar a comparação do overall dos jogadores em relação a determinadas variáveis, para testar a hipótese de que os melhores jogadores são bons com pé ruim e possuem alto valor de “composure/frieza”, ao mesmo tempo que os “skill moves” não são tão relevantes para tal. Analisaremos também se a perna preferida e a idade têm relevância nessa comparação.
Os dados representam os atributos de todos os jogadores registrados no jogo eletrônico “Fifa 19”, com base no site especializado “https://sofifa.com/”.
Fonte do arquivo “.csv”:
1- Overall:
Variável quantitativa discreta, com valor de 45 a 99, que representa a qualidade geral do jogadores, levando em conta os principais atributos em relação a posição que o jogador joga.
2- Weak Foot (Pé Ruim):
Variável qualitativa ordinal, com valor de 1 a 5, que representa a capacidade do jogador em utilizar o pé ruim, seja para chutes, passes ou cruzamentos.
3- Skill Moves (Habilidade):
Variável qualitativa ordinal, com valor de 1 a 5, que representa a capacidade do jogadore realizar determinados dribles e sua eficiência.
4- Composure (Frieza):
Variável quantitativa discreta, com valor de 1 a 99, que representa a capacidade mental do jogador de realizar ações sob pressão (sob marcação apertada, cara a cara com goleiro, com fadiga, etc.)
5- Age (Idade):
Variável quantitativa contínua, com valor de 15 a 45, que representa o tempo de vida de cada jogador.
6- Preferred Foot (Perna Preferida):
Variável qualitativa nominal, que representa a perna preferida do jogador. Direita ou esquerda.
18.207 linhas que representam os jogadores registrados no jogo.
Neste estudo serão utilizados boxplots, diagramas de dispersão, gráficos de barra e testes de correlação.
Boxplot: serve para medir as medianas (valor que indica o centro da distribuição) das variáveis, aferir a amplitude dos dados (valores máximos e mínimos), analisar a simetria dos conjuntos, e expor a presença de outliers (que são pontos fora da “caixa”).
Diagrama de Dispersão: gráfico que analisa a relação entre duas (ou mais) variáveis quantitativas (uma de efeito, chamada de variável dependente, e outras de causa, chamadas variáveis independentes), se há correlação positiva, negativa ou nula.
Gráfico de Barras: é utilizado para realizar comparações entre as categorias de uma variável qualitativa ou quantitativa discreta.
Teste de Correlação: é utilizado para analisar intensidade (forte quando próximo de 1 ou -1, e fraca quanto próximo de 0), direção (Positiva quando crescem no mesmo sentido, Negativa quando crescem em sentidos opostos) e significância (p ≤ α = significante / p > α = não significante).
* Como a base de dados do presente estudo possui mais de 5.000 observações, invocamos o Teorema Central do Limite e assumimos que as distribuições são normais.
Pelo Boxplot acima, podemos notar que as medianas de ambas as pernas se situam próximas e pouco abaixo do Overall 70, a amplitude e simetria são semelhantes, e a disposição dos outliers também é similar.
Logo, parece ser um critério não relevante para o estudo.
##
## Pearson's product-moment correlation
##
## data: fifa19$Overall and fifa19$Composure
## t = 142.94, df = 18157, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.7207384 0.7344271
## sample estimates:
## cor
## 0.7276552
O Diagrama de Dispersão acima apresenta uma curva de crescimento que demonstra que quanto maior o valor de Frieza (variável independente), maior o Overall (variável dependente). O teste de correlação aponta coeficiente acima de 0.7 e p-value menor que α (0,05).
Ou seja, há uma correlação positiva, forte e significativa entre as variáveis, demonstrando que os jogadores mais frios são os mais bem avaliados.
O Boxplot acima nos mostra que as medianas das categorias 4 e 5 são maiores que das categorias 1, 2 e 3. Assim como os valores mínimos e máximos das categorias 4 e 5 são superiores às categorias 1, 2 e 3. Porém as categorias 2 e 3 possuem uma quantidade considerável de outliers com Overall acima de 80.
Ou seja, esse critério parece relevante, mas se queremos definir critérios para os melhores dos melhores, é interessante restringir essa análise a jogadores com Overall mais alto.
O Boxplot acima restringe a comparação a jogadores com Overall entre 83 e 100. Neste cenário, ainda podemos observar que as medianas e valores máximos de Pé Ruim 4 e 5 estão acima dos demais.
Logo, podemos concluir que ser ambidestro é um critério pertinente para aferição da qualidade dos jogadores.
O Boxplot de Skill Moves se assemelha ao de Pé Ruim. Os jogadores das categorias 4 e 5 possuem medianas e valores mínimos e máximos superiores aos demais, porém há um considerável número de outliers nas categorias inferiores.
Ou seja, esse critério parece relevante. Contudo, iremos restringir da mesma forma a análise a jogadores com Overall 83 ou mais para uma apuração mais qualificada.
Ao restringir a análise a jogadores com Overall 83 ou mais, podemos perceber que as medianas e valores mínimo e máximos das categorias se apresentam de forma irregular. A mediana da categoria 2 é próxima da mediana da categoria 5 e maior que as demais. A mediana da categoria 3 está acima da mediana da categoria 4, cuja mediana é similar a da categoria 1, com o adendo de possuir valor máximo menor que a de 1.
Ou seja, podemos concluir que o alto nível de habilidade dos jogadores pode ser um indicativo de que estão acima da média geral, mas no nicho dos melhores, esse critério não possui muita correspondência.
O gráfico apresenta uma crescente de Overall até os 27 anos, e depois se mantém praticamente num mesmo padrão até os 34 anos. De 35 em diante, há um comportamento irregular.
Ou seja, podemos interpretar que até os 27 anos, os jogadores estão numa fase de evolução, e a partir dos 27 a maioria chega no seu auge, se mantendo por lá até os 34 anos.
Para tentar entender melhor o comportamento dos jogadores acima dos 34 anos, podemos fazer um corte na quantidade de atletas que continuam atuando, para analisar o fator aposentadoria.
Analisando o gráfico de barra acima, em consonância com o boxplot anterior de Overall por Idade, podemos perceber que há uma drástica queda no número de atletas ao avançar da idade. Queda drástica essa que não é acompanhada pela queda nos Overalls em jogadores acima de 34 anos.
Partindo do entendimento comum de que a partir dos 35 anos os jogadores estão em fase de aposentadoria, muito em parte pelo declínio físico natural do ser humano, apenas os jogadores que conseguem manter um desempenho bom, mesmo que inferior ao seu auge, continuam a jogar.
Sendo assim, a instabilidade do boxplot de Overall por idade após os 34 anos pode indicar que apostar em atletas mais experientes é arriscado, já que poucos continuam atuando e nada garante que os que permanecem conseguirão manter o nível por muito tempo.
Resumindo as análises, os critérios que se mostraram relevantes para aferição do Overall dos jogadores são os seguintes:
1- Frieza
2- Pé Ruim
3- Idade.
Após as análises das variáveis, podemos dizer que:
Logo, se o seu time está à procura de boa contratações, deve focar em atletas ambidestros, frios e balzaquianos entre 27 e 34 anos.