Nome: Paulo Roberto Mendonça Cirilo da Silva

Professor: Steven Dutt-Ross

Relatório Final

Sumário:

Inspirado pelo filme Moneyball (2011), que conta a trajetória de um economista que utilizou de estatisticas avançadas para determinar como administrar um orçamento limitado e concomitantemente levar mais vitórias a seu clube, observar os gastos salariais das equipes da MLB (Major League Baseball) nos últimos 20 anos e qual a relação entre investimento e vitórias.

1. Introdução

Os Estados Unidos possuem quatro grandes ligas de esportes. São elas: NFL (National Football League - Futebol Americano), NBA (National Basketball Association - Basquete), MLB (Major League Baseball - Beisebol) e NHL (National Hockey League - Hóquei no gelo). Uma peculiaridade sobre as ligas americanas é a presença do salary cap ou teto salarial, uma regra que funciona como um mecanismo que promove um equilibrio entre os times ao determinar a quantia máxima que cada time pode gastar com salários de jogadores, dessa forma fomentando a competitividade e entregando um produto melhor para o consumidor pois, em tese, os jogos são mais equilibrados e, por consequência, mais emocionantes.

Fazendo um breve paralelo com o futebol europeu, que é o esporte mais assistido no Brasil, para justificar a implementação e benefício do teto salarial, é fácil perceber que uma partida do campeonato espanhol entre Real Madrid e Getafe (respectivamente o primeiro colocado da tabela e o penúltimo) não tem a expectativa de ser um jogo emocionante e, assim, não gera tanta audiência e provavelmente só atrai fãs dos respectivos times, enquanto um jogo entre o mesmo Real Madrid e o Atlético de Madrid (atualmente em segundo na tabela do campeonato) é sempre um grande evento, tem muito mais audiência e é transmitido mundialmente para fãs de futebol no mundo todo, despertando interesse em fãs do esporte, não somente os fãs daquelas equipes.

Portanto, a proposta do salary cap (junto com outras regras que promovem o equilibrio dentro da liga e a competitividade) é um grande diferencial das ligas norte-americanas já que a idéia é jamais apresentar uma partida tão desequilibrada para o telespectador como Real Madrid e Getafe e tentar nivelar os times para que todos os jogos sejam tão emocionantes como Real Madrid x Atlético de Madrid.

Não só as partidas, semana a semana são, no geral, mais interessantes nas ligas americanas que adotam o salary cap, como o campeonato como um todo também fica mais emocionante e imprevisível.

Seguindo no exemplo do Campeonato Espanhol La Liga:

library(readxl)
library(flextable)
library(readr)
library(reactable)
library(dplyr)
library(huxtable)
library(readr)
library(readr)
espana <- read_csv("espana.csv", col_types = cols(Ano = col_character()))


espana %>% huxtable() %>% set_all_borders()
AnoCampeaoVice Campeao
2020Real MadridBarcelona
2019BarcelonaAtletico de Madrid
2018BarcelonaAtletico de Madrid
2017Real MadridBarcelona
2016BarcelonaReal Madrid
2015BarcelonaReal Madrid
2014Atletico de MadridBarcelona
2013BarcelonaReal Madrid
2012Real MadridBarcelona
2011BarcelonaReal Madrid
2010BarcelonaReal Madrid
2009BarcelonaReal Madrid
2008Real MadridVillareal
2007Real MadridBarcelona
2006BarcelonaReal Madrid
2005BarcelonaReal Madrid
2004ValenciaBarcelona
2003Real MadridReal Sociedad
2002ValenciaDeportivo La Coruna
2001Real MadridDeportivo La Coruna

Como podemos observar, nos últimos 20 anos do torneio, houve uma hegemonia muito grande dos clubes Barcelona e Real Madrid com pouquíssimos outros clubes aparecendo em primeiro ou segundo. Na verdade, Barcelona e Real Madrid foram primeiro e segundo juntos 60% das vezes (12/20) e pelo menos um dos dois apareceu como campeão ou vice 95% das vezes (19/20). Ao longo de 20 edições, um torneio com 20 clubes, apresenta pouquíssima variedade de resultado. Isso se deve, em maior parte, porque esses clubes supracitados são os maiores clubes e os que gastam mais dinheiro com jogadores e salários. Para se ter uma idéia, de acordo com Salary Sport, a folha salarial do Levante FC (14o colocado da edição de 2020 do torneio) é de 152,283,872 BRL por ano enquanto o Real Madrid gasta 1,652,813,240 BRL, aproximadamente dez vezes mais somente em salários. Após essa constatação, não é surpresa o sucesso de um e a falta de resultados do outro.

Em seguida, vamos observar a lista de campeões da NFL, liga que impõe o teto salarial para os clubes

nflvencedores <- read_csv("C:/Projeto/nflvencedores.csv", 
                          col_types = cols(Ano = col_character()))
nflvencedores %>% huxtable() %>% set_all_borders()
AnoCampeaoVice Campeao
2020Kansas City ChiefsSan Francisco 49ers
2019New England PatriotsLos Angeles Rams
2018Philadelphia EaglesNew England Patriots
2017New England PatriotsAtlanta Falcons
2016Denver BroncosCarolina Panthers
2015New England PatriotsSeattle Seahawks
2014Seattle SeahawksDenver Broncos
2013Baltimore RavensSan Francisco 49ers
2012New York GiantsNew England Patriots
2011Green Bay PackersPittsburgh Steelers
2010New Orleans SaintsIndianapolis Colts
2009Pittsburgh SteelersArizona Cardinals
2008New York GiantsNew England Patriots
2007Indianapolis ColtsChicago Bears
2006Pittsburgh SteelersSeattle Seahawks
2005New England PatriotsPhiladelphia Eagles
2004New England PatriotsCarolina Panthers
2003Tampa Bay BuccaneersOakland Raiders
2002New England PatriotsSaint Louis Rams
2001Baltimore RavensNew York Giants

Nos últimos 20 anos, mais da metade dos times da liga (19 dos 32) aparecem como campeão ou vice pelo menos uma vez e ao comparar esses resultados com os da La Liga, podemos ver nitidamente os efeitos do salary cap em ação: maior diversidade no topo, partidas mais acirradas e maior equilíbrio competitivo, culminando em um melhor produto para os consumidores.

Porém, dentre as quatro maiores ligas americanas já citadas, existe uma que não impõe o teto salarial aos clubes, que é a MLB (Major League Baseball). Apesar de adotar várias das outras medidas de balanceamento, como por exemplo a preferência da ordem de escolha dos novatos entrando na liga para os times com piores recordes na temporada anterior (prática comum nas quatro ligas), o que já contribui bastante para o equilíbrio da liga se comparado ao futebol europeu, a MLB não aderiu à imposição do teto salarial para os times. Com isso, naturalmente, certos clubes medianos e pequenos não tem os recursos necessários para oferecer salários exorbitantes de modo a atrair os melhores jogadores da liga. Abaixo segue uma tabela com os 25 maiores contratos de esporte já assinados (atualizada em fevereiro de 2021) , em milhões de USD:

library(readr)
top25salarios <- read_csv("C:/Projeto/top25salarios.csv", 
    col_types = cols(Contrato = col_character()))

top25salarios %>% huxtable()
JogadorEsporteContrato
Lionel MessiFutebol674
Patrick MahomesFutebol Americano503
Mike TroutBaseball426
Canelo AlvarezBoxe365
Mookie BettsBaseball365
Bryce HarperBaseball330
Giancarlo StantonBaseball325
Gerrit ColeBaseball324
Manny MachadoBaseball300
Alex Rodriguez 1Baseball275
Nolan ArenadoBaseball260
Alex Rodriguez 2Baseball252
Miguel CabreraBaseball248
Anthony RendonBaseball245
Stephen StrasburgBaseball245
Albert PujolsBaseball240
Robinson CanoBaseball240
Giannis AntetokoumpoBasquete229
James HardenBasquete228
Joey VottoBaseball225

É importante notar que alguns atletas têm seu contrato estruturado diferente, recebendo bonûs salariais que não contabilizaram para esta compilação; é o caso, por exemplo, de Cristiano Ronaldo, que está entre os atletas mais bem pagos do mundo, porém seu contrato assinado não registra entre os 25 maiores apesar de certamente estar entre os 25 atletas mais bem pagos do mundo. Também cabe notar que a lista não reflete salário semanal, mensal ou anual, e sim o valor bruto do contrato assinado, independente do número de anos nesse contrato, portanto essa não é uma lista de maior salário por mês ou ano e sim valor bruto, total do contrato.

Dito isto, observamos que a maioria dessa lista (80%) são jogadores de baseball. Para um clube mediano ou pequeno, oferecer um montante tão grande para um ou mais jogadores e montar um elenco capaz de competir com os times que tem os recursos ilimitados para montar um elenco impecável mostra-se um desafio extremo, como é o caso do Oakland Athletics, clube retratado no filme Moneyball (2011) e diante deste cenário começa minha análise.

2. Objetivo

O objetivo do estudo é observar os gastos salariais das equipes da MLB (Major League Baseball) e determinar a relação entre dolar gasto com salário, vitórias e títulos. Comparar os times que mais gastaram e observar se o gasto com payroll se traduziu em sucesso dentro da competição. Constatar se necessáriamente vitória se compra com gasto em salário e se obrigatóriamente mais gasto significa mais vitórias. Contemplar todas as relações entre os dados supracitados para determinar, assim como no filme, se existe uma maneira de gastar de forma mais eficiente, e qual o limite da boa gestão comparado ao poder aquisitivo dos clubes grandes.

3. Metodologia

Serão carregadas ao longo do estudo, de acordo com a necessidade de expor o tópico em questão, bases de dados que incluam salários dos jogadores, total gasto pelos times, jogador mais bem pago do time e seu ranking salarial comparado aos demais da liga, recorde de vitórias, campeões e vice campeões dos torneios e demais dados que se façam necessários para a análise dos últimos 20 anos da competição.

De forma a continuar a apresentar o trabalho de forma didática, esses dados serão apresentados na ordem que se faça necessário a demonstração estatística de forma a corroborar com o texto.

4. Discussões e Resultados

Primeiro, com o objetivo de começar a observar a relação entre gasto com payroll (folha salarial) e vitórias, faz-se imperativo destacar o formato da MLB. Uma temporada consiste em duas partes: a primeira, chamada de temporada regular, cada time joga 162 partidas, sem a possibilidade de empate, para definir a classificação dentro das suas respectivas divisões e conferências. É importante observar que 162 partidas é um universo muito grande quando se trata de análise estatística no mundo dos esportes. Sabemos que quanto maior o universo, mais fiel é a estatística, portanto pode-se dizer que após todas essas partidas, geralmente os melhores times ocupam as melhores colocações. Diferente de um torneio como a copa do mundo, por exemplo, onde um resultado ruim pode causar a eliminação da competição; se imaginarmos que poderíamos repetir os confrontos da copa do mundo 100 ou mais vezes para cada seleção, e então pegar a média dos resultados e assim decidir quem avança a cada estágio da competição, certamente nossas previsões baseadas nos elencos mais fortes, seriam mais precisas, meramente por expandirmos o universo. Utilizo desse exemplo para aludir que na MLB, dado a quantidade de jogos, os melhores times, muito provavelmente, vão ocupar as melhores posições e portanto nossa análise será bem fidedigna.

A segunda parte da temporada consiste nos playoffs. Se classificam para os playoffs somente 8 dos 32 times: os times com mais vitórias de cada uma das 6 divisões mais outros dois times com melhor recorde que não ganharam suas divisões. Depois de pareados, os times disputam séries melhor de 7, ou seja o primeiro time a conquistar 4 vitórias avança para a próxima fase. Apesar desse modelo ser mais justo que um de eliminação simples, como foi citada a Copa do Mundo, se comparado com o universo de 162 jogos, uma série de 4 a 7 jogos é um tamanho amostral muito pequeno.

Considerando ambas as partes da estrutura do torneio, podemos afirmar que o número de vitórias na temporada regular e a colocação do time ao fim dos 162 jogos, é um indicativo mais preciso do sucesso do mesmo que o resultado final dos playoffs (vencedor da temporada), já que este ultimo universo amostral é menor e desta forma mais sujeito a imprecisões. Por isto, as análises foram feitas separadamente.

Como ponto de partida vamos observar a temporada de 2001

library(RColorBrewer)
X2001B <- read_csv("C:/Projeto/2001B.txt", 
                   col_types = cols(`Team Payroll` = col_number(), 
                                    W = col_number(), L = col_number(), 
                                    WPct = col_number(), `Last Yr Payroll` = col_number()))

X2001B %>% reactable(bordered = TRUE)

Primeiramente vamos calcular a média dos team payroll

mean(X2001B$`Team Payroll`)
## [1] 65428060

Em seguida, a média de vitórias dos times

mean(X2001B$W)
## [1] 80.93333

Agora vamos dividir esses valores a fins de determinar o preço médio de uma vitória

kc01 <- mean(X2001B$`Team Payroll`) / mean(X2001B$W)
kc01
## [1] 808419.2

Descobrimos que a média que se gastou na liga em 2001 com salários foi $65.428.060 USD, a média de vitórias dos times é 80.93 e portanto o preço médio de uma vitória custa $808.419,2 USD . Com esse valor, conseguimos determinar a expectativa de vitórias de um time por dólar gasto em comparação com o resultado e perceber se o dinheiro foi gasto de forma eficiente em comparação com os demais times.

Para este exercício vamos pegar dois times: O Oakland Athletics, um dos menores times da liga, com um dos menores orçamentos e, naturalmente, menor expectativa de vitórias e compará-los com o New York Yankees, indubitávelmente uma das maiores marcas do mundo e certamente o clube com mais recursos da MLB.

library(readxl)
Nibble <- read_excel("C:/Projeto/Nibble.xlsx", 
                     col_types = c("numeric", "text", "numeric", 
                                   "numeric", "numeric", "numeric", 
                                   "numeric", "numeric"))

Nibble %>% flextable() %>% theme_box()

Após observarmos tais dados reparamos que o Yankees, time que mais gastou em 2001, ganhou 95 jogos na temporada regular, o que é uma excelente marca e bem acima da média da liga, porém sua expectativa de vitórias dado seu investimento era de 138.9 e seu custo por vitória foi de $1.181.969,90 USD, bem mais caro que a média da liga de $808.419,20 USD. Já o Oakland Athletics, com somente 33.8 mi, segundo menor payroll de toda a liga, tinha uma singela expectativa de vitória de 41.8, porém conquistou 102 vitórias e pagou somente $331.477,90 USD por cada, menos da metade da média da liga em 2001.

Essa é a proposta do filme Moneyball que inspirou esse estudo. O Oakland Athletics é um time de recursos limitados porém fazendo uso de análises estatísticas avançadas (Sabermetrics) é possível gastar de forma inteligente e ser relevante e competitivo.

Apesar de ter se sobressaído mais durante a temporada regular, o Athletics de 2001 foi eliminado pelos próprios Yankees, na segunda rodada dos playoffs e o time de Nova Iorque se consagrou campeão da temporada. Por isso foi importante destacar inicialmente a imprevisibilidade dos playoffs, por ser um universo muito menor, quando comparado aos 162 jogos da temporada regular como medida de sucesso estatísticamente.

Importante notar também, que esta demonstração não serve para dizer que o Yankees investiu mal ou gastou dinheiro desnecessáriamente. Na verdade vários fatores entram na decisão de investir em salários de jogadores: jogadores famosos, que geralmente são grandes contratações, vendem mais camisas, atraem mais pessoas aos estádios, geram mais renda de patrocínios, contratos de TV e demais rendas relacionadas a visibilidade, dentre várias outras considerações. Devido à complexidade que é administrar um time desse porte, este estudo se limitou a analisar a eficiência dos gastos com um único objetivo em mente: vitórias.

Vamos observar um barplot que mostra os times mais vitoriosos nos últimos 20 anos (fonte: reddit)

Porcentagem de vitória nos últimos 20 anos

Continuando a análise, percebemos que os 4 times com mais vitórias nesse período foram: (1) New York Yankees, (2) St. Louis Cardinals, (3) Boston Red Sox e (4) Los Angeles Angels; o Oakland Athletics se encontra na oitava posição. Como espaço amostral para continuar o estudo, escolhi 4 temporadas e como critério selecionei um ano em que cada um desses 4 times foram de fato campeões da liga: 2002 (Angels), 2004 (Red Sox), 2009 (Yankees) e 2011 (Cardinals). Além de analisar os times mais vitoriosos, acompanharemos a trajetória do Oakland Athletics.

À partir deste ponto vamos analisar a tabela somente com as informações pertinentes sobre os times em questão ao invés de observar todos os times da liga, com o intuito de clarear nossa análise e destacar os dados mais importantes. Importante notar que os cálculos de média de team payroll e média de vitórias, que são fundamentais para determinar a expectativa de vitórias por dolar e o custo das vitórias, foram feitos considerando todos os 30 times da liga durante o ano em questão.

Temporada 2002 (Angels campeão)

library(flextable)
library(readxl)
X2002top4 <- read_excel("C:/Projeto/2002top4.xlsx", 
    col_types = c("numeric", "text", "numeric", 
        "numeric", "numeric", "numeric", 
        "numeric", "numeric"))
X2002top4 %>% flextable() %>% theme_box()

Temporada 2004 (Red Sox campeão)

library(readxl)
X2004top4 <- read_excel("C:/Projeto/2004top4.xlsx", 
    col_types = c("numeric", "text", "numeric", 
        "numeric", "numeric", "numeric", 
        "numeric", "numeric"))
X2004top4 %>% flextable() %>% theme_box()

Um fato interessante sobre a temporada de 2004 é que após o sucesso do Oakland Athletics em 2001, temporada retratada no filme, os diretores do Boston reconheceram que o estudo e a aplicação das estatísticas Sabermetrics eram o futuro do baseball e tentaram contratar o economista que implantou esse conceito no Oakland. Ele recusou, porém o Boston contratou outra pessoa e insistiu que adotassem este modelo e isso resultou em um título para o clube, que não ganhava há 86 anos!

Temporada 2009 (Yankees campeão)

library(readxl)
X2009top4 <- read_excel("C:/Projeto/2009top4.xlsx", 
    col_types = c("numeric", "text", "numeric", 
        "numeric", "numeric", "numeric", 
        "numeric", "numeric"))
X2009top4 %>% flextable() %>% theme_box()

Temporada 2011 (Cardinals campeão)

library(readxl)
X2011top4 <- read_excel("C:/Projeto/2011top4.xlsx", 
    col_types = c("numeric", "text", "numeric", 
        "numeric", "numeric", "numeric", 
        "numeric", "numeric"))
X2011top4 %>% flextable() %>% theme_box()

5. Conclusão

Na MLB, a temporada regular e seus 162 jogos nos fornecem um excelente universo amostral para coletarmos dados. O formato mais dinâmico e curto dos playoffs atribuem uma natureza imprevisível para o resultado final. Sem a limitação imposta pelo salary cap, o New York Yankees, assim como o Real Madrid na la liga, faz questão de investir pesado nos salários dos jogadores, contratando diversos dos melhores jogadores da liga e realmente montando super-times ano após ano.

Observamos que o Yankees gasta tanto, que por vezes, sua expectativa de vitórias baseadas em dólar gasto comparado com a média da liga é impossível de ser alcançada pois ultrapassa os 162 jogos totais da temporada, ou seja, nem se eles ganhassem absolutamente todos os jogos seria possível. Percebemos, também, que isso na verdade acontece com todos os times que mais gastam, como é o caso do Red Sox e dos Angels. A expectativa de vitórias desses times baseado nos gastos são virtualmente inalcançáveis. Isso nos diz que as vitórias que ultrapassam a média da liga, são, de fato, mais caras, e por mais que o alto investimento não se traduza necessáriamente em mais vitórias, o piso desses times é muito mais alto que os demais. Claro que pensando só no aspecto financeiro, para o Yankees qualquer temporada que não culimine em título seria uma decepção, só que apesar de não ganhar todo ano, o valor exuberante gasto anualmente com salários garante que o clube sempre seja relevante na disputa pelo título e aumenta consideravelmente o piso de vitórias. Percebemos exatamente isso também, em menor escala, com o Boston Red Sox, que se mantém dentre os 5 que mais gastam com payroll.

Analisando a trajetória do Oakland Athletics, constatamos que é possível ser muito bem sucedido e superar as expectativas com um orçamento muito limitado, através de boas contratações e uso inteligente e comedido do orçamento, porém esse sucesso é difícil de ser sustentado. Numa liga tão disputada como essa, é muito difícil se manter nas cabeças sempre investindo menos. Cabe contemplar também a idéia que, uma vez que o Oakland mostrou ao mundo sua inovadora forma de pensar e o uso das Sabermetrics, esse conhecimento se propagou e outros times fizeram uso dessa metodologia, inclusive times com mais capital, que combinaram as duas forças (poder aquisitivo e investimentos inteligentes), como mencionei o exemplo do Boston Red Sox, um time grande, que tem bastante orçamento para gastar com team payroll e desde a ascenção do Athletics em 2001, implementou o uso dessa mentalidade. Não é surpresa, que ao combinar “poder gastar” com “saber gastar”, o Red Sox é o time que mais ganhou títulos nos ultimos 20 anos, com 4 (2004, 2007, 2013, 2018).

Esse estudo, então, constata que é possível comprar vitórias, investindo uma quantia exorbitante em salários, garantindo um mínimo de vitórias (piso) elevado; também é possível obter sucesso com um orçamento restrito, porém esse sucesso não é sustentável. Por fim, observamos que a melhor fórmula para o sucesso, quando se pensa em máximo número de vitórias possível, é quando um clube grande, com vastos recursos, usa-os de forma inteligente, aplicando os conceitos de Sabermetrics de produção por dólar gasto.

Referências

Mlb Advanced Media. MLB. Disponível em: https://www.mlb.com/. Acesso em: 23 set. 2021.

LLC, Sports Reference. Baseball Reference. Disponível em: https://www.baseball-reference.com/. Acesso em: 23 set. 2021.

SPORT, Salary. Salary Sport. Disponível em: https://salarysport.com/. Acesso em: 23 set. 2021.

O HOMEM que mudou o jogo. Direção de Benett Miller. Produção de Brad Pitt, Michael de Luca, Rachael Horovitz. Realização de Columbia Pictures. Roteiro: Steven Zaillian, Aaron Sorkin, Stan Chervin. S.I.: Michael de Luca Productions, Scott Rudin Productions, 2011. (133 min.)

SIMMONS, Bill. Now i can die in peace. New York: Espn Books, 2005.