Introdução

O esporte universitário norte-americano é um espaço importante de formação, visibilidade e acesso a oportunidades. Historicamente, porém, essas oportunidades não foram distribuídas de forma equilibrada entre homens e mulheres. A criação do Title IX, em 1972, buscou reduzir esse problema ao proibir discriminação por sexo em programas educacionais financiados pelo governo federal, incluindo o atletismo universitário.

Figura 1: Protesto contra o concurso Miss América, em 1968, associado às reivindicações por igualdade de gênero.

Figura 2: Assinatura do Title IX, em 1972, marco legal importante para a igualdade de oportunidades educacionais nos Estados Unidos.

Mesmo com esse marco legal, a presença de equipes femininas não garante, por si só, condições equivalentes de financiamento. Por isso, este projeto investiga se a diferença de despesas entre modalidades masculinas e femininas na NCAA Divisão I diminuiu ou aumentou ao longo da última década. Uma segunda questão analisada é a justificativa de que esportes masculinos de grande audiência, especialmente o futebol americano, sustentariam financeiramente os departamentos esportivos.

Para responder a essas perguntas, foram utilizados microdados oficiais do Equity in Athletics Data Analysis (EADA), cobrindo os anos acadêmicos de 2013-2014 a 2023-2024. A análise consolida arquivos anuais, cruza dados esportivos e institucionais, cria métricas como gasto por atleta e lucro líquido, e apresenta os resultados por meio de gráficos e tabelas. Os resultados podem apoiar discussões de gestores universitários, equipes de compliance, pesquisadores, jornalistas e associações interessadas em acompanhar a distribuição de recursos no esporte universitário.

Pacotes

Para facilitar a reprodução da análise, todas as bibliotecas utilizadas foram carregadas no início do documento. A tabela abaixo resume a função de cada pacote no código:

library(tidyverse)
library(readxl)
library(knitr)
library(scales)
library(DT)
library(plotly)
Pacote Descrição
tidyverse Manipulação e limpeza dos dados (dplyr, tidyr) e criação dos gráficos base (ggplot2).
readxl Leitura automatizada dos microdados originais direto das planilhas Excel (.xlsx).
knitr Processamento do RMarkdown e geração estruturada do relatório final.
scales Formatação visual dos eixos gráficos (como a conversão de valores brutos para formato monetário).
DT Geração de tabelas HTML interativas, permitindo paginação e busca dinâmica.
plotly Transformação dos gráficos estáticos em visuais interativos (hover, zoom e filtros).

Preparação dos Dados

Esta etapa organiza os registros governamentais brutos em uma estrutura adequada para análise. Como o projeto trabalha com dados de vários anos, a padronização dos arquivos foi uma parte importante do processo.

Fonte e Documentação

Os dados utilizados foram obtidos no Equity in Athletics Data Analysis (EADA), sistema público mantido pelo Office of Postsecondary Education, do Departamento de Educação dos Estados Unidos: https://ope.ed.gov/athletics/#/datafile/list.

O EADA reúne informações reportadas anualmente por instituições de ensino superior coeducacionais que recebem recursos federais de auxílio estudantil (Title IV) e mantêm programas esportivos intercolegiais.

O objetivo original da base não é produzir uma pesquisa acadêmica, mas dar transparência pública sobre participação atlética, equipes técnicas, receitas e despesas por gênero e modalidade. Esses dados são usados por estudantes, famílias, pesquisadores, jornalistas e órgãos de fiscalização para acompanhar se as instituições oferecem oportunidades esportivas de forma compatível com as exigências de divulgação associadas ao Title IX.

O recorte deste projeto cobre os anos acadêmicos de 2013-2014 a 2023-2024. Como os arquivos são anuais, cada observação foi associada ao respectivo ano acadêmico extraído do nome da pasta. A análise usa principalmente dois arquivos de cada ano:

  • Schools.xlsx: contém informações por instituição, esporte e gênero, incluindo participação, receitas e despesas das modalidades.
  • Instlevel.xlsx: contém informações institucionais, como nome da universidade, estado, setor administrativo e classificação atlética.

Também foram usados os dicionários técnicos SchoolsDoc.doc e InstlevelDataDoc.doc para interpretar as variáveis. Esses documentos ajudam a identificar o significado das colunas, o tipo de informação registrada e peculiaridades da base. Entre essas peculiaridades estão: dados originalmente em formato largo, nomes de colunas com variações entre anos, valores numéricos lidos como texto e campos vazios em variáveis esportivas.

Nesta análise, valores ausentes foram substituídos por zero apenas nas variáveis selecionadas de receita, despesa e participação, pois nesses casos a ausência pode indicar que a universidade não ofertou determinada modalidade naquele ano.

Outra limitação importante é que os arquivos oficiais são gerados após cada ciclo de coleta. Portanto, eles refletem os dados disponíveis no fechamento daquele ciclo e podem não incorporar correções feitas posteriormente. Por esse motivo, os resultados devem ser lidos como uma análise exploratória dos registros oficiais disponibilizados, e não como uma auditoria financeira completa das universidades.

Dicionário de Dados Estrutural

Os arquivos originais possuem milhares de colunas por ano, pois reúnem informações institucionais e financeiras em registros amplos. Para manter a análise focada, foram selecionadas apenas as variáveis mais relevantes para o estudo:

Variável Original Descrição Técnica e Regra de Negócio
caminho_arquivo Variável criada durante a importação para identificar o ano de cada arquivo.
unitid Identificador único do Ministério da Educação para a instituição (Chave Primária).
institution_name Nome oficial da universidade.
sector_name Classificação administrativa (ex: Public, Private nonprofit).
classification_name Divisão atlética. Foco deste estudo: NCAA Division I.
GRND_TOTAL_REVENUE Receita total bruta do departamento de atletismo.
GRND_TOTAL_EXPENSE Despesa total bruta do departamento de atletismo.
EXP_MEN / EXP_WOMEN Despesas Operacionais Totais por gênero (Game Day Expenses).
REV_MEN / REV_WOMEN Receitas Totais atribuíveis diretamente a cada gênero.

Importação, Empilhamento e Limpeza

A transformação dos dados brutos seguiu um processo organizado para lidar com arquivos de diferentes anos e com a junção entre bases:

  1. Leitura dinâmica: foram usadas expressões regulares (regex) para localizar automaticamente as pastas anuais. Para reduzir problemas causados por mudanças de formatação ao longo dos anos, todas as colunas foram inicialmente lidas como texto (col_types = "text").
  2. Chave composta: o ano acadêmico foi extraído do nome da pasta e combinado com o unitid, permitindo cruzar os dados esportivos com as informações institucionais do mesmo ano.
  3. Tratamento de ausências: após a junção, as variáveis financeiras foram convertidas para formato numérico. Seguindo a interpretação da documentação, valores vazios nas variáveis selecionadas foram tratados como modalidades não ofertadas e preenchidos com zero.
  4. Delimitação de escopo: a amostra foi restrita à NCAA Divisão I, evitando misturar instituições com perfis esportivos e orçamentários muito diferentes.
# 1. Mapeamento dos arquivos
caminho_raiz <- "dados"
if (!dir.exists(caminho_raiz)) {
  caminho_raiz <- "~/Documentos/data_science/dados"
}

arquivos_inst <- list.files(path = caminho_raiz, 
                            pattern = "(?i)instlevel\\.xlsx$", 
                            recursive = TRUE, full.names = TRUE)

arquivos_schools <- list.files(path = caminho_raiz, 
                               pattern = "(?i)schools\\.xlsx$", 
                               recursive = TRUE, full.names = TRUE)

# 2. Função para ler em lote, empilhar e extrair o ano
empilhar_e_extrair_ano <- function(lista_arquivos) {
  lista_arquivos %>%
    set_names() %>%
    map_dfr(~ read_excel(.x, col_types = "text"), .id = "caminho_arquivo") %>%
    mutate(Ano_Academico = str_extract(caminho_arquivo, "20[0-9]{2}-20[0-9]{2}")) %>%
    select(-caminho_arquivo)
}

# 3. Executando a leitura das duas dimensões de dados
dados_instituicao <- empilhar_e_extrair_ano(arquivos_inst)
dados_esportes <- empilhar_e_extrair_ano(arquivos_schools)

# 4. Fusão dos Datasets 
dados_completos <- inner_join(dados_esportes, dados_instituicao, 
                              by = c("unitid", "Ano_Academico"))

# 5. Limpeza, Tipagem Numérica e Filtro
dados_limpos <- dados_completos %>%
  rename(
    sector_name = sector_name.x,
    institution_name = institution_name.x,
    classification_name = classification_name.x
  ) %>%
  filter(str_detect(classification_name, "NCAA Division I")) %>%
  mutate(
    REV_MEN = replace_na(suppressWarnings(as.numeric(REV_MEN)), 0),
    EXP_MEN = replace_na(suppressWarnings(as.numeric(EXP_MEN)), 0),
    REV_WOMEN = replace_na(suppressWarnings(as.numeric(REV_WOMEN)), 0),
    EXP_WOMEN = replace_na(suppressWarnings(as.numeric(EXP_WOMEN)), 0),
    GRND_TOTAL_REVENUE = replace_na(suppressWarnings(as.numeric(GRND_TOTAL_REVENUE)), 0),
    GRND_TOTAL_EXPENSE = replace_na(suppressWarnings(as.numeric(GRND_TOTAL_EXPENSE)), 0),
    PARTIC_MEN = replace_na(suppressWarnings(as.numeric(PARTIC_MEN)), 0),
    PARTIC_WOMEN = replace_na(suppressWarnings(as.numeric(PARTIC_WOMEN)), 0)
  )

Além da descrição conceitual da fonte, a tabela abaixo resume a estrutura efetivamente importada a partir dos arquivos originais. Essa contagem ajuda a documentar o tamanho das bases antes do recorte analítico aplicado nas etapas seguintes.

estrutura_fonte <- tibble(
  Arquivo = c("Schools.xlsx", "Instlevel.xlsx"),
  `Arquivos anuais importados` = c(length(arquivos_schools), length(arquivos_inst)),
  `Registros importados` = c(nrow(dados_esportes), nrow(dados_instituicao)),
  `Variáveis importadas` = c(ncol(dados_esportes), ncol(dados_instituicao))
)

kable(estrutura_fonte,
      align = c("l", "r", "r", "r"),
      caption = "Estrutura dos arquivos originais importados")
Estrutura dos arquivos originais importados
Arquivo Arquivos anuais importados Registros importados Variáveis importadas
Schools.xlsx 12 252499 130
Instlevel.xlsx 12 24516 170

Visão Interativa da Base Consolidada

Com as tabelas unidas e filtradas, a base final fica pronta para as análises seguintes. A tabela interativa abaixo mostra uma amostra dos dados consolidados, permitindo navegar pelos anos e pelas modalidades.

# Tabela Interativa usando DT
dados_limpos %>%
  select(Ano_Academico, institution_name, classification_name, Sports, 
         EXP_MEN, EXP_WOMEN, REV_MEN, REV_WOMEN) %>%
  head(100) %>%
  datatable(options = list(scrollX = TRUE, pageLength = 5), 
            caption = "Amostra: Série Histórica EADA (NCAA Divisão I)") %>%
  formatCurrency(columns = c('EXP_MEN', 'EXP_WOMEN', 'REV_MEN', 'REV_WOMEN'), 
                 currency = "$", digits = 0)

Resumo Estatístico da Década

A tabela a seguir resume as principais métricas da amostra ao longo de todo o período analisado. Em vez de observar apenas anos isolados, a agregação da década ajuda a identificar padrões gerais no financiamento esportivo universitário.

# Resumo agrupando dados financeiros da década
tabela_resumo_bruto <- dados_limpos %>%
  select(
    `Despesa Bruta (Homens)` = EXP_MEN,
    `Despesa Bruta (Mulheres)` = EXP_WOMEN,
    `Receita Bruta (Homens)` = REV_MEN,
    `Receita Bruta (Mulheres)` = REV_WOMEN
  ) %>%
  pivot_longer(cols = everything(), names_to = "Variável", values_to = "Valor") %>%
  group_by(Variável) %>%
  summarise(
    Média = dollar(mean(Valor, na.rm = TRUE), prefix = "$", big.mark = ",", accuracy = 1),
    Mediana = dollar(median(Valor, na.rm = TRUE), prefix = "$", big.mark = ",", accuracy = 1),
    `Desvio Padrão` = dollar(sd(Valor, na.rm = TRUE), prefix = "$", big.mark = ",", accuracy = 1),
    `Máximo` = dollar(max(Valor, na.rm = TRUE), prefix = "$", big.mark = ",", accuracy = 1)
  )

kable(tabela_resumo_bruto, 
      align = c("l", "r", "r", "r", "r"),
      caption = "Estatísticas Descritivas Globais (2013-2024)")
Estatísticas Descritivas Globais (2013-2024)
Variável Média Mediana Desvio Padrão Máximo
Despesa Bruta (Homens) $608,209 $62,009 $2,989,090 $112,230,118
Despesa Bruta (Mulheres) $323,147 $98,209 $627,152 $13,119,360
Receita Bruta (Homens) $742,836 $61,712 $5,073,292 $200,736,464
Receita Bruta (Mulheres) $274,857 $96,208 $520,862 $21,440,365

Primeiras observações: A média indica que as modalidades masculinas concentram receitas e despesas maiores. No entanto, o desvio padrão também é elevado, o que sugere grande variação entre instituições. A diferença entre média e mediana reforça que os valores totais são influenciados por uma minoria de programas com orçamentos muito altos, como aparece nos valores máximos observados para homens e mulheres.

Esse resultado motiva a análise exploratória: é necessário isolar variáveis, como despesa per capita e lucro líquido, para entender se a diferença aparece de forma generalizada ou se é fortemente influenciada por modalidades de grande orçamento, especialmente o futebol americano.

Análise Exploratória

Nesta seção, a análise passa da descrição geral para comparações mais específicas sobre a assimetria orçamentária no esporte universitário. Os gráficos e tabelas interativos foram usados para facilitar a exploração dos dados ao longo da década.

Gasto Per Capita e Efeito de Diluição

Observar apenas os valores totais sugere que as equipes femininas recebem menos recursos. No entanto, uma comparação mais adequada precisa considerar o tamanho das equipes. Por isso, foi calculado o gasto por atleta, ou gasto per capita.

O gráfico de violino abaixo mostra a distribuição desse gasto no último ano acadêmico completo, 2023-2024, indicando onde a maior parte das observações se concentra.

# 1. Isolando 2024, calculando o Gasto Per Capita e pivotando
dados_per_capita <- dados_limpos %>%
  filter(Ano_Academico == "2023-2024") %>%
  filter(PARTIC_MEN > 0 | PARTIC_WOMEN > 0) %>%
  mutate(
    `Masculino` = ifelse(PARTIC_MEN > 0, EXP_MEN / PARTIC_MEN, NA),
    `Feminino` = ifelse(PARTIC_WOMEN > 0, EXP_WOMEN / PARTIC_WOMEN, NA)
  ) %>%
  pivot_longer(cols = c(`Masculino`, `Feminino`), 
               names_to = "Genero", values_to = "Gasto_Per_Capita") %>%
  filter(!is.na(Gasto_Per_Capita))

# 2. Construção do Gráfico de Violino + Boxplot interno
g_violino <- ggplot(dados_per_capita, aes(x = Genero, y = Gasto_Per_Capita, fill = Genero)) +
  geom_violin(alpha = 0.6, trim = FALSE) +
  geom_boxplot(width = 0.1, fill = "white", outlier.shape = NA) +
  scale_y_continuous(labels = dollar_format(prefix = "$"), limits = c(0, 150000)) +
  scale_fill_manual(values = c("Masculino" = "#2C3E50", "Feminino" = "#E74C3C")) +
  labs(
    title = "Distribuição do Gasto Per Capita por Gênero (NCAA Divisão I)",
    subtitle = "Ano Acadêmico 2023-2024",
    x = "Gênero",
    y = "Despesa por Atleta (USD)"
  ) +
  theme_minimal() +
  theme(legend.position = "none")

ggplotly(g_violino)

O gráfico mostra um resultado que, à primeira vista, pode parecer contraintuitivo. A distribuição feminina aparece mais concentrada em valores um pouco superiores, com mediana em torno de $12.000, enquanto a mediana masculina fica próxima de $10.000. Isso não significa, necessariamente, que o financiamento feminino seja maior em termos absolutos. Uma explicação provável é o efeito de diluição: modalidades masculinas como o futebol americano têm orçamentos muito altos, mas também elencos numerosos, frequentemente com mais de 100 atletas. Assim, parte do orçamento masculino é dividida por um número maior de participantes, reduzindo o gasto per capita mediano e mantendo a concentração de grandes valores nos extremos da distribuição.

A Evolução da Disparidade na Última Década

A primeira questão apresentada na introdução diz respeito ao comportamento histórico da diferença de investimento. Considerando que o Title IX já tem mais de 50 anos, seria razoável esperar uma redução gradual da distância orçamentária entre homens e mulheres.

Para avaliar essa tendência, foram somadas as despesas operacionais absolutas da NCAA Divisão I em cada ano acadêmico, separando os valores por gênero.

# 1. Agrupando por ano para obter os totais absolutos da década
evolucao_gap <- dados_limpos %>%
  group_by(Ano_Academico) %>%
  summarise(
    `Masculino` = sum(EXP_MEN, na.rm = TRUE),
    `Feminino` = sum(EXP_WOMEN, na.rm = TRUE)
  ) %>%
  pivot_longer(cols = c(`Masculino`, `Feminino`), 
               names_to = "Gênero", 
               values_to = "Valor_Total")

# 2. Criação do Gráfico de Linhas Histórico
g_evolucao <- ggplot(evolucao_gap, aes(x = Ano_Academico, y = Valor_Total, color = Gênero, group = Gênero)) +
  geom_line(linewidth = 1.2) +
  geom_point(size = 3) +
  scale_y_continuous(labels = label_number(prefix = "$", scale = 1e-6, suffix = "M")) +
  scale_color_manual(values = c("Masculino" = "#2C3E50", "Feminino" = "#E74C3C")) +
  labs(
    title = "Evolução Histórica das Despesas Operacionais Totais",
    x = "Ano Acadêmico",
    y = "Despesa Total Cumulativa (Milhões USD)"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1),
        legend.position = "bottom")

# 3. Interatividade
ggplotly(g_evolucao, tooltip = c("x", "y", "color"))

A visualização indica que a diferença orçamentária não diminuiu no período analisado. Pelo contrário, as linhas se afastam ao longo da série. Em 2013, a diferença era de cerca de $2,4 bilhões a favor das modalidades masculinas. Em 2024, essa diferença chegou a aproximadamente $5,6 bilhões anuais.

Outro ponto visível é a queda de gastos na temporada 2020-2021, compatível com o impacto da pandemia de COVID-19. Após esse período, a recuperação ocorreu em formato de “V”, mas com crescimento mais acentuado nas despesas masculinas. Com isso, a diferença entre os grupos voltou a se ampliar depois da pandemia.

A Premissa da Lucratividade do Futebol Americano

Uma justificativa frequente para o maior investimento em esportes masculinos é a premissa de que modalidades de grande audiência, especialmente o futebol americano, geram receita suficiente para sustentar a si mesmas e ajudar a financiar outras modalidades da universidade.

Para verificar em que medida essa premissa aparece nos dados da Divisão I, foram isolados os registros de “Football” no último ano acadêmico, 2023-2024. Em seguida, foi calculado o lucro líquido de cada universidade, subtraindo as despesas totais das receitas.

# 1. Filtrando Futebol e Calculando o Lucro Líquido
lucro_futebol <- dados_limpos %>%
  filter(Sports == "Football", Ano_Academico == "2023-2024") %>%
  mutate(
    Lucro_Liquido = REV_MEN - EXP_MEN,
    Status_Financeiro = ifelse(Lucro_Liquido > 0, "Superávit", "Déficit")
  )

# 2. Agrupando e calculando percentuais
resumo_lucro <- lucro_futebol %>%
  count(Status_Financeiro) %>%
  mutate(Percentual = n / sum(n))

# 3. Gráfico de Barras do Status Financeiro
g_lucro <- ggplot(resumo_lucro, aes(x = Status_Financeiro, y = n, fill = Status_Financeiro)) +
  geom_col(width = 0.5) +
  geom_text(aes(label = paste0(n, " univ. (", percent(Percentual, accuracy = 1), ")")), 
            vjust = -0.5, size = 4.5, fontface = "bold") +
  scale_fill_manual(values = c("Déficit" = "#E74C3C", "Superávit" = "#27AE60")) +
  scale_y_continuous(limits = c(0, max(resumo_lucro$n) * 1.15)) +
  labs(
    title = "Resultado Financeiro do Futebol Americano (2023-2024)",
    subtitle = "NCAA Divisão I: Receita Total vs. Despesa Total da Modalidade",
    x = "",
    y = "Número de Universidades"
  ) +
  theme_minimal() +
  theme(legend.position = "none",
        plot.title = element_text(face = "bold", size = 14))

# 4. Renderização
ggplotly(g_lucro, tooltip = c("y"))

O gráfico sugere que a ideia de que o futebol americano sustenta financeiramente o departamento esportivo não se aplica à maioria das instituições analisadas. Das 649 universidades da amostra, 65% (420 instituições) registraram déficit no futebol americano em 2023-2024. O superávit aparece concentrado em uma parcela menor, correspondente a 35% das instituições. Para muitas universidades, os custos de manter os programas ativos, como viagens, comissões técnicas e bolsas, superam a receita atribuída à modalidade. Esse resultado enfraquece a justificativa de que o maior investimento no esporte masculino seria compensado, de forma generalizada, por retornos financeiros do futebol americano.

A tabela interativa abaixo apresenta o balanço de cada programa, permitindo consultar individualmente as universidades analisadas.

# Tabela com as variáveis calculadas
lucro_futebol %>%
  select(institution_name, state_cd = state_cd.x, REV_MEN, EXP_MEN, Lucro_Liquido, Status_Financeiro) %>%
  arrange(desc(Lucro_Liquido)) %>%
  datatable(
    options = list(pageLength = 5, scrollX = TRUE),
    rownames = FALSE,
    caption = "Balanço Financeiro do Futebol Americano (Ordenável)",
    colnames = c("Universidade", "Estado", "Receita", "Despesa", "Lucro Líquido", "Status")
  ) %>%
  formatCurrency(columns = c('REV_MEN', 'EXP_MEN', 'Lucro_Liquido'), currency = "$", digits = 0) %>%
  formatStyle(
    'Status_Financeiro',
    color = styleEqual(c("Superávit", "Déficit"), c('#27AE60', '#E74C3C')),
    fontWeight = 'bold'
  )

O Fator Institucional: Público vs. Privado

Para encerrar a análise exploratória, foi avaliada uma hipótese ligada ao tipo de instituição. Como o Title IX é uma lei federal associada a programas educacionais com financiamento público, seria esperado que universidades públicas, sujeitas a maior fiscalização estatal, apresentassem métricas de equidade mais equilibradas do que instituições privadas.

Para observar essa relação, foi construído um boxplot do gap financeiro absoluto, segmentado pelo setor da universidade.

# 1. Calculando o Gap Absoluto por instituição e categorizando o Setor
dados_setor <- dados_limpos %>%
  filter(Ano_Academico == "2023-2024") %>%
  group_by(unitid, institution_name, sector_name) %>%
  summarise(
    Gap_Absoluto = sum(EXP_MEN, na.rm = TRUE) - sum(EXP_WOMEN, na.rm = TRUE),
    .groups = "drop"
  ) %>%
  mutate(
    Tipo_Instituicao = ifelse(str_detect(sector_name, "Public"), "Universidade Pública", "Universidade Privada")
  )

# 2. Gráfico Boxplot Comparativo
g_setor <- ggplot(dados_setor, aes(x = Tipo_Instituicao, y = Gap_Absoluto, fill = Tipo_Instituicao)) +
  geom_boxplot(alpha = 0.7, outlier.color = "#E74C3C", outlier.size = 2.5) +
  scale_y_continuous(labels = label_number(prefix = "$", scale = 1e-6, suffix = "M")) +
  scale_fill_manual(values = c("Universidade Pública" = "#3498DB", "Universidade Privada" = "#9B59B6")) +
  labs(
    title = "Diferença de Despesas por Controle Institucional",
    subtitle = "Vantagem Orçamentária Masculina Absoluta (2023-2024)",
    x = "Controle Institucional",
    y = "Diferença a favor das modalidades masculinas (Milhões USD)"
  ) +
  theme_minimal() +
  theme(legend.position = "none",
        plot.title = element_text(face = "bold"))

ggplotly(g_setor, tooltip = c("y"))

Os dados não confirmam a expectativa de que o controle governamental esteja associado, por si só, a maior equilíbrio orçamentário. Na amostra analisada, a disparidade é maior e mais variável entre universidades públicas. A mediana do gap a favor das modalidades masculinas nas instituições públicas ultrapassa $1,3 milhão, mais que o dobro da mediana observada nas instituições privadas, de cerca de $521 mil. Além disso, o terceiro quartil das universidades públicas chega a $6,1 milhões, contra $1,2 milhão nas privadas. O maior outlier da amostra também aparece em uma universidade pública, com mais de $112 milhões adicionais associados ao esporte masculino.

Conclusões

Este relatório analisou se a diferença de despesas entre modalidades masculinas e femininas na NCAA Divisão I diminuiu entre 2013-2014 e 2023-2024. Para isso, foram consolidados registros oficiais do EADA, unidos dados esportivos e institucionais e criadas métricas comparáveis, como gasto por atleta, gap financeiro e lucro líquido.

A análise sugere que a distância orçamentária não se reduziu no período observado. Em valores absolutos, as despesas masculinas cresceram mais rapidamente, ampliando o gap ao longo da série. Ao mesmo tempo, o gasto per capita mostrou que a interpretação dos dados exige cautela: modalidades masculinas com elencos muito grandes, como o futebol americano, podem reduzir a mediana por atleta mesmo concentrando orçamentos elevados.

Outro resultado relevante é que a justificativa de que o futebol americano sustenta financeiramente os departamentos esportivos não apareceu de forma generalizada na amostra. Em 2023-2024, a maioria das instituições analisadas registrou déficit nessa modalidade. Além disso, universidades públicas apresentaram gaps financeiros maiores e mais dispersos do que as instituições privadas, contrariando a expectativa inicial de maior equilíbrio nesse grupo.

Esses resultados podem apoiar discussões sobre alocação de recursos, transparência financeira e acompanhamento do Title IX. Ainda assim, a análise tem limitações: os dados são administrativos, dependem do reporte das instituições e não capturam todos os custos estruturais associados ao atletismo universitário, como investimentos em estádios, arenas e dívidas. Trabalhos futuros poderiam cruzar o EADA com bases de infraestrutura, endividamento e desempenho esportivo para avaliar de forma mais ampla os fatores que sustentam a desigualdade financeira observada.