O dataset reúne informações de equipes da NFL entre 2003 e 2023.
As variáveis incluem desempenho geral, vitórias, derrotas, pontos marcados e sofridos, jardas ofensivas, passes, corridas, penalidades, turnovers e métricas de eficiência ofensiva.
Esta base permite desenvolver análises de estatística descritiva, classificação de variáveis e visualização de dados por meio de gráficos e medidas-resumo.
Este dashboard foi desenvolvido para apresentar informações do dataset NFL Team Data 2003–2023, explorando estatísticas de desempenho das equipes ao longo das temporadas.
O painel foi construído em R Markdown com flexdashboard, permitindo visualizar variáveis qualitativas e quantitativas de forma clara e organizada.
A variável team é qualitativa nominal —
representa o nome das franquias da NFL, categorias sem nenhuma ordem
natural entre si.
O gráfico de barras horizontais exibe as 10 equipes com maior média de vitórias entre 2003 e 2023, ou seja, as que apresentaram desempenho mais consistente ao longo das 21 temporadas analisadas. A média foi escolhida em vez do total de vitórias para eliminar o efeito de times que disputaram menos temporadas no período. O destaque vai para New England Patriots e Kansas City Chiefs, que dominaram suas respectivas eras na NFL — os Patriots liderados por Brady até 2019, e os Chiefs com Patrick Mahomes a partir de 2018.
Enquanto o Gráfico 1 resume o desempenho em um único número, o Gráfico 2 exibe a série temporal de vitórias das quatro franquias mais vitoriosas do período, permitindo observar dinâmicas que a média esconde.
É possível notar a queda dos Patriots após 2018, a ascensão dos Chiefs a partir de 2019, a consistência dos Packers com Aaron Rodgers entre 2009 e 2021, e os ciclos alternados de alto e baixo rendimento dos Steelers. Cada linha usa a cor oficial da franquia para facilitar a identificação visual.
A variável nivel_vitorias é qualitativa
ordinal — foi criada a partir da variável numérica
wins e possui categorias com hierarquia clara: Fraco <
Bom < Elite. Esse tipo de variável é útil quando queremos agrupar uma
contagem em faixas de desempenho para comparações.
Os critérios de classificação adotados refletem padrões históricos da NFL: campanhas com 12 ou mais vitórias costumam garantir posição privilegiada nos playoffs; entre 9 e 11, o time geralmente disputa a pós-temporada; abaixo de 9, a temporada é considerada fraca. O gráfico mostra que a maioria das campanhas cai na faixa Fraco, o que indica que atingir a elite é relativamente raro ao longo de 21 temporadas com 32 times cada.
O gráfico empilhado complementa o anterior ao mostrar como essas proporções variaram ao longo dos anos. Em temporadas com expansão de jogos (como a adição do 17º jogo a partir de 2021), é possível observar oscilações nos critérios de classificação, já que os limiares de 9 e 12 vitórias foram definidos com base no calendário de 16 jogos. O gráfico evidencia também a regularidade da distribuição entre os três níveis em cada temporada, sem grandes desequilíbrios estruturais.
A variável wins é quantitativa discreta
— assume apenas valores inteiros, pois representa uma contagem de
vitórias por temporada. O histograma com binwidth = 1 trata
cada valor de forma individual, revelando a forma da distribuição.
A distribuição aproxima-se de uma curva normal centrada em torno de 8 vitórias, o que é esperado em uma liga com equilíbrio competitivo forçado por mecanismos como o draft e o salary cap. Campanhas muito ruins (0–3 vitórias) e muito boas (14–17 vitórias) são raras e representam os casos extremos da distribuição.
Este gráfico apresenta duas dimensões complementares do turnovers por nível de vitórias:
Usar apenas fumbles_lost seria limitado, pois ignora as
interceptações sofridas pelos quarterbacks, que compõem a maior parte
dos turnovers na NFL moderna. Ao combinar os dois painéis, o gráfico
mostra que times Elite não apenas perdem menos posses
em valor absoluto, mas também desperdiçam uma proporção menor de suas
campanhas ofensivas — indicando maior controle de bola e eficiência na
tomada de decisão.
A variável total_yards é quantitativa
contínua — representa o total de jardas ofensivas acumuladas
por uma equipe na temporada. É uma das métricas mais utilizadas para
avaliar a capacidade ofensiva de um time.
O boxplot revela que times Elite tendem a produzir mais jardas do que os demais, mas a sobreposição entre os níveis é considerável. Isso indica que jardas totais sozinhas não determinam o sucesso — um time pode acumular muitas jardas sem converter em pontos ou vitórias. A mediana e a dispersão de cada grupo ajudam a entender tanto o desempenho típico quanto a variabilidade dentro de cada categoria.
A variável points_diff é o saldo de
pontos (pontos marcados menos pontos sofridos), uma das
métricas mais preditivas de desempenho na NFL. Diferentemente das
vitórias, o saldo de pontos captura a margem com que os jogos
são vencidos ou perdidos — times que vencem fácil e perdem por pouco
terão saldos bem diferentes de times que jogam partidas
equilibradas.
A linha tracejada em zero é a fronteira entre domínio e déficit ofensivo/defensivo. Times Elite ficam consistentemente acima dessa linha, enquanto times Fracos têm medianas negativas. A separação entre os três grupos é muito mais nítida aqui do que no gráfico de jardas, o que confirma que o saldo de pontos é uma variável fortemente associada ao nível de vitórias.