HOME

Column

Sobre os Dados

O dataset utilizado neste painel reúne informações detalhadas sobre partidas do Campeonato Brasileiro nas Séries A, B, C e D, cobrindo o período de 2003 a 2023.

São ao todo 4 tabelas complementares:

  • Full — dados gerais das partidas: times, placares, arenas, estados e arrecadação
  • Estatísticas — métricas táticas por clube por partida: posse, passes, chutes, faltas
  • Gols — registro individual de cada gol: atleta, minuto e tipo
  • Cartões — registro individual de cada cartão: atleta, posição, minuto e cor

Ao todo são mais de 59 mil registros distribuídos entre as tabelas, permitindo análises sobre frequência de eventos, distribuição de desempenho e comparações entre clubes e estados.

Column

Sobre o Autor

Jhoyan Wellek Macedo Padovan
Estudante do Curso de Análise e Desenvolvimento de Sistemas
Instituto Federal de Rondônia — Campus Ji-Paraná

Este painel foi desenvolvido como trabalho prático da disciplina de Probabilidade e Estatística, com o objetivo de aplicar conceitos de frequência e medidas descritivas sobre um dataset real utilizando a linguagem R e o framework flexdashboard.

Resumo do Dataset

9165

VARIÁVEIS QUALITATIVAS NOMINAIS

Column

Partidas por Estado Mandante

Resultado das Partidas

Column

Posições que Mais Levam Cartão

Explicação

As variáveis qualitativas nominais representam categorias sem hierarquia ou ordem entre si — não faz sentido dizer que SP é “maior” que RJ, ou que empate é “mais” que vitória.

Gráfico 1 — Estado Mandante:
Mostra quais estados concentram mais partidas em casa. Estados como SP, RJ e RS lideram por terem mais clubes historicamente presentes nas séries do Brasileirão.

Gráfico 2 — Resultado das Partidas:
Revela a famosa vantagem do mandante: times que jogam em casa vencem com mais frequência do que os visitantes.

Gráfico 3 — Posição e Cartões:
Volantes e zagueiros lideram os cartões — posições de marcação que envolvem mais disputas físicas e táticas.

VARIÁVEIS QUALITATIVAS ORDINAIS

Column

Cartões por Tipo (Amarelo → Vermelho)

Cartões por Rodada

Column

Gols por Rodada

Explicação

Variáveis qualitativas ordinais possuem ordem natural entre as categorias, mas essa ordem não representa uma distância numérica mensurável.

Gráfico 4 — Tipo de Cartão:
Cartão amarelo tem peso menor que o vermelho — há uma hierarquia clara de punição. A diferença em volume mostra que expulsões diretas são bem mais raras que advertências.

Gráfico 5 — Cartões por Rodada:
Permite observar se há rodadas mais “quentes” ao longo do campeonato. É comum ver picos no final da competição, quando há mais pressão por resultados.

Gráfico 6 — Gols por Rodada:
A rodada tem ordem definida (1 vem antes da 38), mas não é um número sobre o qual faz sentido calcular média. A linha suavizada revela a tendência geral de produção ofensiva ao longo do campeonato.

VARIÁVEIS QUANTITATIVAS DISCRETAS

Column

Distribuição de Gols por Partida

Chutes e Faltas por Partida

Column

Cartões Amarelos por Partida

Explicação

Variáveis quantitativas discretas são números inteiros contáveis — não existe 0.5 gol ou 1.3 cartão. Cada ocorrência é um evento isolado e mensurável.

Gráfico 7 — Gols por Partida:
O histograma mostra que a maioria das partidas termina com 2 a 3 gols no total. Jogos com 0 gols (0x0) são relativamente comuns, e partidas com 7+ gols são raras.

Gráfico 8 — Chutes, Faltas e Escanteios:
O boxplot permite comparar a dispersão dessas três variáveis simultaneamente. Chutes apresentam a maior quantidade de outliers — alguns times chegam a 35 finalizações em uma única partida, o que é bem atípico.

Gráfico 9 — Cartões Amarelos:
O barplot mostra a frequência de partidas por quantidade de cartões amarelos. A maioria registra de 0 a 3 cartões por time, e conforme o número aumenta a frequência cai rapidamente — partidas com 5+ são bem incomuns.

VARIÁVEIS QUANTITATIVAS CONTÍNUAS

Column

Distribuição da Posse de Bola

Distribuição da Precisão de Passes

Column

Arrecadação por Partida

Explicação

Variáveis quantitativas contínuas podem assumir qualquer valor dentro de um intervalo, incluindo decimais — diferente das discretas que são sempre inteiras.

Gráfico 10 — Posse de Bola:
A distribuição é aproximadamente simétrica em torno de 50%, o que faz sentido: a posse de um time é sempre o complemento do outro (se um tem 60%, o outro tem 40%). A curva de densidade confirma a forma de sino.

Gráfico 11 — Precisão de Passes:
A distribuição se concentra entre 70% e 90%, indicando que a maioria dos times acerta a maior parte dos passes. Valores abaixo de 60% são atípicos e representam partidas com muita pressão ou condições adversas.

Gráfico 12 — Arrecadação:
A distribuição é fortemente assimétrica à direita — a maioria das partidas arrecada valores mais baixos, mas alguns clássicos e decisões geram receitas muito acima da média, puxando a cauda da distribuição.