O dataset utilizado neste painel reúne informações detalhadas sobre partidas do Campeonato Brasileiro nas Séries A, B, C e D, cobrindo o período de 2003 a 2023.
São ao todo 4 tabelas complementares:
Ao todo são mais de 59 mil registros distribuídos entre as tabelas, permitindo análises sobre frequência de eventos, distribuição de desempenho e comparações entre clubes e estados.
Jhoyan Wellek Macedo Padovan
Estudante do Curso de Análise e Desenvolvimento de Sistemas
Instituto Federal de Rondônia — Campus Ji-Paraná
Este painel foi desenvolvido como trabalho prático da disciplina de Probabilidade e Estatística, com o objetivo de aplicar conceitos de frequência e medidas descritivas sobre um dataset real utilizando a linguagem R e o framework flexdashboard.
As variáveis qualitativas nominais representam categorias sem hierarquia ou ordem entre si — não faz sentido dizer que SP é “maior” que RJ, ou que empate é “mais” que vitória.
Gráfico 1 — Estado Mandante:
Mostra quais estados concentram mais partidas em casa. Estados como SP,
RJ e RS lideram por terem mais clubes historicamente presentes nas
séries do Brasileirão.
Gráfico 2 — Resultado das Partidas:
Revela a famosa vantagem do mandante: times que jogam
em casa vencem com mais frequência do que os visitantes.
Gráfico 3 — Posição e Cartões:
Volantes e zagueiros lideram os cartões — posições de marcação que
envolvem mais disputas físicas e táticas.
Variáveis qualitativas ordinais possuem ordem natural entre as categorias, mas essa ordem não representa uma distância numérica mensurável.
Gráfico 4 — Tipo de Cartão:
Cartão amarelo tem peso menor que o vermelho — há uma hierarquia clara
de punição. A diferença em volume mostra que expulsões diretas são bem
mais raras que advertências.
Gráfico 5 — Cartões por Rodada:
Permite observar se há rodadas mais “quentes” ao longo do campeonato. É
comum ver picos no final da competição, quando há mais pressão por
resultados.
Gráfico 6 — Gols por Rodada:
A rodada tem ordem definida (1 vem antes da 38), mas não é um número
sobre o qual faz sentido calcular média. A linha suavizada revela a
tendência geral de produção ofensiva ao longo do campeonato.
Variáveis quantitativas discretas são números inteiros contáveis — não existe 0.5 gol ou 1.3 cartão. Cada ocorrência é um evento isolado e mensurável.
Gráfico 7 — Gols por Partida:
O histograma mostra que a maioria das partidas termina com 2 a 3 gols no
total. Jogos com 0 gols (0x0) são relativamente comuns, e partidas com
7+ gols são raras.
Gráfico 8 — Chutes, Faltas e Escanteios:
O boxplot permite comparar a dispersão dessas três variáveis
simultaneamente. Chutes apresentam a maior quantidade de outliers —
alguns times chegam a 35 finalizações em uma única partida, o que é bem
atípico.
Gráfico 9 — Cartões Amarelos:
O barplot mostra a frequência de partidas por quantidade de cartões
amarelos. A maioria registra de 0 a 3 cartões por time, e conforme o
número aumenta a frequência cai rapidamente — partidas com 5+ são bem
incomuns.
Variáveis quantitativas contínuas podem assumir qualquer valor dentro de um intervalo, incluindo decimais — diferente das discretas que são sempre inteiras.
Gráfico 10 — Posse de Bola:
A distribuição é aproximadamente simétrica em torno de 50%, o que faz
sentido: a posse de um time é sempre o complemento do outro (se um tem
60%, o outro tem 40%). A curva de densidade confirma a forma de
sino.
Gráfico 11 — Precisão de Passes:
A distribuição se concentra entre 70% e 90%, indicando que a maioria dos
times acerta a maior parte dos passes. Valores abaixo de 60% são
atípicos e representam partidas com muita pressão ou condições
adversas.
Gráfico 12 — Arrecadação:
A distribuição é fortemente assimétrica à direita — a maioria das
partidas arrecada valores mais baixos, mas alguns clássicos e decisões
geram receitas muito acima da média, puxando a cauda da
distribuição.