Introdução

Os dados utilizados neste estudo foram obtidos do site Football Data (football-data.co.uk 2022). O estudo mostra o comportamento dos melhores times do Campeonato Brasileiro dos ultimos 10 anos, que tiveram caracteristicas. Aconteceu uma classificação em grupos e foi analisado uma série temporal. Sendo avaliado de 2012 a 2023 com 20 clubes disputando o campeonato.

Variavel em analise.

De acordo com as técnicas de manipulação de dados propostas por (Wickham, Francois, et al. 2022) e as funcionalidades de leitura de dados fornecidas pelo pacote (Wickham, Hester, et al. 2022), foi possível realizar uma análise eficaz dos dados.

  • Total wins = TW
  • Total Draws = TD
  • Total losses = TL
  • Total Goals Scored = TGS
  • Total Goals Conced = TGC
  • Total Points = TP
  • Goal_Difference = GD

Tabela 1. Melhores times dos ultimos anos.

Home Season TW TD TL TGS TGC TP GD
Flamengo RJ 2019 17 2 0 56 18 53 38
Atletico-MG 2021 17 1 1 42 13 52 29
Corinthians 2015 16 2 1 41 11 50 30
Palmeiras 2018 16 2 1 42 13 50 29
Santos 2015 15 3 1 47 15 48 32
Atletico-PR 2016 15 3 1 27 6 48 21
Atletico-MG 2012 14 5 0 42 15 47 27
Sao Paulo 2012 15 2 2 37 10 47 27
Cruzeiro 2014 15 2 2 43 17 47 26
Santos 2016 15 2 2 36 11 47 25

Visualização de dados.

Para a criação do gráfico de densidade, nos baseamos no conceito de estimativa de densidade proposto por (Silverman 1986).

fig 1. Gráfico de densidade dos gols marcados em casa (HG) e fora de casa (AG) ao longo das temporadas

fig 2. Séries temporais para o número de gols marcados ao longo das temporadas

Análise de Tendências Temporais:

Padrões de Desempenho ao Longo do Tempo: Ao analisar o gráfico de séries temporais, observei que há padrões claros de desempenho ao longo das temporadas. Por exemplo, conseguir identificar períodos de maior ou menor número de gols marcados, o que pode indicar mudanças na estratégia de jogo, desempenho dos jogadores, ou outras variáveis relevantes.

Identificação de Tendências: Busquei por tendências de aumento, diminuição ou estabilidade no número de gols marcados ao longo das temporadas. Essas tendências podem fornecerão insights sobre a evolução do desempenho dos times ao longo do tempo e ajudar a identificar fatores que influenciam o desempenho.

Análise Comparativa Entre Grupos:

Diferenças Entre Times: Ao comparar o desempenho de diferentes times ao longo das temporadas, é possivel observe se há diferenças significativas no número médio de gols marcados. Isso pode indicar disparidades no desempenho entre os times e ajudar a identificar os times mais consistentemente bem-sucedidos.

Identificação de Padrões: Busquei por padrões consistentes de desempenho entre os times ao longo das temporadas. Por exemplo, foi identificado times que consistentemente marcam mais gols do que outros, o que pode indicar diferenças na qualidade dos jogadores, estratégia de jogo, ou outros fatores.

fig 3.Comparar o número médio de gols marcados por temporada para os 10 melhores times

Interpretação Geral:

Fatores Influenciadores: Considerando outros fatores que podem influenciar o desempenho dos times de futebol, como mudanças na gestão técnica, contratação de novos jogadores, lesões, entre outros. Esses fatores podem explicar variações no desempenho ao longo das temporadas e devem ser levados em consideração na interpretação dos resultados.

Estratégias Futuras: Com base nas tendências e padrões identificados na análise, é possível traçar estratégias futuras como um planejamento para melhorar o desempenho dos times. Isso pode incluir ajustes na estratégia de jogo, contratação de novos jogadores, investimento em treinamento, entre outras ações.

Análise de Regressão

Modelo de Regressão Linear

A análise de regressão é uma técnica estatística utilizada para entender a relação entre uma variável dependente (ou resposta) e uma ou mais variáveis independentes (ou preditoras). Neste estudo, ajustamos um modelo de regressão linear para prever o número de gols marcados por temporada. A fórmula do modelo adaptada é:

\[ \text{Gols Marcados} = \beta_0 + \beta_1 \times \text{Temporada} + \epsilon \]

onde: - \(\beta_0\) é o coeficiente de intercepto, - \(\beta_1\) é o coeficiente associado à variável Temporada, - \(\epsilon\) é o termo de erro.

O sumário do modelo ajustado é apresentado abaixo:

Resultados da Análise de Regressão

Tabela de Coeficientes Estimados

A tabela abaixo apresenta os coeficientes estimados do modelo de regressão linear:

Estimate Std. Error t value Pr(>|t|)
(Intercept) 398.7582899 280.3292153 1.422464 0.1562063
Season -0.1843367 0.1389482 -1.326658 0.1858986

Interpretar os resultados

Os coeficientes estimados fornecem informações sobre a relação entre a variável Temporada e o número de gols marcados. O coeficiente associado à variável Temporada indica a mudança média no número de gols marcados para cada unidade de aumento na temporada. Por exemplo, se o coeficiente for positivo e estatisticamente significativo, isso sugere que o número de gols marcados aumenta ao longo das temporadas. Por outro lado, se o coeficiente for negativo e estatisticamente significativo, isso sugere que o número de gols marcados diminui ao longo das temporadas.

Referências

football-data.co.uk. 2022. “Football Data - Brazil.” Disponível em: https://www.football-data.co.uk/brazil.php.
Silverman, B. W. 1986. Density Estimation for Statistics and Data Analysis. Chapman; Hall/CRC.
Wickham, H., R. Francois, L. Henry, and K. Müller. 2022. Dplyr: A Grammar of Data Manipulation. https://dplyr.tidyverse.org/.
Wickham, H., J. Hester, R. Francois, and K. Müller. 2022. Readr: Read Rectangular Text Data. https://readr.tidyverse.org/.