INTRODUÇÃO

Para acesso a dados abertos sobre futebol (jogadores, equipes, competições e etc.) podem ser utilizdas as seguintes plataformas:

Do mesmo modo, para integração do R (RSTUDIO com estes sites) pode-se utilizar o pacote worldfootballR.

ACESSO AOS DADOS

Para saber as URL’s de identificação de cada jogador, disponíveis nos sites FBref e Transfermarkt, basta utilizar a função player_dictionary_mapping() do pacote worldfootballR assim como demonstrado abaixo:

library(worldfootballR)

# Conhecendo a base de dados de jogadores:

id_jogadores <- player_dictionary_mapping()

Do mesmo modo, para obter as urls dos campeonatos disponíveis em cada país, basta utilizar a função fb_league_urls do pacote worldfootballR (estes dados se referem exclusivamente ao site RBref). Uma observação importante refere-se ao identificador do país. Uma estratégia é validar o identifcador no próprio site.

# Conhecendo os identificadores de campeonatos:
brasileirao_a <- fb_league_urls(country = 'BRA',
               gender = 'M',
               season_end_year = 2022,
               tier =  '1st')

brasileirao_b <- fb_league_urls(country = 'BRA',
               gender = 'M',
               season_end_year = 2022,
               tier =  '2nd')

Por fim, é possível identificar os dados de uma equipe. como nos casos anteriores, o identificador da equipe é dados a partir da URL.

# Pacote necessário:
library(magrittr)

# Conhecendo os identificadores de equipe:
equipes_brasileirao_a <- fb_teams_urls(brasileirao_a) %>% 
  as.data.frame()

PRIMEIRA APLICAÇÃO

A média de gols e assitência do Endrick no brasileirão foi maior que a média da competição?

Em primeiro lugar, deve-se avaliar os dados do jogador, o código abaixo apresenta uma alternativa de avaliação.

# PACOTES NECESSÁRIIO
library(dplyr)


#ACHANDO O ENDRICK
id_endrick <- player_dictionary_mapping() %>% 
  select(PlayerFBref, UrlFBref) %>% 
  filter(PlayerFBref == 'Endrick')

#ANÁLISE DE DESEMPENHO DO JOGADOR:
analise_endrick <- fb_player_season_stats(
  player_url = id_endrick[1,2],
  stat_type = 'standard') %>% 
  filter(Season == 2022 & Comp == '1. Série A')

Agora, devemos avaliar as estatísticas das equipes na mesma competição. O código abaixo explica como realizar esta avaliação.

analise_brasileirao <- fb_season_team_stats(
  country = 'BRA',
  gender = 'M',
  tier = '1st',
  season_end_year = 2022,
  stat_type = 'standard') %>% 
  select(Num_Players, Gls, Ast) %>% 
  mutate(Gls = Gls/Num_Players,
         Ast = Ast/Num_Players) %>% 
  summarise(Gls = mean(Gls),
            Ast = mean(Ast))

Organização a análise comparativa entre o jogador e o campeonato.

# Pacote necessário
library(ggplot2)
library(plotly)


analise_endrick <- analise_endrick %>% 
  select(Gls, Ast) %>% 
  mutate(referencia = 'Endrick')

analise_brasileirao <- analise_brasileirao %>% 
  mutate(referencia = 'Brasileirão - Série A')

consolidado <- bind_rows(analise_endrick,
                         analise_brasileirao)

grafico_de_gols <- consolidado %>% 
  ggplot() +
  geom_col(mapping = aes(x = Gls, y = referencia)) +
  labs(title = 'Endrick versus Média brasileirão',
       subtitle = 'Palmeiras é o maior',
       y = '')

ggplotly(grafico_de_gols)