Para acesso a dados abertos sobre futebol (jogadores, equipes, competições e etc.) podem ser utilizdas as seguintes plataformas:
Do mesmo modo, para integração do R (RSTUDIO com estes sites) pode-se utilizar o pacote worldfootballR.
Para saber as URL’s de identificação de cada jogador, disponíveis nos sites FBref e Transfermarkt, basta utilizar a função player_dictionary_mapping() do pacote worldfootballR assim como demonstrado abaixo:
library(worldfootballR)
# Conhecendo a base de dados de jogadores:
id_jogadores <- player_dictionary_mapping()Do mesmo modo, para obter as urls dos campeonatos disponíveis em cada país, basta utilizar a função fb_league_urls do pacote worldfootballR (estes dados se referem exclusivamente ao site RBref). Uma observação importante refere-se ao identificador do país. Uma estratégia é validar o identifcador no próprio site.
# Conhecendo os identificadores de campeonatos:
brasileirao_a <- fb_league_urls(country = 'BRA',
gender = 'M',
season_end_year = 2022,
tier = '1st')
brasileirao_b <- fb_league_urls(country = 'BRA',
gender = 'M',
season_end_year = 2022,
tier = '2nd')Por fim, é possível identificar os dados de uma equipe. como nos casos anteriores, o identificador da equipe é dados a partir da URL.
A média de gols e assitência do Endrick no brasileirão foi maior que a média da competição?
Em primeiro lugar, deve-se avaliar os dados do jogador, o código abaixo apresenta uma alternativa de avaliação.
# PACOTES NECESSÁRIIO
library(dplyr)
#ACHANDO O ENDRICK
id_endrick <- player_dictionary_mapping() %>%
select(PlayerFBref, UrlFBref) %>%
filter(PlayerFBref == 'Endrick')
#ANÁLISE DE DESEMPENHO DO JOGADOR:
analise_endrick <- fb_player_season_stats(
player_url = id_endrick[1,2],
stat_type = 'standard') %>%
filter(Season == 2022 & Comp == '1. Série A')Agora, devemos avaliar as estatísticas das equipes na mesma competição. O código abaixo explica como realizar esta avaliação.
analise_brasileirao <- fb_season_team_stats(
country = 'BRA',
gender = 'M',
tier = '1st',
season_end_year = 2022,
stat_type = 'standard') %>%
select(Num_Players, Gls, Ast) %>%
mutate(Gls = Gls/Num_Players,
Ast = Ast/Num_Players) %>%
summarise(Gls = mean(Gls),
Ast = mean(Ast))Organização a análise comparativa entre o jogador e o campeonato.
# Pacote necessário
library(ggplot2)
library(plotly)
analise_endrick <- analise_endrick %>%
select(Gls, Ast) %>%
mutate(referencia = 'Endrick')
analise_brasileirao <- analise_brasileirao %>%
mutate(referencia = 'Brasileirão - Série A')
consolidado <- bind_rows(analise_endrick,
analise_brasileirao)
grafico_de_gols <- consolidado %>%
ggplot() +
geom_col(mapping = aes(x = Gls, y = referencia)) +
labs(title = 'Endrick versus Média brasileirão',
subtitle = 'Palmeiras é o maior',
y = '')
ggplotly(grafico_de_gols)