Afeta o Grêmio?

Mas como isso afeta o Grêmio?

Por Renan Tomazini

Introdução

Escudo do Grêmio

O Presente relatório busca responder uma pergunta que está sendo muito discutida na internet por pesquisadores do mundo inteiro, “Como isso afeta o Grêmio?” A pergunta repercutiu em 2022, durante o Gre-Nal 435, quando o Internacional de Porto Alegre, o time Rival do Grêmio, declarou no Twitter: #INTxGRE | 2T | ⏱️ 50’ - AFETOU O GRÊMIO! 🔥 Segundo o GloboEsporte, a frase tem origem em um vídeo produzido por um torcedor gremista que explicaria a relação da morte do príncipe Phillip, marido da rainha Elizabeth II, do Reino Unido, em abril de 2021, com o clube. O vídeo se encontra disponível no link: https://www.youtube.com/watch?v=d45kkL0EwSs

O meme se espalhou pela internet, chegando a ser usado por influencers em redes sociais e Streamings de Futebol na Twitch, ele tomou forma com o personagem Walter White de Breaking Bad, como na imagem abaixo: drawing

Desde então a pergunta que a internet faz é: Como isso afeta o Grêmio? Vou tentar ver algumas estatísticas do clube, como Ranking e Pontos na CBF e no Brasileirão e tentar encontrar algumas relações com acontecimentos importantes do nosso cotidiano. Então esse é o Mas afeta o Grêmio?

Coeficiente de Relação: Usamos o “cor” em R, por padrão no metodo de Pearson Ele vai nos retornar uma pontuação sobre a correlação entre os dois dados inseridos nele.

Esse relatório é apenas uma brincadeira, não representa um estudo de relação propriamente dito, baseado principalmente em: https://www.tylervigen.com/spurious-correlations Ele serve para meu treinamento de Data Science

Pacotes Requeridos:

Os pacotes a serem usados são:

plotly Para criação de gráficos.

stringr Para trabalhar com as strings presentes no dataset.

tidyr Para auxiliar na limpeza e organização das tabelas de dados.

rmdformats Para o teme da página

Análise

Dados do Grêmio

Os primeiros dados referentes a Ranking CBF, Brasileirão e Títulos foram retirados da Wikipedia e revisados no Globoesporte referente a cada ano. Já o preço do time foi pego do site transfermarkt. e está em Euro.

dadosGremio <- read.csv("data/estGremio.csv")
head(dadosGremio)
##      X PontosCBF PontosBr RankingCBF TitulosNoAno ValorDoTimeEuroMi
## 1 2010      1000       63          4            1              1.16
## 2 2011      1500       48         12            0              1.14
## 3 2012      2208       71          4            0              1.12
## 4 2013     14460       65          5            0              1.31
## 5 2014     15286       61          1            0              1.14
## 6 2015     13992       68          4            0              1.21
# Onde x é o ano

Irei excluir 2010 e 2011 por não termos os rankings da CBF.

dadosGremio <- dadosGremio[3:13, ]

Vamos criar alguns gráficos para ter uma noção de cada ano

Pontos do Grêmio no Brasileirão

fig <- plot_ly(dadosGremio, x = ~X, y = dadosGremio$PontosBr, name = 'trace 0', type = 'scatter', mode = 'lines') 

fig <- fig %>% layout(title = "Pontos do Grêmio no Brasileirão",

         xaxis = list(title = "Anos"),

         yaxis = list (title = "Pontos"))
fig

Pontos do Grêmio Normalizados no Brasileirão

score_p = scale(dadosGremio$PontosBr, center = T)
fig <- plot_ly(dadosGremio, x = ~X, y = score_p, name = 'trace 0', type = 'scatter', mode = 'lines') 

fig <- fig %>% layout(title = "Pontos Normalizados do Grêmio no Brasileirão",

         xaxis = list(title = "Anos"),

         yaxis = list (title = "Tendencia"))
fig

Pontos do Grêmio no Ranking CBF

fig <- plot_ly(dadosGremio, x = ~X, y = dadosGremio$PontosCBF, name = 'trace 0', type = 'scatter', mode = 'lines') 

fig <- fig %>% layout(title = "Pontos do Grêmio no Ranking CBF",

         xaxis = list(title = "Anos"),

         yaxis = list (title = "Pontos"))
fig

Pontos do Grêmio Normalizados no Ranking CBF

score_p = scale(dadosGremio$PontosCBF, center = T)
fig <- plot_ly(dadosGremio, x = ~X, y = score_p, name = 'trace 0', type = 'scatter', mode = 'lines') 

fig <- fig %>% layout(title = "Pontos do Grêmio Normalizados Ranking CBF",

         xaxis = list(title = "Anos"),

         yaxis = list (title = "Tendencia"))
fig

Lugar do Grêmio no Ranking CBF

fig <- plot_ly(dadosGremio, x = ~X, y = dadosGremio$RankingCBF, name = 'trace 0', type = 'scatter', mode = 'lines') 

fig <- fig %>% layout(title = "Lugar do Grêmio no Ranking CBF",

         xaxis = list(title = "Anos"),

         yaxis = list (title = "Lugar"))
fig

Lugar do Grêmio Normalizados Ranking CBF

score_p = scale(dadosGremio$RankingCBF, center = T)
fig <- plot_ly(dadosGremio, x = ~X, y = score_p, name = 'trace 0', type = 'scatter', mode = 'lines') 

fig <- fig %>% layout(title = "Lugar do Grêmio Normalizados Ranking CBF",

         xaxis = list(title = "Anos"),

         yaxis = list (title = "Tendencia"))
fig

Titulos No Ano do Grêmio

score_p = scale(dadosGremio$RankingCBF, center = T)
fig <- plot_ly(dadosGremio, x = ~X, y = dadosGremio$TitulosNoAno, name = 'trace 0', type = 'scatter', mode = 'lines') 

fig <- fig %>% layout(title = "Titulos do Grêmio no Brasileirão",

         xaxis = list(title = "Anos"),

         yaxis = list (title = "Titulos"))
fig

Coeficiente de Relação: Usamos o “cor” em R, por padrão no metodo de Pearson Ele vai nos retornar uma pontuação sobre a correlação entre os dois dados inseridos nele, por exemplo:

score_pCBF = scale(dadosGremio$PontosCBF, center = T)
score_pBR = scale(dadosGremio$PontosBr, center = T)

print(cor(score_pCBF,score_pBR))
##            [,1]
## [1,] -0.2887195

Como o esperado notamos que os Pontos da CBF e Pontos do Brasileirão tem uma relação baixa, praticamente Nula.

score_pCBF = scale(dadosGremio$PontosCBF, center = T)
score_pBR = scale(dadosGremio$PontosBr, center = T)

fig <- plot_ly(dadosGremio, x = ~X, y = ~score_pCBF, name = 'Pontos CBF', type = 'scatter', mode = 'lines') 

fig <- fig %>% add_trace(y = ~score_pBR, name = 'Pontos Brasileirão', mode = 'lines+markers') 

fig <- fig %>% layout(title = "Relação normalizada Pontos CBF x Pontos Brasileirão",

         xaxis = list(title = "Anos"),

         yaxis = list (title = "Pontos"))

fig

Irei normalizar todos as variavéis e usar a partir daqui para facilitar o trabalho, sempre ultilizarei a correlação “cor(dadoA,dadoB)” para verificar se existe correspondência entre os valores:

score_pCBF = scale(dadosGremio$PontosCBF, center = T)
score_pBR = scale(dadosGremio$PontosBr, center = T)
score_Tit = scale(dadosGremio$TitulosNoAno, center = T)
score_ValorDoTime = scale(dadosGremio$ValorDoTimeEuroMi, center = T)
print(cor(score_pCBF,score_pBR))
##            [,1]
## [1,] -0.2887195

O preço do time afeta?

Será que o preço do elenco afeta o desempenho do time? Primeiro a correlação:

sprintf("Pontos CBF e valor do time: %s",cor(score_pCBF,score_ValorDoTime))
## [1] "Pontos CBF e valor do time: 0.31710407774005"
sprintf("Pontos Brasileirão e valor do time: %s",cor(score_pBR,score_ValorDoTime))
## [1] "Pontos Brasileirão e valor do time: -0.391013542233749"
sprintf("Titulos e valor do time: %s",cor(score_Tit,score_ValorDoTime))
## [1] "Titulos e valor do time: 0.554542023978298"

Resultados interessantes, talvez o valor do time tenha relação com o número de títulos

score_pCBF = scale(dadosGremio$PontosCBF, center = T)
score_pBR = scale(dadosGremio$PontosBr, center = T)

fig <- plot_ly(dadosGremio, x = ~X, y = ~score_ValorDoTime, name = 'Valor do time', type = 'scatter', mode = 'lines') 

fig <- fig %>% add_trace(y = ~score_pBR, name = 'Pontos Brasileirão', mode = 'lines+markers') 

fig <- fig %>% add_trace(y = ~score_pCBF, name = 'Pontos CBF', mode = 'lines+markers') 

fig <- fig %>% add_trace(y = score_Tit, name = 'Número de títulos', mode = 'lines+markers') 

fig <- fig %>% layout(title = "Relações",

         xaxis = list(title = "Anos"),

         yaxis = list (title = "Pontos"))

fig

Como o esperado, há uma relação, ainda que não tão forte, entre o preço do elenco do ano e o número de titulos, como achamos com a correlação de Pearson : 0.554542

Ou seja: O preço do Elenco AFETA o Grêmio

Política

Será que política Brasileira afeta o Grêmio? Vamos começar com os filiados de alguns partidos desde 2012: PT, PSDB, PL, PCB e MDB, números a partir de Janeiro retirados do: https://www.tse.jus.br/eleitor/estatisticas-de-eleitorado/filiados

PTFilhados <- c(1523955,1550671,1588308,1586357,1589270,1585746,1585434,1589943,1475301,1544322,1607025)
PSDBFilhados <- c(1352831,1354704,1350434,1348537,1409120,1445992,1455773,1457534,1365550,1374981,1354405)
PCBFilhados <- c(15914,15579,15274,15138,14848,14824,14751,14680,12922,12784,12649)

Será que há correlação entre número de filiados desses partidos e o desempenho do Grêmio?

PT

PTFilhados <- scale(PTFilhados, center = T)
sprintf("Filiados do PT e sua relação com:")
## [1] "Filiados do PT e sua relação com:"
sprintf("Pontos CBF %s",cor(score_pCBF,PTFilhados))
## [1] "Pontos CBF 0.315860193670161"
sprintf("Pontos Brasileirão %s",cor(score_pBR,PTFilhados))
## [1] "Pontos Brasileirão 0.298678849765549"
sprintf("Titulos : %s",cor(score_Tit,PTFilhados))
## [1] "Titulos : 0.135888995328369"
sprintf("Valor do time: %s",cor(score_ValorDoTime,PTFilhados))
## [1] "Valor do time: -0.474777364898577"

Aparentemente o numero de filiados do PT não tem relação com o Grêmio, o mais perto seria o inverso com o valor do Elenco, porém não chega a 50% de correlação.

PSDB

PSDBFilhados <- scale(PSDBFilhados, center = T)
sprintf("Filiados do PSDB e sua relação com:")
## [1] "Filiados do PSDB e sua relação com:"
sprintf("Pontos CBF %s",cor(score_pCBF,PSDBFilhados))
## [1] "Pontos CBF 0.292133119505457"
sprintf("Pontos Brasileirão %s",cor(score_pBR,PSDBFilhados))
## [1] "Pontos Brasileirão -0.161601717483398"
sprintf("Titulos : %s",cor(score_Tit,PSDBFilhados))
## [1] "Titulos : 0.732753820662196"
sprintf("Valor do time: %s",cor(score_ValorDoTime,PSDBFilhados))
## [1] "Valor do time: 0.230974825425114"

Aparentemente o numero de filiados do PSDB tem uma estranha relação de 73% com o número de titulos, vamos ver o gráfico normalizado:

fig <- plot_ly(dadosGremio, x = ~X, y = score_Tit, name = 'Titulos do ano Normalizado', type = 'scatter', mode = 'lines') 

fig <- fig %>% add_trace(y = PSDBFilhados, name = 'Filiados PSDB normalizado', mode = 'lines+markers')

fig

PCB

PCBFilhados <- scale(PCBFilhados, center = T)
sprintf("Filiados do PCB e sua relação com:")
## [1] "Filiados do PCB e sua relação com:"
sprintf("Pontos CBF %s",cor(score_pCBF,PCBFilhados))
## [1] "Pontos CBF -0.428227073310286"
sprintf("Pontos Brasileirão %s",cor(score_pBR,PCBFilhados))
## [1] "Pontos Brasileirão 0.119267572577871"
sprintf("Titulos : %s",cor(score_Tit,PCBFilhados))
## [1] "Titulos : -0.494032971467415"
sprintf("Valor do time: %s",cor(score_ValorDoTime,PCBFilhados))
## [1] "Valor do time: -0.532706023310499"

Aparentemente o numero de filiados do PCB não tem relação com o Grêmio, o mais perto seria o inverso com o valor do Elenco assim como o PT, com um pouco mais de 50%, vamos plotar apenas para visualizar.

fig <- plot_ly(dadosGremio, x = ~X, y = score_ValorDoTime, name = 'Valor do Time', type = 'scatter', mode = 'lines') 

fig <- fig %>% add_trace(y = PSDBFilhados, name = 'Filiados PCB normalizado', mode = 'lines+markers')

fig

Conclusão: Aparentemente o Grêmio não é afetado pelos 3 partidos. Não afeta o Grêmio

Alguns dados da Economia afetam?

Pib per capita

Pegaremos dados do PIB per capita daqui: https://sidra.ibge.gov.br/tabela/6784#/n1/all/v/9812/p/all/d/v9812%202/l/v,,t+p/resultado

Infelizmente os dados tem que ser a partir de 2016

dadosGremioAte2019 <- dadosGremio[1:8,]
pibPerCapita <- c(24278.35,26657.54,28648.74,29466.85,30558.75,31843.95,33593.82,35161.70)

dadosGremioRecorte2016 <- dadosGremio[5:10, ]


sprintf("Pontos CBF e PibPerCapita: %s",cor(dadosGremioAte2019$PontosCBF,pibPerCapita))
## [1] "Pontos CBF e PibPerCapita: 0.676176564370397"
sprintf("Pontos Brasileirão e PibPerCapita: %s",cor(dadosGremioAte2019$PontosBr,pibPerCapita))
## [1] "Pontos Brasileirão e PibPerCapita: -0.287850213336758"
sprintf("Titulos e PibPerCapita: %s",cor(dadosGremioAte2019$TitulosNoAno,pibPerCapita))
## [1] "Titulos e PibPerCapita: 0.786051980042362"
sprintf("Valor do time e PibPerCapita: %s",cor(dadosGremioAte2019$ValorDoTimeEuroMi,pibPerCapita))
## [1] "Valor do time e PibPerCapita: 0.609221848174698"

Parece haver relação entre o número de titúlos e o PIB per capita

fig <- plot_ly(dadosGremioAte2019, x = ~X, y = scale(pibPerCapita, center = T), name = 'Renda per Capita', type = 'scatter', mode = 'lines') 

fig <- fig %>% add_trace(y = scale(dadosGremioAte2019$TitulosNoAno, center = T), name = 'Títulos do Grêmio', mode = 'lines+')



fig

Descobrimos assim que o Pib per capita afetou o número de títulos do grêmio!

Rendimento real médio mensal per capita nos domicílios com televisão sem acesso a serviço de televisão por assinatura em Reais

Vamos tentar alguns dados econômicos, a começar com Renda média Mensal, via “Rendimento real médio mensal per capita nos domicílios com televisão sem acesso a serviço de televisão por assinatura em Reais” daqui: https://sidra.ibge.gov.br/tabela/7403

rendaPerCapita <- c(976,1033,1065,1121,1121,1106)

dadosGremioRecorte2016 <- dadosGremio[5:10, ]


sprintf("Pontos CBF e Renda: %s",cor(dadosGremioRecorte2016$PontosCBF,rendaPerCapita))
## [1] "Pontos CBF e Renda: 0.796284173078085"
sprintf("Pontos Brasileirão e Renda: %s",cor(dadosGremioRecorte2016$PontosBr,rendaPerCapita))
## [1] "Pontos Brasileirão e Renda: 0.059495772120635"
sprintf("Titulos e Renda: %s",cor(dadosGremioRecorte2016$TitulosNoAno,rendaPerCapita))
## [1] "Titulos e Renda: -0.0451726943713453"
sprintf("Valor do time e Renda: %s",cor(dadosGremioRecorte2016$ValorDoTimeEuroMi,rendaPerCapita))
## [1] "Valor do time e Renda: 0.733287845076902"

Interessante parece haver relação entre os pontos do Ranking da CBF e a Renda com 79% Além do valor do time com 73%, vamos plotar:

fig <- plot_ly(dadosGremioRecorte2016, x = ~X, y = scale(rendaPerCapita, center = T), name = 'Renda per Capita', type = 'scatter', mode = 'lines') 

fig <- fig %>% add_trace(y = scale(dadosGremioRecorte2016$PontosCBF, center = T), name = 'Pontos CBF', mode = 'lines+')

fig <- fig %>% add_trace(y = scale(dadosGremioRecorte2016$ValorDoTimeEuroMi), name = 'Valor do Time', mode = 'lines')

fig

Fantástico, descobrimos que o Rendimento real médio mensal per capita nos domicílios com televisão sem acesso a serviço de televisão por assinatura em Reais afeta o Grêmio desde 2016.

Taxa de desemprego em Janeiro

Será que a taxa de desemprego de Janeiro afeta o Grêmio? Dados de: https://www.ibge.gov.br/estatisticas/sociais/trabalho/9173-pesquisa-nacional-por-amostra-de-domicilios-continua-trimestral.html?=&t=series-historicas&utm_source=landing&utm_medium=explica&utm_campaign=desemprego

Desemprego <- c(8,7.3,7.2,6.9,11.1,13.9,13.2,12.8,12.4,14.9,11.1)




sprintf("Pontos CBF e Desemprego: %s",cor(dadosGremio$PontosCBF,Desemprego))
## [1] "Pontos CBF e Desemprego: 0.367239410040462"
sprintf("Pontos Brasileirão e Desemprego: %s",cor(dadosGremio$PontosBr,Desemprego))
## [1] "Pontos Brasileirão e Desemprego: -0.389271494133379"
sprintf("Titulos e Desemprego: %s",cor(dadosGremio$TitulosNoAno,Desemprego))
## [1] "Titulos e Desemprego: 0.848445613992464"
sprintf("Valor do time e Desemprego: %s",cor(dadosGremio$ValorDoTimeEuroMi,Desemprego))
## [1] "Valor do time e Desemprego: 0.526049060902173"

Será que o Número de Titulos e taxa de Desemprego tem relação como mostra Pearson? Vamos plotar:

fig <- plot_ly(dadosGremio, x = ~X, y = scale(Desemprego, center = T), name = 'Desemprego', type = 'scatter', mode = 'lines') 

fig <- fig %>% add_trace(y = scale(dadosGremio$TitulosNoAno, center = T), name = 'Títulos no ano', mode = 'lines+')


fig

Ao que parece antes de 2019 tinhamos uma pequena correlação entre ambos dados, ou seja A taxa de desemprego afetava o Grêmio

Entretenimento

Anitta

Será que os Singles da Anitta influênciam o Grêmio?

#Número de Singles da Anitta
nAlbuns <- c(2,3,4,3,3,4,8,16,4,9,8)


sprintf("Pontos CBF e álbuns: %s",cor(dadosGremio$PontosCBF,nAlbuns))
## [1] "Pontos CBF e álbuns: 0.337031571686352"
sprintf("Pontos Brasileirão e álbuns: %s",cor(dadosGremio$PontosBr,nAlbuns))
## [1] "Pontos Brasileirão e álbuns: -0.000637432544083101"
sprintf("Titulos e álbuns: %s",cor(dadosGremio$TitulosNoAno,nAlbuns))
## [1] "Titulos e álbuns: 0.502205893063061"
sprintf("Valor do time e álbuns: %s",cor(dadosGremio$ValorDoTimeEuroMi,nAlbuns))
## [1] "Valor do time e álbuns: 0.49221139011491"

O número de Singles de Anitta não parecem ter relação com o Grêmio, ou seja Anitta não afeta o Grêmio

Ghost

Será que os Álbuns da banda Ghost influênciam o Grêmio?

#Número de Álbuns da banda Ghost
nAlbuns <- c(0,1,0,0,1,0,0,1,0,0,1)


sprintf("Pontos CBF e álbuns: %s",cor(dadosGremio$PontosCBF,nAlbuns))
## [1] "Pontos CBF e álbuns: 0.178669009545949"
sprintf("Pontos Brasileirão e álbuns: %s",cor(dadosGremio$PontosBr,nAlbuns))
## [1] "Pontos Brasileirão e álbuns: 0.259968797654138"
sprintf("Titulos e álbuns: %s",cor(dadosGremio$TitulosNoAno,nAlbuns))
## [1] "Titulos e álbuns: 0.0278639106287676"
sprintf("Valor do time e álbuns: %s",cor(dadosGremio$ValorDoTimeEuroMi,nAlbuns))
## [1] "Valor do time e álbuns: -0.0656869991532833"

O número de álbum não parecem ter relação com o Grêmio, ou seja A banda Ghost não afeta o Grêmio

Rating de games por ano

Temos aqui os principais Ratings de games por ano, será que a média desses games afeta o Grêmio?

dadosGames <- read.csv("data/imdb_video_game_rating.csv")

dadosGames <- dadosGames[which(dadosGames$year>=2012 & dadosGames$year != "I)"& dadosGames$year != "IV)"& dadosGames$year != "II)"& dadosGames$year != "III)"& dadosGames$year != "Video"),]
#head(dadosGames)

#unique(dadosGames$year)

ratingGame <- aggregate(dadosGames$rating, list(dadosGames$year), FUN=mean) 

sprintf("Pontos CBF e Rating de games: %s",cor(dadosGremio$PontosCBF,ratingGame$x))
## [1] "Pontos CBF e Rating de games: 0.0315212939095781"
sprintf("Pontos Brasileirão e Rating de games: %s",cor(dadosGremio$PontosBr,ratingGame$x))
## [1] "Pontos Brasileirão e Rating de games: 0.350658503944108"
sprintf("Titulos e Rating de games: %s",cor(dadosGremio$TitulosNoAno,ratingGame$x))
## [1] "Titulos e Rating de games: 0.122020679950653"
sprintf("Valor do time e Rating de games: %s",cor(dadosGremio$ValorDoTimeEuroMi,ratingGame$x))
## [1] "Valor do time e Rating de games: -0.112440449177218"

Não parece ter afetar o Grêmio, mas vejo o proximo Plot:

fig <- plot_ly(dadosGremio, x = ~X, y = scale(ratingGame$x, center = T), name = 'Média de Rating por ano', type = 'scatter', mode = 'lines') 

fig <- fig %>% add_trace(y = scale(dadosGremio$ValorDoTimeEuroMi, center = T), name = 'Títulos do Grêmio', mode = 'lines+')



fig

Controle dos Browser de mercado

Será que os navegadores de internet e sua briga afeta o Grêmio?

dadosBroswer <- read.csv("data/browser.csv")

dadosBroswer <- dadosBroswer[2:12,1:6]
Chrome

Vamos ver com a fatia de mercado do Chrome

sprintf("Pontos CBF e Chrome: %s",cor(dadosGremio$PontosCBF,dadosBroswer$Chrome))
## [1] "Pontos CBF e Chrome: 0.706655279844926"
sprintf("Pontos Brasileirão e Chrome: %s",cor(dadosGremio$PontosBr,dadosBroswer$Chrome))
## [1] "Pontos Brasileirão e Chrome: -0.21058500329272"
sprintf("Titulos e Chrome: %s",cor(dadosGremio$TitulosNoAno,dadosBroswer$Chrome))
## [1] "Titulos e Chrome: 0.81620549983131"
sprintf("Valor do time e Chrome: %s",cor(dadosGremio$ValorDoTimeEuroMi,dadosBroswer$Chrome))
## [1] "Valor do time e Chrome: 0.580769121955433"

Será que os Pontos do Ranking CBF tem relação com a fatia de mercado do Chrome?

fig <- plot_ly(dadosGremio, x = ~X, y = scale(dadosBroswer$Chrome, center = T), name = 'Fatia de mercado do Chrome', type = 'scatter', mode = 'lines') 

fig <- fig %>% add_trace(y = scale(dadosGremio$PontosCBF, center = T), name = 'Pontos do Grêmio na CBF', mode = 'lines+')



fig

Parece que a fatia de mercado do Chrome afeta o Grêmio

IE

Vamos ver com a fatia de mercado do IE

sprintf("Pontos CBF e Chrome: %s",cor(dadosGremio$PontosCBF,dadosBroswer$IE))
## [1] "Pontos CBF e Chrome: -0.617932902878286"
sprintf("Pontos Brasileirão e Chrome: %s",cor(dadosGremio$PontosBr,dadosBroswer$IE))
## [1] "Pontos Brasileirão e Chrome: 0.170604366602833"
sprintf("Titulos e Chrome: %s",cor(dadosGremio$TitulosNoAno,dadosBroswer$IE))
## [1] "Titulos e Chrome: -0.795211608223453"
sprintf("Valor do time e Chrome: %s",cor(dadosGremio$ValorDoTimeEuroMi,dadosBroswer$IE))
## [1] "Valor do time e Chrome: -0.560817387206141"

Será que os Titulos do ano tem relação com a fatia de mercado do IE?

fig <- plot_ly(dadosGremio, x = ~X, y = scale(dadosBroswer$Chrome, center = T), name = 'Fatia de mercado do IE', type = 'scatter', mode = 'lines') 

fig <- fig %>% add_trace(y = scale(dadosGremio$TitulosNoAno, center = T), name = 'Títulos do ano', mode = 'lines+')



fig

Parece que a fatia de mercado do IE afeta os Títulos do Grêmio

Firefox

Vamos ver com a fatia de mercado do Firefox

sprintf("Pontos CBF e Chrome: %s",cor(dadosGremio$PontosCBF,dadosBroswer$Firefox))
## [1] "Pontos CBF e Chrome: -0.603516541306584"
sprintf("Pontos Brasileirão e Chrome: %s",cor(dadosGremio$PontosBr,dadosBroswer$Firefox))
## [1] "Pontos Brasileirão e Chrome: 0.146465091000627"
sprintf("Titulos e Chrome: %s",cor(dadosGremio$TitulosNoAno,dadosBroswer$Firefox))
## [1] "Titulos e Chrome: -0.769634735324252"
sprintf("Valor do time e Chrome: %s",cor(dadosGremio$ValorDoTimeEuroMi,dadosBroswer$Firefox))
## [1] "Valor do time e Chrome: -0.642471705094246"

Parece que a fatia de mercado do Firefox não afeta o Grêmio

Safari

Vamos ver com a fatia de mercado do Safari

sprintf("Pontos CBF e Chrome: %s",cor(dadosGremio$PontosCBF,dadosBroswer$Safari))
## [1] "Pontos CBF e Chrome: 0.0909663696886285"
sprintf("Pontos Brasileirão e Chrome: %s",cor(dadosGremio$PontosBr,dadosBroswer$Safari))
## [1] "Pontos Brasileirão e Chrome: -0.0629680940594212"
sprintf("Titulos e Chrome: %s",cor(dadosGremio$TitulosNoAno,dadosBroswer$Safari))
## [1] "Titulos e Chrome: 0.30654575338909"
sprintf("Valor do time e Chrome: %s",cor(dadosGremio$ValorDoTimeEuroMi,dadosBroswer$Safari))
## [1] "Valor do time e Chrome: 0.521063843361463"

Parece que a fatia de mercado do Safari não afeta o Grêmio

Bônus

Algumas correlações são estranhas e eu descobri por acaso, aqui algumas delas:

Filiados do PCB e pontos do Vasco

Ao que parece há uma relação muito grande entre a queda do crescimento (não confundir com numero total) de filiados do PCB e dos pontos do Vasco no Raking CBF

vasco <- "Vasco da Gama"
pontos <- c(14426,12132,11928,10040,9322,9360,9242,8828,8206)

PCB <- "PCB"
eleitoresFilhadosPCB <- c(15140,14852,14830,14830,14682,12921,12784, 12651, 12530)

vascotab <- data.frame(vasco, pontos)
pcbtab <- data.frame(PCB,eleitoresFilhadosPCB)


anos = c(2014,2015,2016,2017,2018,2019,2020, 2021, 2022)

score_v = scale(vascotab$pontos, center = T)
score_pc = scale(pcbtab$eleitoresFilhados, center = T)
df <- data.frame("index" = anos, "pontos" = score_v, "eleitoresFilhados" = score_pc,"eleitoresFilhadosPCB" = score_pc)




fig <- plot_ly(df, type = 'scatter', mode = 'lines')%>%
  add_trace(x = ~anos, y = ~pontos, name = 'Pontos do vasco',line = list(color = 'blue'))%>%
  add_trace(x = ~anos, y = ~eleitoresFilhadosPCB, name = 'Filiados ao PCB',line = list(color = 'red'))

fig

Fatias de Firefox no mercado e pontos do Vasco

Ao que parece há uma relação muito grande também entre os Pontos do Vasco no Ranking da CBF e a fatia de mercado do Firefox

vasco <- "Vasco da Gama"
pontos <- c(14426,12132,11928,10040,9322,9360,9242)

vascotab <- data.frame(vasco, pontos)
anos = c(2014,2015,2016,2017,2018,2019,2020)
score_v = scale(vascotab$pontos, center = T)

dadosBroswerFire <- dadosBroswer[3:9,]

#head(dadosBroswerFire)


fig <- plot_ly(vascotab, type = 'scatter', mode = 'lines')%>%
  add_trace(x = ~anos, y = scale(pontos, center = T), name = 'Pontos do vasco',line = list(color = 'blue'))%>%
  add_trace(x = ~anos, y = scale(dadosBroswerFire$Firefox, center = T) , name = 'Fatia de Mercado do Firefox',line = list(color = 'red'))

fig

Conclusões

Sim, existem coisas que afetam o Grêmio, porém é necessário garimpar os dados para descobrir os códigos por trás dos números que afetam o Grêmio.