Afeta o Grêmio?
Mas como isso afeta o Grêmio?
Por Renan Tomazini
Introdução
O Presente relatório busca responder uma pergunta que está sendo muito discutida na internet por pesquisadores do mundo inteiro, “Como isso afeta o Grêmio?” A pergunta repercutiu em 2022, durante o Gre-Nal 435, quando o Internacional de Porto Alegre, o time Rival do Grêmio, declarou no Twitter: #INTxGRE | 2T | ⏱️ 50’ - AFETOU O GRÊMIO! 🔥 Segundo o GloboEsporte, a frase tem origem em um vídeo produzido por um torcedor gremista que explicaria a relação da morte do príncipe Phillip, marido da rainha Elizabeth II, do Reino Unido, em abril de 2021, com o clube. O vídeo se encontra disponível no link: https://www.youtube.com/watch?v=d45kkL0EwSs
O meme se espalhou pela internet, chegando a ser usado por
influencers em redes sociais e Streamings de Futebol na Twitch, ele
tomou forma com o personagem Walter White de Breaking Bad, como na
imagem abaixo:
Desde então a pergunta que a internet faz é: Como isso afeta o Grêmio? Vou tentar ver algumas estatísticas do clube, como Ranking e Pontos na CBF e no Brasileirão e tentar encontrar algumas relações com acontecimentos importantes do nosso cotidiano. Então esse é o Mas afeta o Grêmio?
Coeficiente de Relação: Usamos o “cor” em R, por padrão no metodo de Pearson Ele vai nos retornar uma pontuação sobre a correlação entre os dois dados inseridos nele.
Esse relatório é apenas uma brincadeira, não representa um estudo de relação propriamente dito, baseado principalmente em: https://www.tylervigen.com/spurious-correlations Ele serve para meu treinamento de Data Science
Pacotes Requeridos:
Os pacotes a serem usados são:
plotly Para criação de gráficos.
stringr Para trabalhar com as strings presentes no dataset.
tidyr Para auxiliar na limpeza e organização das tabelas de dados.
rmdformats Para o teme da página
Análise
Dados do Grêmio
Os primeiros dados referentes a Ranking CBF, Brasileirão e Títulos foram retirados da Wikipedia e revisados no Globoesporte referente a cada ano. Já o preço do time foi pego do site transfermarkt. e está em Euro.
<- read.csv("data/estGremio.csv")
dadosGremio head(dadosGremio)
## X PontosCBF PontosBr RankingCBF TitulosNoAno ValorDoTimeEuroMi
## 1 2010 1000 63 4 1 1.16
## 2 2011 1500 48 12 0 1.14
## 3 2012 2208 71 4 0 1.12
## 4 2013 14460 65 5 0 1.31
## 5 2014 15286 61 1 0 1.14
## 6 2015 13992 68 4 0 1.21
# Onde x é o ano
Irei excluir 2010 e 2011 por não termos os rankings da CBF.
<- dadosGremio[3:13, ] dadosGremio
Vamos criar alguns gráficos para ter uma noção de cada ano
Pontos do Grêmio no Brasileirão
<- plot_ly(dadosGremio, x = ~X, y = dadosGremio$PontosBr, name = 'trace 0', type = 'scatter', mode = 'lines')
fig
<- fig %>% layout(title = "Pontos do Grêmio no Brasileirão",
fig
xaxis = list(title = "Anos"),
yaxis = list (title = "Pontos"))
fig
Pontos do Grêmio Normalizados no Brasileirão
= scale(dadosGremio$PontosBr, center = T)
score_p <- plot_ly(dadosGremio, x = ~X, y = score_p, name = 'trace 0', type = 'scatter', mode = 'lines')
fig
<- fig %>% layout(title = "Pontos Normalizados do Grêmio no Brasileirão",
fig
xaxis = list(title = "Anos"),
yaxis = list (title = "Tendencia"))
fig
Pontos do Grêmio no Ranking CBF
<- plot_ly(dadosGremio, x = ~X, y = dadosGremio$PontosCBF, name = 'trace 0', type = 'scatter', mode = 'lines')
fig
<- fig %>% layout(title = "Pontos do Grêmio no Ranking CBF",
fig
xaxis = list(title = "Anos"),
yaxis = list (title = "Pontos"))
fig
Pontos do Grêmio Normalizados no Ranking CBF
= scale(dadosGremio$PontosCBF, center = T)
score_p <- plot_ly(dadosGremio, x = ~X, y = score_p, name = 'trace 0', type = 'scatter', mode = 'lines')
fig
<- fig %>% layout(title = "Pontos do Grêmio Normalizados Ranking CBF",
fig
xaxis = list(title = "Anos"),
yaxis = list (title = "Tendencia"))
fig
Lugar do Grêmio no Ranking CBF
<- plot_ly(dadosGremio, x = ~X, y = dadosGremio$RankingCBF, name = 'trace 0', type = 'scatter', mode = 'lines')
fig
<- fig %>% layout(title = "Lugar do Grêmio no Ranking CBF",
fig
xaxis = list(title = "Anos"),
yaxis = list (title = "Lugar"))
fig
Lugar do Grêmio Normalizados Ranking CBF
= scale(dadosGremio$RankingCBF, center = T)
score_p <- plot_ly(dadosGremio, x = ~X, y = score_p, name = 'trace 0', type = 'scatter', mode = 'lines')
fig
<- fig %>% layout(title = "Lugar do Grêmio Normalizados Ranking CBF",
fig
xaxis = list(title = "Anos"),
yaxis = list (title = "Tendencia"))
fig
Titulos No Ano do Grêmio
= scale(dadosGremio$RankingCBF, center = T)
score_p <- plot_ly(dadosGremio, x = ~X, y = dadosGremio$TitulosNoAno, name = 'trace 0', type = 'scatter', mode = 'lines')
fig
<- fig %>% layout(title = "Titulos do Grêmio no Brasileirão",
fig
xaxis = list(title = "Anos"),
yaxis = list (title = "Titulos"))
fig
Coeficiente de Relação: Usamos o “cor” em R, por padrão no metodo de Pearson Ele vai nos retornar uma pontuação sobre a correlação entre os dois dados inseridos nele, por exemplo:
= scale(dadosGremio$PontosCBF, center = T)
score_pCBF = scale(dadosGremio$PontosBr, center = T)
score_pBR
print(cor(score_pCBF,score_pBR))
## [,1]
## [1,] -0.2887195
Como o esperado notamos que os Pontos da CBF e Pontos do Brasileirão tem uma relação baixa, praticamente Nula.
= scale(dadosGremio$PontosCBF, center = T)
score_pCBF = scale(dadosGremio$PontosBr, center = T)
score_pBR
<- plot_ly(dadosGremio, x = ~X, y = ~score_pCBF, name = 'Pontos CBF', type = 'scatter', mode = 'lines')
fig
<- fig %>% add_trace(y = ~score_pBR, name = 'Pontos Brasileirão', mode = 'lines+markers')
fig
<- fig %>% layout(title = "Relação normalizada Pontos CBF x Pontos Brasileirão",
fig
xaxis = list(title = "Anos"),
yaxis = list (title = "Pontos"))
fig
Irei normalizar todos as variavéis e usar a partir daqui para facilitar o trabalho, sempre ultilizarei a correlação “cor(dadoA,dadoB)” para verificar se existe correspondência entre os valores:
= scale(dadosGremio$PontosCBF, center = T)
score_pCBF = scale(dadosGremio$PontosBr, center = T)
score_pBR = scale(dadosGremio$TitulosNoAno, center = T)
score_Tit = scale(dadosGremio$ValorDoTimeEuroMi, center = T)
score_ValorDoTime print(cor(score_pCBF,score_pBR))
## [,1]
## [1,] -0.2887195
O preço do time afeta?
Será que o preço do elenco afeta o desempenho do time? Primeiro a correlação:
sprintf("Pontos CBF e valor do time: %s",cor(score_pCBF,score_ValorDoTime))
## [1] "Pontos CBF e valor do time: 0.31710407774005"
sprintf("Pontos Brasileirão e valor do time: %s",cor(score_pBR,score_ValorDoTime))
## [1] "Pontos Brasileirão e valor do time: -0.391013542233749"
sprintf("Titulos e valor do time: %s",cor(score_Tit,score_ValorDoTime))
## [1] "Titulos e valor do time: 0.554542023978298"
Resultados interessantes, talvez o valor do time tenha relação com o número de títulos
= scale(dadosGremio$PontosCBF, center = T)
score_pCBF = scale(dadosGremio$PontosBr, center = T)
score_pBR
<- plot_ly(dadosGremio, x = ~X, y = ~score_ValorDoTime, name = 'Valor do time', type = 'scatter', mode = 'lines')
fig
<- fig %>% add_trace(y = ~score_pBR, name = 'Pontos Brasileirão', mode = 'lines+markers')
fig
<- fig %>% add_trace(y = ~score_pCBF, name = 'Pontos CBF', mode = 'lines+markers')
fig
<- fig %>% add_trace(y = score_Tit, name = 'Número de títulos', mode = 'lines+markers')
fig
<- fig %>% layout(title = "Relações",
fig
xaxis = list(title = "Anos"),
yaxis = list (title = "Pontos"))
fig
Como o esperado, há uma relação, ainda que não tão forte, entre o preço do elenco do ano e o número de titulos, como achamos com a correlação de Pearson : 0.554542
Ou seja: O preço do Elenco AFETA o Grêmio
Política
Será que política Brasileira afeta o Grêmio? Vamos começar com os filiados de alguns partidos desde 2012: PT, PSDB, PL, PCB e MDB, números a partir de Janeiro retirados do: https://www.tse.jus.br/eleitor/estatisticas-de-eleitorado/filiados
<- c(1523955,1550671,1588308,1586357,1589270,1585746,1585434,1589943,1475301,1544322,1607025)
PTFilhados <- c(1352831,1354704,1350434,1348537,1409120,1445992,1455773,1457534,1365550,1374981,1354405)
PSDBFilhados <- c(15914,15579,15274,15138,14848,14824,14751,14680,12922,12784,12649) PCBFilhados
Será que há correlação entre número de filiados desses partidos e o desempenho do Grêmio?
PT
<- scale(PTFilhados, center = T)
PTFilhados sprintf("Filiados do PT e sua relação com:")
## [1] "Filiados do PT e sua relação com:"
sprintf("Pontos CBF %s",cor(score_pCBF,PTFilhados))
## [1] "Pontos CBF 0.315860193670161"
sprintf("Pontos Brasileirão %s",cor(score_pBR,PTFilhados))
## [1] "Pontos Brasileirão 0.298678849765549"
sprintf("Titulos : %s",cor(score_Tit,PTFilhados))
## [1] "Titulos : 0.135888995328369"
sprintf("Valor do time: %s",cor(score_ValorDoTime,PTFilhados))
## [1] "Valor do time: -0.474777364898577"
Aparentemente o numero de filiados do PT não tem relação com o Grêmio, o mais perto seria o inverso com o valor do Elenco, porém não chega a 50% de correlação.
PSDB
<- scale(PSDBFilhados, center = T)
PSDBFilhados sprintf("Filiados do PSDB e sua relação com:")
## [1] "Filiados do PSDB e sua relação com:"
sprintf("Pontos CBF %s",cor(score_pCBF,PSDBFilhados))
## [1] "Pontos CBF 0.292133119505457"
sprintf("Pontos Brasileirão %s",cor(score_pBR,PSDBFilhados))
## [1] "Pontos Brasileirão -0.161601717483398"
sprintf("Titulos : %s",cor(score_Tit,PSDBFilhados))
## [1] "Titulos : 0.732753820662196"
sprintf("Valor do time: %s",cor(score_ValorDoTime,PSDBFilhados))
## [1] "Valor do time: 0.230974825425114"
Aparentemente o numero de filiados do PSDB tem uma estranha relação de 73% com o número de titulos, vamos ver o gráfico normalizado:
<- plot_ly(dadosGremio, x = ~X, y = score_Tit, name = 'Titulos do ano Normalizado', type = 'scatter', mode = 'lines')
fig
<- fig %>% add_trace(y = PSDBFilhados, name = 'Filiados PSDB normalizado', mode = 'lines+markers')
fig
fig
PCB
<- scale(PCBFilhados, center = T)
PCBFilhados sprintf("Filiados do PCB e sua relação com:")
## [1] "Filiados do PCB e sua relação com:"
sprintf("Pontos CBF %s",cor(score_pCBF,PCBFilhados))
## [1] "Pontos CBF -0.428227073310286"
sprintf("Pontos Brasileirão %s",cor(score_pBR,PCBFilhados))
## [1] "Pontos Brasileirão 0.119267572577871"
sprintf("Titulos : %s",cor(score_Tit,PCBFilhados))
## [1] "Titulos : -0.494032971467415"
sprintf("Valor do time: %s",cor(score_ValorDoTime,PCBFilhados))
## [1] "Valor do time: -0.532706023310499"
Aparentemente o numero de filiados do PCB não tem relação com o Grêmio, o mais perto seria o inverso com o valor do Elenco assim como o PT, com um pouco mais de 50%, vamos plotar apenas para visualizar.
<- plot_ly(dadosGremio, x = ~X, y = score_ValorDoTime, name = 'Valor do Time', type = 'scatter', mode = 'lines')
fig
<- fig %>% add_trace(y = PSDBFilhados, name = 'Filiados PCB normalizado', mode = 'lines+markers')
fig
fig
Conclusão: Aparentemente o Grêmio não é afetado pelos 3 partidos. Não afeta o Grêmio
Alguns dados da Economia afetam?
Pib per capita
Pegaremos dados do PIB per capita daqui: https://sidra.ibge.gov.br/tabela/6784#/n1/all/v/9812/p/all/d/v9812%202/l/v,,t+p/resultado
Infelizmente os dados tem que ser a partir de 2016
<- dadosGremio[1:8,]
dadosGremioAte2019 <- c(24278.35,26657.54,28648.74,29466.85,30558.75,31843.95,33593.82,35161.70)
pibPerCapita
<- dadosGremio[5:10, ]
dadosGremioRecorte2016
sprintf("Pontos CBF e PibPerCapita: %s",cor(dadosGremioAte2019$PontosCBF,pibPerCapita))
## [1] "Pontos CBF e PibPerCapita: 0.676176564370397"
sprintf("Pontos Brasileirão e PibPerCapita: %s",cor(dadosGremioAte2019$PontosBr,pibPerCapita))
## [1] "Pontos Brasileirão e PibPerCapita: -0.287850213336758"
sprintf("Titulos e PibPerCapita: %s",cor(dadosGremioAte2019$TitulosNoAno,pibPerCapita))
## [1] "Titulos e PibPerCapita: 0.786051980042362"
sprintf("Valor do time e PibPerCapita: %s",cor(dadosGremioAte2019$ValorDoTimeEuroMi,pibPerCapita))
## [1] "Valor do time e PibPerCapita: 0.609221848174698"
Parece haver relação entre o número de titúlos e o PIB per capita
<- plot_ly(dadosGremioAte2019, x = ~X, y = scale(pibPerCapita, center = T), name = 'Renda per Capita', type = 'scatter', mode = 'lines')
fig
<- fig %>% add_trace(y = scale(dadosGremioAte2019$TitulosNoAno, center = T), name = 'Títulos do Grêmio', mode = 'lines+')
fig
fig
Descobrimos assim que o Pib per capita afetou o número de títulos do grêmio!
Rendimento real médio mensal per capita nos domicílios com televisão sem acesso a serviço de televisão por assinatura em Reais
Vamos tentar alguns dados econômicos, a começar com Renda média Mensal, via “Rendimento real médio mensal per capita nos domicílios com televisão sem acesso a serviço de televisão por assinatura em Reais” daqui: https://sidra.ibge.gov.br/tabela/7403
<- c(976,1033,1065,1121,1121,1106)
rendaPerCapita
<- dadosGremio[5:10, ]
dadosGremioRecorte2016
sprintf("Pontos CBF e Renda: %s",cor(dadosGremioRecorte2016$PontosCBF,rendaPerCapita))
## [1] "Pontos CBF e Renda: 0.796284173078085"
sprintf("Pontos Brasileirão e Renda: %s",cor(dadosGremioRecorte2016$PontosBr,rendaPerCapita))
## [1] "Pontos Brasileirão e Renda: 0.059495772120635"
sprintf("Titulos e Renda: %s",cor(dadosGremioRecorte2016$TitulosNoAno,rendaPerCapita))
## [1] "Titulos e Renda: -0.0451726943713453"
sprintf("Valor do time e Renda: %s",cor(dadosGremioRecorte2016$ValorDoTimeEuroMi,rendaPerCapita))
## [1] "Valor do time e Renda: 0.733287845076902"
Interessante parece haver relação entre os pontos do Ranking da CBF e a Renda com 79% Além do valor do time com 73%, vamos plotar:
<- plot_ly(dadosGremioRecorte2016, x = ~X, y = scale(rendaPerCapita, center = T), name = 'Renda per Capita', type = 'scatter', mode = 'lines')
fig
<- fig %>% add_trace(y = scale(dadosGremioRecorte2016$PontosCBF, center = T), name = 'Pontos CBF', mode = 'lines+')
fig
<- fig %>% add_trace(y = scale(dadosGremioRecorte2016$ValorDoTimeEuroMi), name = 'Valor do Time', mode = 'lines')
fig
fig
Fantástico, descobrimos que o Rendimento real médio mensal per capita nos domicílios com televisão sem acesso a serviço de televisão por assinatura em Reais afeta o Grêmio desde 2016.
Taxa de desemprego em Janeiro
Será que a taxa de desemprego de Janeiro afeta o Grêmio? Dados de: https://www.ibge.gov.br/estatisticas/sociais/trabalho/9173-pesquisa-nacional-por-amostra-de-domicilios-continua-trimestral.html?=&t=series-historicas&utm_source=landing&utm_medium=explica&utm_campaign=desemprego
<- c(8,7.3,7.2,6.9,11.1,13.9,13.2,12.8,12.4,14.9,11.1)
Desemprego
sprintf("Pontos CBF e Desemprego: %s",cor(dadosGremio$PontosCBF,Desemprego))
## [1] "Pontos CBF e Desemprego: 0.367239410040462"
sprintf("Pontos Brasileirão e Desemprego: %s",cor(dadosGremio$PontosBr,Desemprego))
## [1] "Pontos Brasileirão e Desemprego: -0.389271494133379"
sprintf("Titulos e Desemprego: %s",cor(dadosGremio$TitulosNoAno,Desemprego))
## [1] "Titulos e Desemprego: 0.848445613992464"
sprintf("Valor do time e Desemprego: %s",cor(dadosGremio$ValorDoTimeEuroMi,Desemprego))
## [1] "Valor do time e Desemprego: 0.526049060902173"
Será que o Número de Titulos e taxa de Desemprego tem relação como mostra Pearson? Vamos plotar:
<- plot_ly(dadosGremio, x = ~X, y = scale(Desemprego, center = T), name = 'Desemprego', type = 'scatter', mode = 'lines')
fig
<- fig %>% add_trace(y = scale(dadosGremio$TitulosNoAno, center = T), name = 'Títulos no ano', mode = 'lines+')
fig
fig
Ao que parece antes de 2019 tinhamos uma pequena correlação entre ambos dados, ou seja A taxa de desemprego afetava o Grêmio
Entretenimento
Anitta
Será que os Singles da Anitta influênciam o Grêmio?
#Número de Singles da Anitta
<- c(2,3,4,3,3,4,8,16,4,9,8)
nAlbuns
sprintf("Pontos CBF e álbuns: %s",cor(dadosGremio$PontosCBF,nAlbuns))
## [1] "Pontos CBF e álbuns: 0.337031571686352"
sprintf("Pontos Brasileirão e álbuns: %s",cor(dadosGremio$PontosBr,nAlbuns))
## [1] "Pontos Brasileirão e álbuns: -0.000637432544083101"
sprintf("Titulos e álbuns: %s",cor(dadosGremio$TitulosNoAno,nAlbuns))
## [1] "Titulos e álbuns: 0.502205893063061"
sprintf("Valor do time e álbuns: %s",cor(dadosGremio$ValorDoTimeEuroMi,nAlbuns))
## [1] "Valor do time e álbuns: 0.49221139011491"
O número de Singles de Anitta não parecem ter relação com o Grêmio, ou seja Anitta não afeta o Grêmio
Ghost
Será que os Álbuns da banda Ghost influênciam o Grêmio?
#Número de Álbuns da banda Ghost
<- c(0,1,0,0,1,0,0,1,0,0,1)
nAlbuns
sprintf("Pontos CBF e álbuns: %s",cor(dadosGremio$PontosCBF,nAlbuns))
## [1] "Pontos CBF e álbuns: 0.178669009545949"
sprintf("Pontos Brasileirão e álbuns: %s",cor(dadosGremio$PontosBr,nAlbuns))
## [1] "Pontos Brasileirão e álbuns: 0.259968797654138"
sprintf("Titulos e álbuns: %s",cor(dadosGremio$TitulosNoAno,nAlbuns))
## [1] "Titulos e álbuns: 0.0278639106287676"
sprintf("Valor do time e álbuns: %s",cor(dadosGremio$ValorDoTimeEuroMi,nAlbuns))
## [1] "Valor do time e álbuns: -0.0656869991532833"
O número de álbum não parecem ter relação com o Grêmio, ou seja A banda Ghost não afeta o Grêmio
Rating de games por ano
Temos aqui os principais Ratings de games por ano, será que a média desses games afeta o Grêmio?
<- read.csv("data/imdb_video_game_rating.csv")
dadosGames
<- dadosGames[which(dadosGames$year>=2012 & dadosGames$year != "I)"& dadosGames$year != "IV)"& dadosGames$year != "II)"& dadosGames$year != "III)"& dadosGames$year != "Video"),]
dadosGames #head(dadosGames)
#unique(dadosGames$year)
<- aggregate(dadosGames$rating, list(dadosGames$year), FUN=mean)
ratingGame
sprintf("Pontos CBF e Rating de games: %s",cor(dadosGremio$PontosCBF,ratingGame$x))
## [1] "Pontos CBF e Rating de games: 0.0315212939095781"
sprintf("Pontos Brasileirão e Rating de games: %s",cor(dadosGremio$PontosBr,ratingGame$x))
## [1] "Pontos Brasileirão e Rating de games: 0.350658503944108"
sprintf("Titulos e Rating de games: %s",cor(dadosGremio$TitulosNoAno,ratingGame$x))
## [1] "Titulos e Rating de games: 0.122020679950653"
sprintf("Valor do time e Rating de games: %s",cor(dadosGremio$ValorDoTimeEuroMi,ratingGame$x))
## [1] "Valor do time e Rating de games: -0.112440449177218"
Não parece ter afetar o Grêmio, mas vejo o proximo Plot:
<- plot_ly(dadosGremio, x = ~X, y = scale(ratingGame$x, center = T), name = 'Média de Rating por ano', type = 'scatter', mode = 'lines')
fig
<- fig %>% add_trace(y = scale(dadosGremio$ValorDoTimeEuroMi, center = T), name = 'Títulos do Grêmio', mode = 'lines+')
fig
fig
Controle dos Browser de mercado
Será que os navegadores de internet e sua briga afeta o Grêmio?
<- read.csv("data/browser.csv")
dadosBroswer
<- dadosBroswer[2:12,1:6] dadosBroswer
Chrome
Vamos ver com a fatia de mercado do Chrome
sprintf("Pontos CBF e Chrome: %s",cor(dadosGremio$PontosCBF,dadosBroswer$Chrome))
## [1] "Pontos CBF e Chrome: 0.706655279844926"
sprintf("Pontos Brasileirão e Chrome: %s",cor(dadosGremio$PontosBr,dadosBroswer$Chrome))
## [1] "Pontos Brasileirão e Chrome: -0.21058500329272"
sprintf("Titulos e Chrome: %s",cor(dadosGremio$TitulosNoAno,dadosBroswer$Chrome))
## [1] "Titulos e Chrome: 0.81620549983131"
sprintf("Valor do time e Chrome: %s",cor(dadosGremio$ValorDoTimeEuroMi,dadosBroswer$Chrome))
## [1] "Valor do time e Chrome: 0.580769121955433"
Será que os Pontos do Ranking CBF tem relação com a fatia de mercado do Chrome?
<- plot_ly(dadosGremio, x = ~X, y = scale(dadosBroswer$Chrome, center = T), name = 'Fatia de mercado do Chrome', type = 'scatter', mode = 'lines')
fig
<- fig %>% add_trace(y = scale(dadosGremio$PontosCBF, center = T), name = 'Pontos do Grêmio na CBF', mode = 'lines+')
fig
fig
Parece que a fatia de mercado do Chrome afeta o Grêmio
IE
Vamos ver com a fatia de mercado do IE
sprintf("Pontos CBF e Chrome: %s",cor(dadosGremio$PontosCBF,dadosBroswer$IE))
## [1] "Pontos CBF e Chrome: -0.617932902878286"
sprintf("Pontos Brasileirão e Chrome: %s",cor(dadosGremio$PontosBr,dadosBroswer$IE))
## [1] "Pontos Brasileirão e Chrome: 0.170604366602833"
sprintf("Titulos e Chrome: %s",cor(dadosGremio$TitulosNoAno,dadosBroswer$IE))
## [1] "Titulos e Chrome: -0.795211608223453"
sprintf("Valor do time e Chrome: %s",cor(dadosGremio$ValorDoTimeEuroMi,dadosBroswer$IE))
## [1] "Valor do time e Chrome: -0.560817387206141"
Será que os Titulos do ano tem relação com a fatia de mercado do IE?
<- plot_ly(dadosGremio, x = ~X, y = scale(dadosBroswer$Chrome, center = T), name = 'Fatia de mercado do IE', type = 'scatter', mode = 'lines')
fig
<- fig %>% add_trace(y = scale(dadosGremio$TitulosNoAno, center = T), name = 'Títulos do ano', mode = 'lines+')
fig
fig
Parece que a fatia de mercado do IE afeta os Títulos do Grêmio
Firefox
Vamos ver com a fatia de mercado do Firefox
sprintf("Pontos CBF e Chrome: %s",cor(dadosGremio$PontosCBF,dadosBroswer$Firefox))
## [1] "Pontos CBF e Chrome: -0.603516541306584"
sprintf("Pontos Brasileirão e Chrome: %s",cor(dadosGremio$PontosBr,dadosBroswer$Firefox))
## [1] "Pontos Brasileirão e Chrome: 0.146465091000627"
sprintf("Titulos e Chrome: %s",cor(dadosGremio$TitulosNoAno,dadosBroswer$Firefox))
## [1] "Titulos e Chrome: -0.769634735324252"
sprintf("Valor do time e Chrome: %s",cor(dadosGremio$ValorDoTimeEuroMi,dadosBroswer$Firefox))
## [1] "Valor do time e Chrome: -0.642471705094246"
Parece que a fatia de mercado do Firefox não afeta o Grêmio
Safari
Vamos ver com a fatia de mercado do Safari
sprintf("Pontos CBF e Chrome: %s",cor(dadosGremio$PontosCBF,dadosBroswer$Safari))
## [1] "Pontos CBF e Chrome: 0.0909663696886285"
sprintf("Pontos Brasileirão e Chrome: %s",cor(dadosGremio$PontosBr,dadosBroswer$Safari))
## [1] "Pontos Brasileirão e Chrome: -0.0629680940594212"
sprintf("Titulos e Chrome: %s",cor(dadosGremio$TitulosNoAno,dadosBroswer$Safari))
## [1] "Titulos e Chrome: 0.30654575338909"
sprintf("Valor do time e Chrome: %s",cor(dadosGremio$ValorDoTimeEuroMi,dadosBroswer$Safari))
## [1] "Valor do time e Chrome: 0.521063843361463"
Parece que a fatia de mercado do Safari não afeta o Grêmio
Bônus
Algumas correlações são estranhas e eu descobri por acaso, aqui algumas delas:
Filiados do PCB e pontos do Vasco
Ao que parece há uma relação muito grande entre a queda do crescimento (não confundir com numero total) de filiados do PCB e dos pontos do Vasco no Raking CBF
<- "Vasco da Gama"
vasco <- c(14426,12132,11928,10040,9322,9360,9242,8828,8206)
pontos
<- "PCB"
PCB <- c(15140,14852,14830,14830,14682,12921,12784, 12651, 12530)
eleitoresFilhadosPCB
<- data.frame(vasco, pontos)
vascotab <- data.frame(PCB,eleitoresFilhadosPCB)
pcbtab
= c(2014,2015,2016,2017,2018,2019,2020, 2021, 2022)
anos
= scale(vascotab$pontos, center = T)
score_v = scale(pcbtab$eleitoresFilhados, center = T)
score_pc <- data.frame("index" = anos, "pontos" = score_v, "eleitoresFilhados" = score_pc,"eleitoresFilhadosPCB" = score_pc)
df
<- plot_ly(df, type = 'scatter', mode = 'lines')%>%
fig add_trace(x = ~anos, y = ~pontos, name = 'Pontos do vasco',line = list(color = 'blue'))%>%
add_trace(x = ~anos, y = ~eleitoresFilhadosPCB, name = 'Filiados ao PCB',line = list(color = 'red'))
fig
Fatias de Firefox no mercado e pontos do Vasco
Ao que parece há uma relação muito grande também entre os Pontos do Vasco no Ranking da CBF e a fatia de mercado do Firefox
<- "Vasco da Gama"
vasco <- c(14426,12132,11928,10040,9322,9360,9242)
pontos
<- data.frame(vasco, pontos)
vascotab = c(2014,2015,2016,2017,2018,2019,2020)
anos = scale(vascotab$pontos, center = T)
score_v
<- dadosBroswer[3:9,]
dadosBroswerFire
#head(dadosBroswerFire)
<- plot_ly(vascotab, type = 'scatter', mode = 'lines')%>%
fig add_trace(x = ~anos, y = scale(pontos, center = T), name = 'Pontos do vasco',line = list(color = 'blue'))%>%
add_trace(x = ~anos, y = scale(dadosBroswerFire$Firefox, center = T) , name = 'Fatia de Mercado do Firefox',line = list(color = 'red'))
fig
Conclusões
Sim, existem coisas que afetam o Grêmio, porém é necessário garimpar os dados para descobrir os códigos por trás dos números que afetam o Grêmio.