rm(list=ls())
library(data.table)
library(ggplot2)
library(leaflet)
library(data.table)
library(ggplot2)
library(gganimate)
library(ggcorrplot)
library(readr)
library(plotly)
library(readstata13)
library(dplyr)
library(rpart)
library(rpart.plot)
library(RColorBrewer)
library(rattle)
library(caret)
library(factoextra)
library(dbscan)
library(tidyverse)
Actualmente, se habla mucho sobre los excesivos precios que se manejan en el mundo del fútbol, ya sean los sueldos de los jugadores, los montos de los traspasos, la inversión en infraestructura o las mismas entradas a los estadios. Algunos dicen que el dinero está arruinando al fútbol, quitándole competitividad a los campeonatos, ya que los equipos con más dinero pueden reforzarse más que los otros y con estas cantidades de dinero, se están creando brechas que afectan negativamente el espectáculo y la especulación en los partidos.
Equipos históricos han quebrado y algunos otros relativamente nuevos, se han hecho grandes en base a la inversión de multimillonarios a quienes no necesariamente les apasiona el fútbol. Empresas no relacionadas a este deporte han invertido convirtiéndolo en un negocio, provocando que el capitalismo se adueñe del espectáculo. Todo lo anterior, entendiendo que un equipo se clasifica como histórico cuando posee una trayectoria en logros importante. Mientras que un equipo clasificado como nuevo cuando han alcanzado logros futbolísticos importantes, posterior a una inyección monetario o gasto desmesurado en traspasos de jugadores.
El año 2000, el jugador Luis Figo fue comprado por 60 millones de euros,y ese mismo año se le entregó el balón de oro, el premio individual más importante en el fútbol, lo que lo consolidó como el mejor jugador del mundo. Además, logró ganar la UEFA Champions League con el Real Madrid cf. Diecisiete años más tarde, el jugador de fútbol Neymar Jr, proveniente del FC Barcelona, se traspasó al Paris Saint Germain por una cifra de 220 millones de euros, sin siquiera haber sido elegido como el mejor jugador del año, demostrando una inflación exponencial en el tiempo en los precios de los jugadores.
Por eso queremos entender qué tanto influyen estas cantidades invertidas por los equipos para la obtención del título más importante a nivel de clubes, la UEFA Champions League.
2. Elección de la pregunta: Debe ser una pregunta relevante en el contexto del curso, es decir, para el estudio de la ciencia económica o un ambiente de negocios. Como ejemplo, pensar en la predicción del precio de un commodity, de una divisa, del éxito de un negocio o de la localización espacial de una nueva tienda, pueden ser buenas aproximaciones iniciales.
¿Influyen las grandes inversiones monetarias realizadas por cada club de fútbol en mercados de transferencias para garantizar su éxito en la competencia más prestigiosa a nivel de clubes, la UEFA Champions League?
3. Elección de la fuente de datos: Deben elegir una base de datos que sea relevante en su tema de investigación y que les permita responder la pregunta. Será altamente valorado el uso de más de una fuente de datos.
path <- 'C:/Users/Rorro Bielenberg/Desktop/UAI/Data Science/Proyecto Final/Bases/'
ranking_club<- read.csv('C:/Users/Rorro Bielenberg/Desktop/UAI/Data Science/Proyecto Final/Bases/AllTimeRankingByClub.csv', fileEncoding = "UTF-16", sep = ",", header = T) #1992/93 - Actualidad.
ranking_pais<- fread(paste0(path,'AllTimeRankingByCountry.csv'))
coaches_details <- fread(paste0(path,'CoachesAppearDetails.csv'))
coaches_totals <- fread(paste0(path,'CoachesAppearTotals.csv'))
goalstats<- fread(paste0(path,'GoalStatsPerGroupRound.csv'))
player_details<- fread(paste0(path,'PlayerAppearDetails.csv'))
player_totals<- fread(paste0(path,'PlayerAppearTotals.csv'))
playergoal_details<- fread(paste0(path,'PlayerGoalDetails.csv'))
playergoal_totals<- fread(paste0(path,'PlayerGoalTotals.csv'))
top<- fread(paste0(path,'top250-00-19.csv'))
top_goal<- fread(paste0(path,'TopGoalScorer.csv'))
#Papers a considerar: - https://www.researchgate.net/profile/Christoph-Breuer/publication/297650226_The_Financial_Impact_of_Foreign_Private_Investors_on_Team_Investments_and_Profits_in_Professional_Football_Empirical_Evidence_from_the_Premier_League/links/57079a6e08ae8883a1f7e32c/The-Financial-Impact-of-Foreign-Private-Investors-on-Team-Investments-and-Profits-in-Professional-Football-Empirical-Evidence-from-the-Premier-League.pdf - https://www.researchgate.net/profile/Stephen-Dobson-8/publication/227388381_The_Economics_of_Football/links/02e7e53c8d9bf708b7000000/The-Economics-of-Football.pdf
4.Estadística descriptiva de las variables de interés: Se le pide realizar y comentar al menos 4 figuras (ya sean gráficos o mapas) que den cuenta del panorama al que se enfrenta su pregunta de investigación.
class(ranking_club)
## [1] "data.frame"
ranking_club <- data.table(ranking_club)
ranking_club2=ranking_club[Position <= 10]
ggplot(ranking_club2,aes(x=Titles, fill=Club)) + geom_bar()
Comente: El anterior grafico nos muestra los equipos con mejor rendimiento en cantidad de puntos obtenidos en la Champions League y sus títulos obtenidos de esta misma. En este mismo, podemos observar al Real Madrid CF, quien tiene el mejor rendimiento y que se encuentra reflejado en la cantidad de títulos obtenidos. No obstante, se encuentra el Arsenal, quien ha tenido destacadas participaciones en relación a puntos obtenidos, pero que no han logrado reflejarlo en títulos, destacando que se encuentra dentro de los mejores en rendimiento, dejando afuera a clubes que, si han obtenido el título, como el Ajax, Dortmund y Inter.
class(top)
## [1] "data.table" "data.frame"
ranking_club <- data.table(ranking_club)
Traspasos=top[Team_to == "Real Madrid"|Team_to == "Man Utd"|Team_to == "Liverpool"|Team_to == "FC Porto"|Team_to == "Bayern Munich "|Team_to == "FC Barcelona"|Team_to == "Chelsea"|Team_to == "Arsenal"|Team_to == "AC Milan"|Team_to == "Juventus"|Team_to == "Paris SG"|Team_to == "Man City" ]
Traspasos <- Traspasos[,sum(Transfer_fee), by=Team_to]
ggplot(data=Traspasos, aes(x=Team_to, y=V1)) + geom_bar(stat = "identity") + theme(axis.text.x = element_text(angle=85, vjust=0.6)) + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)}) + labs(x="Clubs",y="Euros",title = "Gasto en transferencias (2000-2018)")
Comente: En este gráfico, se puede apreciar el gasto total incurrido en traspasos de jugadores desde el año 2000 al 2018. Dentro de este se destaca la aparición de equipos como el Paris SG y Manchester City, quienes nunca han obtenido la Champions League, pero que se encuentran dentro de los equipos que más han gastado en traspasos de jugadores. Por otra parte, tenemos al Real Madrid, el equipo más campeón de esta competición, quien es el tercer equipo que más ha gastado, con un monto total de $1.680.650.000 euros, por lo que, en este caso, si se cumple la relación entre títulos y capital gastado. Por último, observando los dos fenómenos anteriores (Caso del Manchester City, Paris SG y Real Madrid), podemos concluir que existen polos apuestos.
Partidos=ranking_club[Club == "Real Madrid CF"|Club == "Manchester United FC"|Club == "Liverpool FC"|Club == "FC Porto"|Club == "FC Bayern München"|Club == "FC Barcelona"|Club == "Chelsea FC"|Club == "Arsenal FC"|Club == "AC Milan"|Club == "Juventus"|Club == "Paris Saint-Germain"|Club == "Manchester City FC" ]
ggplot(data=Partidos, aes(x=Club, y=Played, fill=Win)) + geom_bar(stat = "identity") + theme(axis.text.x = element_text(angle=85, vjust=0.6)) + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)}) + labs(x="Clubs",y="Partidos",title = "Proporción Victoria por Partidos Jugados")
ggplot(data=Partidos, aes(x=Club, y=Win)) + geom_bar(stat = "identity") + theme(axis.text.x = element_text(angle=85, vjust=0.6))
ggplot(data=Partidos, aes(x=Club, y=Played)) + geom_bar(stat = "identity") + theme(axis.text.x = element_text(angle=85, vjust=0.6))
Comente: Aquí podemos observar tres gráficos. El primero (de la derecha a la izquierda), nos muestra a los equipos top de esta competición en base a su rendimiento, donde se puede observar la cantidad de partidos jugados en la competición, destacando la participación del Real Madrid, FC Barcelona y FC Bayern München, equipos que han campeonado. En el segundo gráfico, se observa la cantidad de triunfos por partidos jugados de cada equipo, donde vuelven a destacar los mismos equipos que en el grafico anterior. Por último, en el tercer gráfico, podemos observar la relación entre victorias por partidos jugados por cada equipo de futbol. Como se observó en los anteriores FC Barcelona, FC Bayern München y Real Madrid, poseen un gran porcentaje de victorias en relación con sus partidos jugados, equipos que han logrado el título. Por otra parte, tenemos que notar que el grafico presenta una relación atípica, porque demuestra que equipos como Manchester City es el peor de todos, pero se debe a su baja cantidad de partidos jugados, ya que, en relación a victorias, Manchester City, presenta un rendimiento de victorias del 54,44% de sus partidos (90 partidos jugados, 49 victorias). Demostrando que los grandes equipos son más propensos a ganar una mayor cantidad de partidos, lo que hace que avancen a instancias finales, llegando a jugar partidos decisivos entre ellos para obtener la corona del campeón.
5. Estrategía de resolución: Utilizar alguna estrategia enseñada en el curso para responder su pregunta, como por ejemplo:
names(Traspasos)[names(Traspasos)=="Team_to"]<- "Club"
names(ranking_club2)[names(ranking_club2)=="Club"]<- "Club"
Traspasos[Club == "Man City", Club := "Manchester City FC"]
Traspasos[Club == "Liverpool", Club := "Liverpool FC"]
Traspasos[Club == "Man Utd", Club := "Manchester United FC"]
Traspasos[Club == "Arsenal", Club := "Arsenal FC"]
Traspasos[Club == "Chelsea", Club := "Chelsea FC"]
Traspasos[Club == "Bayern Munich ", Club := "FC Bayern München"]
Traspasos[Club == "Real Madrid", Club := "Real Madrid CF"]
Traspasos[Club == "Paris SG", Club := "Paris Saint-Germain"]
ranking_club2=ranking_club[Club == "Real Madrid CF"|Club == "Manchester United FC"|Club == "Liverpool FC"|Club == "FC Porto"|Club == "FC Bayern München"|Club == "FC Barcelona"|Club == "Chelsea FC"|Club == "Arsenal FC"|Club == "AC Milan"|Club == "Juventus"|Club == "Paris Saint-Germain"|Club == "Manchester City FC" ]
Basearbol<- merge(x=Traspasos[,.(V1,Club)],y=ranking_club2[,.(Win,Titles, Goal.Diff,Club)],by.x="Club", by.y="Club",all=T)
Basearbol[Titles >= 1, Titulo := "Campeon"]
Basearbol[Titles == 0, Titulo := "No campeon"]
ggplot(Basearbol,aes(x=V1, y=Win)) + geom_point() + geom_smooth()
ggplot(Basearbol,aes(x=V1, y=Goal.Diff)) + geom_point() + geom_smooth()
6. Conclusión
En conclusión, pudimos notar que existe una relación directa entre la inversión de dinero en fichajes, con el rendimiento del equipo, ya que vimos como los equipos que gastan más tienden a llegar a instancias finales. Sin embargo, en el futbol siguen existiendo muchos más factores que provocan excepciones, en términos de equipos que no invierten y logran un rendimiento igual o mejor que los equipos más millonarios. Aun así, estos equipos más chicos no perduran en el nivel más alto, por lo que es necesario seguir invirtiendo, y a pesar de no ser un factor decisivo, la inversión en fichajes es uno de los factores más influyentes, si es que no el mas, en términos de lograr victorias. Por otra parte, existen casos de equipos de futbol, que desembolsan una excesiva cantidad de dinero en traspasos, sin conseguir el campeonato a través del tiempo. Por último, podemos señalar que, debido a los diferentes escenarios existentes, la incertidumbre de los resultados de futbol se mantienen intactos, ya que, al ser un deporte practicado por personas, no existe una probabilidad exacta de resultados.