Para este ejercicio escogì una base de datos que me muestra los
clubes que tienen mayor valor en el mercado, muestra mostrando
informaciòn como el valor total de la plantilla, numero de jugadores, la
liga a la que pertenece cada club, entre otras cosas.
dim(Value_Club) # Para saber cuantos datas filas y columnas hay
## [1] 100 8
head(Value_Club,10)
## # A tibble: 10 × 8
## Club Competition Age Squad_size Market_value Market_value_of_play…¹
## <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Manchester … Premier Le… 27.2 23 1050 45.8
## 2 Paris Saint… Ligue 1 26.1 35 998. 28.5
## 3 Manchester … Premier Le… 28 28 937. 33.5
## 4 Chelsea FC Premier Le… 26.8 27 882. 32.7
## 5 Liverpool FC Premier Le… 27 27 880. 32.6
## 6 Bayern Muni… Bundesliga 25.9 26 853. 32.8
## 7 Real Madrid LaLiga 27.2 27 794. 29.4
## 8 Atlético d… LaLiga 28.1 22 755. 34.3
## 9 Tottenham H… Premier Le… 25.5 24 697 29.0
## 10 FC Barcelona LaLiga 25.3 29 677 23.3
## # ℹ abbreviated name: ¹Market_value_of_players
## # ℹ 2 more variables: MV_Top_18_players <dbl>, Share_of_MV <dbl>
Value_Club %>%select(Competition, Market_value)%>%count(Competition) %>% arrange(desc(n)) #me muestra cuantos clubes hay por liga y me los muestra de mayor a menor
## # A tibble: 16 × 2
## Competition n
## <chr> <int>
## 1 Premier League 20
## 2 Serie A 16
## 3 Bundesliga 14
## 4 LaLiga 14
## 5 Ligue 1 7
## 6 Premier Liga 6
## 7 Liga Bwin 4
## 8 Super Lig 4
## 9 Championship 3
## 10 Eredivisie 3
## 11 Série A 3
## 12 Jupiler Pro League 2
## 13 1,HNL 1
## 14 Liga Profesional 1
## 15 Premiership 1
## 16 Super League 1 1
Value_Ligue<-Value_Club%>%group_by (Competition)
Value_Ligue%>% summarise(Total_Value = sum(Market_value))%>% arrange(desc(Total_Value)) #Realiza una sumatoria del valor total de las ligas sumando los valores de todos los clubes que se encuentran en el dataframe.
## # A tibble: 16 × 2
## Competition Total_Value
## <chr> <dbl>
## 1 Premier League 8988.
## 2 Serie A 4730.
## 3 LaLiga 4604.
## 4 Bundesliga 4086.
## 5 Ligue 1 2635.
## 6 Liga Bwin 868.
## 7 Premier Liga 826.
## 8 Eredivisie 603.
## 9 Super Lig 440.
## 10 Série A 389.
## 11 Championship 385.
## 12 Jupiler Pro League 277.
## 13 Super League 1 118.
## 14 1,HNL 109.
## 15 Premiership 105
## 16 Liga Profesional 104.
Value_Ligue %>% summarise(Total_Value = mean(Market_value))%>% arrange(desc(Total_Value)) # Me saca el valor promedio por cada liga de acuerdo con los equipos que se encuentran en los 100 primeros con mas valor.
## # A tibble: 16 × 2
## Competition Total_Value
## <chr> <dbl>
## 1 Premier League 449.
## 2 Ligue 1 376.
## 3 LaLiga 329.
## 4 Serie A 296.
## 5 Bundesliga 292.
## 6 Liga Bwin 217.
## 7 Eredivisie 201.
## 8 Jupiler Pro League 139.
## 9 Premier Liga 138.
## 10 Série A 130.
## 11 Championship 128.
## 12 Super League 1 118.
## 13 Super Lig 110.
## 14 1,HNL 109.
## 15 Premiership 105
## 16 Liga Profesional 104.
#Voy a ver qué participación tiene cada liga en la dentro de los cien clubes con mayor valor en sus plantillas
Teams_count <- Value_Club%>%count(Competition)
Teams_count <- Teams_count%>%mutate(percentage = Teams_count$n / sum(Teams_count$n)*100)%>% arrange(desc(percentage))
Teams_count
## # A tibble: 16 × 3
## Competition n percentage
## <chr> <int> <dbl>
## 1 Premier League 20 20
## 2 Serie A 16 16
## 3 Bundesliga 14 14
## 4 LaLiga 14 14
## 5 Ligue 1 7 7
## 6 Premier Liga 6 6
## 7 Liga Bwin 4 4
## 8 Super Lig 4 4
## 9 Championship 3 3
## 10 Eredivisie 3 3
## 11 Série A 3 3
## 12 Jupiler Pro League 2 2
## 13 1,HNL 1 1
## 14 Liga Profesional 1 1
## 15 Premiership 1 1
## 16 Super League 1 1 1
#%>%mutate(percentage = n / sum(n)*100)%>% arrange(desc(percentage))
#Value_Club %>%count(Competition)%>%mutate(percentage = n / sum(n)*100)%>% arrange(desc(percentage))
#Quiero que me muestre qué porcentaje de los cien clubes con mayor valor en sus plantillas pertenecen a las 5 mejores ligas
Value_Club %>% mutate(Top5_Best_league = grepl('Ligue 1', Competition) | grepl('LaLiga', Competition) | grepl('Serie A', Competition) | grepl('Premier League', Competition) | grepl('Bundesliga', Competition))%>% count(Top5_Best_league) %>% mutate(percentage = n / sum(n) * 100)%>%arrange(desc(percentage))
## # A tibble: 2 × 3
## Top5_Best_league n percentage
## <lgl> <int> <dbl>
## 1 TRUE 71 71
## 2 FALSE 29 29