Librerías y csv
library(ggplot2) # Visualizar gráficas
library(readr) # Leer datos
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(fmsb)
datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/Analisis-Inteligente-de-datos/main/datos/datos.FIFA.limpios.csv", stringsAsFactors = TRUE )
datos <- datos[order(datos$X, decreasing = FALSE),]
head(datos,10)
## X Name Age Nationality Overall Potential Club
## 1 1 L. Messi 31 Argentina 94 94 FC Barcelona
## 2 2 Cristiano Ronaldo 33 Portugal 94 94 Juventus
## 3 3 Neymar Jr 26 Brazil 92 93 Paris Saint-Germain
## 4 4 De Gea 27 Spain 91 93 Manchester United
## 5 5 K. De Bruyne 27 Belgium 91 92 Manchester City
## 6 6 E. Hazard 27 Belgium 91 91 Chelsea
## 7 7 L. Modric 32 Croatia 91 91 Real Madrid
## 8 8 L. Su\xe1rez 31 Uruguay 91 91 FC Barcelona
## 9 9 Sergio Ramos 32 Spain 91 91 Real Madrid
## 10 10 J. Oblak 25 Slovenia 90 93 Atl\xe9tico Madrid
## Preferred.Foot International.Reputation Weak.Foot Skill.Moves Height Weight
## 1 Left 5 4 4 5'7 159lbs
## 2 Right 5 4 5 6'2 183lbs
## 3 Right 5 5 5 5'9 150lbs
## 4 Right 4 3 1 6'4 168lbs
## 5 Right 4 5 4 5'11 154lbs
## 6 Right 4 4 4 5'8 163lbs
## 7 Right 4 4 4 5'8 146lbs
## 8 Right 5 4 3 6'0 190lbs
## 9 Right 4 3 3 6'0 181lbs
## 10 Right 3 3 1 6'2 192lbs
## Crossing Finishing HeadingAccuracy ShortPassing Volleys Dribbling Curve
## 1 84 95 70 90 86 97 93
## 2 84 94 89 81 87 88 81
## 3 79 87 62 84 84 96 88
## 4 17 13 21 50 13 18 21
## 5 93 82 55 92 82 86 85
## 6 81 84 61 89 80 95 83
## 7 86 72 55 93 76 90 85
## 8 77 93 77 82 88 87 86
## 9 66 60 91 78 66 63 74
## 10 13 11 15 29 13 12 13
## FKAccuracy LongPassing BallControl Acceleration SprintSpeed Agility
## 1 94 87 96 91 86 91
## 2 76 77 94 89 91 87
## 3 87 78 95 94 90 96
## 4 19 51 42 57 58 60
## 5 83 91 91 78 76 79
## 6 79 83 94 94 88 95
## 7 78 88 93 80 72 93
## 8 84 64 90 86 75 82
## 9 72 77 84 76 75 78
## 10 14 26 16 43 60 67
## Reactions Balance ShotPower Jumping Stamina Strength LongShots Aggression
## 1 95 95 85 68 72 59 94 48
## 2 96 70 95 95 88 79 93 63
## 3 94 84 80 61 81 49 82 56
## 4 90 43 31 67 43 64 12 38
## 5 91 77 91 63 90 75 91 76
## 6 90 94 82 56 83 66 80 54
## 7 90 94 79 68 89 58 82 62
## 8 92 83 86 69 90 83 85 87
## 9 85 66 79 93 84 83 59 88
## 10 86 49 22 76 41 78 12 34
## Interceptions Positioning Vision Penalties Composure Marking StandingTackle
## 1 22 94 94 75 96 33 28
## 2 29 95 82 85 95 28 31
## 3 36 89 87 81 94 27 24
## 4 30 12 68 40 68 15 21
## 5 61 87 94 79 88 68 58
## 6 41 87 89 86 91 34 27
## 7 83 79 92 82 84 60 76
## 8 41 92 84 85 85 62 45
## 9 90 60 63 75 82 87 92
## 10 19 11 70 11 70 27 12
## SlidingTackle GKDiving GKHandling GKKicking GKPositioning GKReflexes
## 1 26 6 11 15 14 8
## 2 23 7 11 15 14 11
## 3 33 9 9 15 15 11
## 4 13 90 85 87 88 94
## 5 51 15 13 5 10 13
## 6 22 11 12 6 8 8
## 7 73 13 9 7 14 9
## 8 38 27 25 31 33 37
## 9 91 11 8 9 7 11
## 10 18 86 92 78 88 89
## Valor Estatura PesoKgs
## 1 110500000 1.70 72.12
## 2 77000000 1.88 83.01
## 3 118500000 1.75 68.04
## 4 72000000 1.93 76.20
## 5 102000000 1.80 69.85
## 6 93000000 1.73 73.94
## 7 67000000 1.73 66.22
## 8 80000000 1.83 86.18
## 9 51000000 1.83 82.10
## 10 68000000 1.88 87.09
1. ¿Qué jugadores ganan más dinero, el top 5?
valor <- datos[order(datos$Valor, decreasing = TRUE),] %>% select(c("Name","Valor", "Club"))
head(valor,5)
## Name Valor Club
## 3 Neymar Jr 118500000 Paris Saint-Germain
## 1 L. Messi 110500000 FC Barcelona
## 5 K. De Bruyne 102000000 Manchester City
## 6 E. Hazard 93000000 Chelsea
## 16 P. Dybala 89000000 Juventus
De los jugadores mejor valorados, puedo observar que todos son
jugadores que en el momento jugaban en las 5 mejores ligas del mundo,
teniendo la presencia de la Ligue 1 (Francia), La Liga (España), Premier
League (Inglaterra) y Serie A (Italia).
Todos los jugadores superaban el tope de los 80 millones de
valor.
2. ¿Cuántos jugadores de fútbol son izquierdos?
lefties <- datos %>% select(c("Preferred.Foot")) %>% group_by(Preferred.Foot) %>% summarise(Frecuencia = n())
lefties
## # A tibble: 3 × 2
## Preferred.Foot Frecuencia
## <fct> <int>
## 1 "" 48
## 2 "Left" 4159
## 3 "Right" 13748
El total de personas que tienen de pie preferido el derecho, es casi
4 veces más que las que su pie preferido es el izquierdo. Este dato me
sorprendió ya que, si no recuerdo mal, del ranking general, de los 10
primeros futbolistas, sólo 1 es zurdo, lo cual si alguien basase su
razionamiento en los primeros 10 resultados, quedaría muy sorprendido al
saber que son muchos más los futbolistas zurdos.
3. ¿Cuál es el valor medio (promedio) de estatura en cms. o metros
de jugadores de fútbol?
media <- data.frame(matrix(ncol=1,nrow=0, dimnames=list(NULL, c("Estatura"))))
size <- nrow(datos)
for (i in 1:size){
estatura <- c(datos$Estatura[i])
if (!is.na(estatura)){
estatura <- as.double(estatura)
media <- rbind(media, estatura)
} else {
break
}
}
media %>% summarise_if(is.numeric, mean)
## X1.7
## 1 1.813614
La media de estatura entre todos los jugadores es de 1.81
centímetros, la cual es una buena estatura para el deporte.
4. ¿Cómo se llaman los jugadores más bajitos en estatura?
shorties <- datos[order(datos$Estatura, decreasing = FALSE),] %>% select(c("Name","Estatura"))
head(shorties,5)
## Name Estatura
## 6173 N. Barrios 1.55
## 6475 H. Nakagawa 1.55
## 16915 K. Yamaguchi 1.55
## 1330 M. Moralez 1.57
## 2463 J. Plata 1.57
Como se puede observar, hay 3 jugadores que comparten la menor
estatura, siendo esta 1.55 metros. Si lo ponemos en comparación, estos 3
jugadores están 26 centímetros de estatura por debajo de la media.
5. De qué nacionalidad o país hay más jugadores registrados?
country <- datos %>% count(Nationality, sort = TRUE)
head(country,5)
## Nationality n
## 1 England 1660
## 2 Germany 1198
## 3 Spain 1072
## 4 Argentina 936
## 5 France 913
Como me lo esperaba, Inglaterra es el país que más jugadores
registrados tenía en el FIFA de 2020, ya que según recuerdo de cuando lo
jugué, el FIFA tenía las ligas de las 4 primeras divisiones de
Inglaterra. Casi 550 jugadores por debajo, se encuentra en el segundo
lugar Alemania, la cual es un país con una gran cantidad de jugadores en
activo en su propia liga y en muchas más ligas a través del mundo. Esto
también me lo esperaba del top 5 restante España, Argentina y Francia.
Como dato podría asegurar que, Francia en 2022 subió como mínimo 1
lugar, ya que últimamente han salido muchos grandes jugadores franceses
que, tal vez, sumarían a la estadística pudiendo superar a Argentina o
incluso a España, en cuando a jugadores en activo se refiere.