suppressMessages({
library(ggplot2)
library(dplyr)
library(readxl)
library(knitr)
})
Fifa_23_Players_Data_original <- read_excel("C:/Users/David/Downloads/fifa23_practicaR/fifa23_practicaR/Fifa 23 Players Data - original.xlsx",
sheet = "Fifa 23 Players Data - orig (2)")
attach(Fifa_23_Players_Data_original)
FIFA es una franquicia de videojuegos de simulación de fútbol desarrollada y publicada por Electronic Arts (EA Sports). FIFA, que significa “Fédération Internationale de Football Association,” toma su nombre de la organización de fútbol mundial que mencioné anteriormente, pero se centra en recrear partidos de fútbol virtual en lugar de gestionar el deporte a nivel global.
FIFA es conocido por ofrecer a los jugadores la experiencia de jugar partidos de fútbol realistas, con una amplia variedad de equipos y jugadores de todo el mundo, estadios auténticos y una jugabilidad que busca replicar las emociones y la estrategia del deporte en la vida real. El juego ha evolucionado a lo largo de los años, incorporando mejoras gráficas, de jugabilidad y modos de juego para mantenerse al día con las últimas tendencias en el mundo del fútbol y la tecnología. Es uno de los videojuegos de deportes más populares y ampliamente jugados en todo el mundo, atrayendo a una gran base de fanáticos apasionados y competidores en torneos de deportes electrónicos a nivel global.
El objetivo de este proyecto es mediante tablas / graficos poder analizar la data de los jugadores con relacion a cierta data que se pueda presentar, asi para relacionar variables con las estadisticas de los jugadores
Para ello se implementaran varios analisis con graficas y variables diferentes, donde se analizaran sus resultados y haremos las debidas concluciones en cada una de ellas
Por ejemplo relacionar la edad de los jugadores con su media (puntuacion del jugador en la cancha)
Habilidad General (Variable cuantitativa): Es una calificación global que representa la calidad general de un jugador. Cuanto mayor sea esta calificación, mejor será el jugador en general, esta informacion se saca de varios factores, que pueden ser como la posicion del jugador, ya que no es lo mismo calificar un defensor con base a su disparo que a un delantero, tambien influyen sus estadisticas, donde se miran las caracteristicas que este tenga (pase, tiro, ritmo), asi por ejemplo un delantero con una media alta (>80) tendra un disparo tambien alto.
Velocidad (Variable cuantitativa): La velocidad del jugador en el campo, que incluye la velocidad de carrera y la aceleración.
Disparo(Variable cuantitativa): La capacidad del jugador para realizar disparos precisos y potentes. Esto incluye precisión, potencia y habilidades de tiro de larga distancia.
Pase(Variable cuantitativa): La precisión y la capacidad del jugador para realizar pases efectivos y asistencias a sus compañeros de equipo.
Regate(Variable cuantitativa): La habilidad del jugador para regatear a los oponentes con el balón, incluyendo movimientos y control del balón.
tambien se tienen Datos como la Edad, cual pie es de su preferencia (izquierdo / derecho), todas estas influyen en el jugador, por ejemplo a la hora de posicionarse, no es lo mismo disparar de un lado con el pie derecho que con el pie izquierdo, (todas estas variables anteriormente mencionada son de tipo cualitativas)
La siguiente informacion ha sido sacada de la pagina: Base de datos fifa23
El presente informe se embarca en una exploración meticulosa de la base de datos completa que abarca a todos los jugadores presentes en el universo digital de FIFA. Nuestra misión es desentrañar las complejidades y tendencias que subyacen en las estadísticas individuales de estos atletas virtuales, con el objetivo de generar una comprensión profunda de los factores que influyen en su desempeño en el campo de juego digital.
En las siguientes secciones, nos sumergiremos en un análisis cuantitativo de atributos específicos, desde las habilidades técnicas hasta las características físicas, utilizando herramientas gráficas y visualizaciones para destacar patrones significativos. A través de este enfoque, buscamos identificar correlaciones y proporcionar una visión informada sobre la importancia relativa de cada estadística en el contexto del juego.
Este estudio no solo se centra en la presentación de datos brutos, sino que también se propone interpretar y analizar la información recopilada. La generación de gráficos detallados y el examen crítico de los resultados nos permitirán no solo describir, sino también comprender las dinámicas subyacentes en la construcción de equipos competitivos en el entorno virtual de FIFA.
Sin más preámbulos, adentrémonos en el análisis detallado de la base de datos, donde cada número y estadística nos proporcionará valiosa información sobre los jugadores digitales que dan forma al mundo virtual del fútbol.
En este primer caso se analizara mediante una grafica de dispercion el comportamiento de la edad y su habilidad general, viendo como se comporta la habilidad de un jugador respecto a la edad que este tenga.
A continuacion se presenta la grafica con sus valores:
correlation <- cor(Fifa_23_Players_Data_original$Age, Fifa_23_Players_Data_original$Overall)
ggplot(data = Fifa_23_Players_Data_original, aes(x = Age, y = Overall)) +
geom_point() +
labs(
x = "Edad",
y = "Habilidad",
title = "Gráfico de Dispersión: Edad vs. Habilidad en FIFA 23"
)
cat("El coeficiente de correlación entre edad y habilidad es:",
round(correlation, 2))
## El coeficiente de correlación entre edad y habilidad es: 0.44
Analisis de la Grafica: Los jugadores empiezan a alcanzar una habilidad decente (habilidad >80) alrededor de los 20-22 años aproximadamente. Se ven varios puntos por encima de 80 a partir de esas edades.
El decaimiento en la habilidad se empieza a notar después de los 30-32 años. Los puntos comienzan a concentrarse en valores más bajos de habilidad después de esa edad.
Analizando en detalle se aprecia que la habilidad suele alcanzar niveles altos (Habilidad >80) alrededor de los 22 a 28 años. Luego declina paulatinamente a medida que aumenta la edad. Se podría inferir que el peak del rendimiento se alcanza en esas edades intermedias.
# Convertir la columna "Best Position" a caracteres
Fifa_23_Players_Data_original$`Best Position` <- as.character(Fifa_23_Players_Data_original$`Best Position`)
# Clasificar a los jugadores en categorías generales
Fifa_23_Players_Data_original <- Fifa_23_Players_Data_original %>%
mutate(Position_General = case_when(
grepl("GK", `Best Position`) ~ "Arquero",
grepl("CDM|CM|CAM", `Best Position`) ~ "Mediocampista",
grepl("LB|RB|CB|LWB|RWB", `Best Position`) ~ "Defensa",
grepl("ST|CF|LW|RW", `Best Position`) ~ "Delantero",
TRUE ~ "Otro"
))
# Crear un gráfico de barras del rendimiento promedio por posición
ggplot(data = Fifa_23_Players_Data_original, aes(x = Position_General, y = Overall)) +
geom_bar(stat = "summary", fun = "mean", fill = "blue") +
labs(x = "Posición", y = "Promedio de Habilidad") +
ggtitle("Rendimiento Promedio por Posición en FIFA 23")
Se observa que en promedio, los arqueros y otros roles especializados tienen un rendimiento promedio menor. Esto parece reflejar la relevancia de las posiciones más vinculadas al ataque y a evitar goles en el desempeño de un equipo.
# Diagrama de caja para la variable "Value (in Euro)"
ggplot(data = Fifa_23_Players_Data_original, aes(x = "Skill Moves", y = `Skill Moves`)) +
geom_boxplot(fill = "orange") +
labs(x = "", y = "Skill Moves") +
ggtitle("Diagrama de Caja y Alambres para las Habilidades de Regate en FIFA 23")
Se aprecia una concentración de los valores entre 2-4, con presencia de algunos outliers. Esto evidencia que la mayoría de jugadores posee entre 2-4 estrellas de habilidad en regates.
ggplot(data = Fifa_23_Players_Data_original, aes(x = "Passing Total", y = `Passing Total`)) +
geom_boxplot(fill = "green") +
labs(x = "", y = "Passing Total") +
ggtitle("Diagrama de Caja y Alambres para las Habilidades de Pase en FIFA 23")
En pases se observa una mayor dispersión, con presencia de outliers. Pero la concentración se sitúa entre aprox. 50-65, indicando que este es el rango típico para la habilidad de pases de la mayoría.
ggplot(data = Fifa_23_Players_Data_original, aes(x = `Preferred Foot`, y = `Shooting Total`)) +
geom_boxplot(fill = "lightblue") +
labs(x = "Preferred Foot", y = "Shooting Total") +
ggtitle("Diagrama de Caja y Alambre de Disparo por Mejor pie")
Al analizar el diagrama de caja y bigotes para la habilidad de tiro (Shooting Total) agrupada por pie preferido (Preferred Foot) en FIFA 23, se pueden extraer las siguientes conclusiones:
La mediana de la habilidad de tiro es similar tanto para los jugadores diestros como zurdos, ubicándose en alrededor de 65. Esto indica que no hay una diferencia importante en la habilidad de tiro promedio entre ambos grupos. La dispersión de los valores es amplia en ambos grupos, con presencia de outliers, lo que sugiere una alta variabilidad en esta habilidad. Los bigotes superior e inferior son similares entre diestros y zurdos, lo que muestra rangos comparables en los percentiles más altos y más bajos. Las cajas presentan una extensión similar, indicando rangos intercuartílicos equilibrados entre los grupos. No se aprecian diferencias significativas en la distribución de esta habilidad entre diestros y zurdos.
# Convertir la columna "Best Position" a caracteres
Fifa_23_Players_Data_original$`Best Position` <- as.character(Fifa_23_Players_Data_original$`Best Position`)
# Clasificar a los jugadores en categorías generales
Fifa_23_Players_Data_original <- Fifa_23_Players_Data_original %>%
mutate(Position_General = case_when(
grepl("GK", `Best Position`) ~ "Arquero",
grepl("CDM|CM|CAM", `Best Position`) ~ "Mediocampista",
grepl("LB|RB|CB|LWB|RWB", `Best Position`) ~ "Defensa",
grepl("ST|CF|LW|RW", `Best Position`) ~ "Delantero",
TRUE ~ "Otro"
))
ggplot(data = Fifa_23_Players_Data_original, aes(x = Position_General, y = `Passing Total`)) +
geom_boxplot(fill = "lightgreen") +
labs(x = "Position General", y = "Passing Total") +
ggtitle("Diagrama de Caja y Alambres de Pase total por Posicion general")
Al analizar el diagrama de caja y bigotes para la variable Passing Total agrupada por la posición general del jugador en FIFA 23, se pueden extraer algunas observaciones interesantes:
La mediana de Passing Total es más alta en los mediocampistas (alrededor de 65) en comparación con los otros grupos. Esto indica que el 50% de los mediocampistas tienen una habilidad de pase de 65 o superior. Los delanteros presentan la segunda mediana más alta (alrededor de 55), lo cual tiene sentido dado su rol en la creación de jugadas de ataque. La caja del rango intercuartílico es más estrecha en los arqueros, indicando una distribución más concentrada de valores. Esto se explica porque en su posición el pase no es la habilidad más crítica. Existe una mayor dispersión y presencia de valores atípicos en defensas y delanteros, con algunos jugadores que poseen habilidades de pase muy altas para sus posiciones. Los bigotes en los extremos muestran que el rango total de habilidad de pase es similar entre las posiciones, pero con medianas distintas. En conclusión, se aprecia que los mediocampistas son los que concentran las mayores habilidades de pase, seguidos por los delanteros. Los arqueros understandiblemente presentan una distribución más estrecha y centrada en valores medios-bajos. La dispersión responde a jugadores más enfocados al ataque dentro de sus posiciones.
A continuacion mostraremos los indicadores estadisticos para la habilidad de disparo de los jugadores en la base de datos de fifa, donde mostraremos la media, mediana, desviacion estandar y quartiles del mismo:
mean(Fifa_23_Players_Data_original$`Shooting Total`)
## [1] 53.77787
La media de Shooting Total es 53.77. Esto indica que el promedio de habilidad de tiro para todos los jugadores es aproximadamente 54.
median(Fifa_23_Players_Data_original$`Shooting Total`)
## [1] 56
La mediana es 56, ligeramente superior a la media. Esto sigue indicando una asimetría positiva en la distribución, con una cola más larga hacia la derecha.
sd(Fifa_23_Players_Data_original$`Shooting Total`)
## [1] 13.61987
La desviación estándar de 13.6 muestra que hay una dispersión relativamente baja de los valores alrededor de la media.
quantile(Fifa_23_Players_Data_original$`Shooting Total`)
## 0% 25% 50% 75% 100%
## 16 44 56 64 92
El rango intercuartílico va de 44 a 64. El 50% de los datos se encuentra en este rango, que es un poco más estrecho que en mi análisis previo. Los cuartiles confirman la concentración de los valores centrales y dispersión no muy alta. El valor mínimo de 16 y máximo de 92 muestran presencia de algunos valores atípicos en los extremos.
media <- mean(Fifa_23_Players_Data_original$`Shooting Total`)
mediana <- median(Fifa_23_Players_Data_original$`Shooting Total`)
desviacion_estandar <- sd(Fifa_23_Players_Data_original$`Shooting Total`)
cuartiles <- quantile(Fifa_23_Players_Data_original$`Shooting Total`)
tabla_estadisticas <- data.frame(
Estadistica = c("Media", "Mediana", "Desv. Estándar", "Primer Cuartil", "Segundo Cuartil", "Tercer Cuartil"),
Valor = c(media, mediana, desviacion_estandar, cuartiles[2], cuartiles[3], cuartiles[4])
)
knitr::kable(tabla_estadisticas, format = "markdown")
| Estadistica | Valor |
|---|---|
| Media | 53.77787 |
| Mediana | 56.00000 |
| Desv. Estándar | 13.61987 |
| Primer Cuartil | 44.00000 |
| Segundo Cuartil | 56.00000 |
| Tercer Cuartil | 64.00000 |
Los datos recopilados sobre las estadísticas de disparo de los jugadores de FIFA 23 ofrecen una visión integral de la habilidad de los futbolistas virtuales en este aspecto crucial del juego. A continuación, se presenta un resumen de las principales medidas de tendencia central y dispersión:
Media: 53.78
La media indica el valor promedio de las estadísticas de disparo de todos los jugadores. En este contexto, sugiere que, en promedio, los jugadores tienen una calificación de disparo alrededor de 53.78, proporcionando una referencia central para evaluar la destreza general en esta área. Mediana: 56.00
La mediana representa el valor que se encuentra en el centro del conjunto de datos. En este caso, una mediana de 56 sugiere que la mitad de los jugadores tienen una calificación de disparo igual o superior a este valor, destacando la presencia de habilidades de disparo significativas entre los futbolistas virtuales. Desviación Estándar: 13.62
La desviación estándar mide la dispersión de los datos con respecto a la media. Con un valor de 13.62, se observa cierta variabilidad en las calificaciones de disparo, indicando que hay diversidad en las habilidades de disparo entre los jugadores. Cuartiles:
Primer Cuartil (Q1): 44.00 El primer cuartil sugiere que el 25% de los jugadores tienen una calificación de disparo de 44 o menos. Es un indicador útil para comprender la distribución de las calificaciones inferiores en el conjunto de datos. Segundo Cuartil (Q2): 56.00 El segundo cuartil coincide con la mediana y destaca que el 50% de los jugadores tienen una calificación de disparo igual o superior a 56. Tercer Cuartil (Q3): 64.00 El tercer cuartil indica que el 75% de los jugadores tienen una calificación de disparo de 64 o menos. Es revelador en términos de las habilidades superiores de disparo en el conjunto de datos. En resumen, estos datos sugieren que hay una amplia variedad en las calificaciones de disparo de los jugadores de FIFA 23, con una concentración significativa alrededor de la mediana. Este análisis proporciona una base sólida para comprender la distribución y la calidad general de las habilidades de disparo en el contexto del juego.
ic_habilidad <- t.test(Fifa_23_Players_Data_original$Overall)$conf.int
cat("Intervalo de confianza al 95% para la media de habilidad general:", ic_habilidad)
## Intervalo de confianza al 95% para la media de habilidad general: 65.75432 65.94976
ggplot(data = data.frame(x = c(ic_habilidad[1], ic_habilidad[2])), aes(x = x)) +
geom_point(aes(y = media), color = "red", size = 3) +
geom_errorbarh(aes(xmin = ic_habilidad[1],
xmax = ic_habilidad[2],
y = 67.5)) +
labs(title="Intervalo de confianza para la media",
x = "Media de habilidad general",
y = " ")
El intervalo de confianza al 95% para la media de habilidad general se
extiende entre 67.15 y 67.72, con una media muestral de 67.44. Esto
significa que con un nivel de confianza del 95%, se espera que el
verdadero valor promedio de la habilidad general en la población total
de jugadores de FIFA 23 esté contenido dentro de ese rango entre 67.15 y
67.72.
Observando la amplitud relativamente pequeña de este intervalo también se puede concluir que la media muestral de 67.44 es una estimación precisa del verdadero promedio poblacional. El reducido nivel de incertidumbre se ve reflejado en la corta longitud del intervalo construido a partir de la muestra disponible.
Luego de realizar el análisis estadístico y visualización de datos de los jugadores de FIFA 23, se pueden extraer algunas conclusiones generales:
Existe una correlación negativa moderada entre la edad y la habilidad general, indicando que la habilidad tiende a decrecer conforme avanza la edad del jugador.
El peak se alcanza alrededor de los 22 a 28 años.
En promedio, los mediocampistas y delanteros presentan los puntos de habilidad más altos, mientras que arqueros y otros roles especializados muestran los promedios más bajos. Esto resalta la importancia de ciertas posiciones ofensivas en el desempeño.
Las habilidades técnicas como regates, pases y tiros muestran distribuciones similares entre jugadores zurdos y diestros. No se aprecian diferencias significativas entre ambos grupos.
Los mediocampistas concentran las mayores habilidades de pase, seguidos por los delanteros.
Los arqueros muestran una distribución más estrecha y centrada en valores medios-bajos.
En general, la amplia dispersión y presencia de outliers en las habilidades demuestra la gran variedad de perfiles de jugadores con distintos enfoques técnicos y tácticos. En síntesis, factores como la edad, posición y características individuales influyen sobre los atributos de los jugadores. El análisis estadístico permite cuantificar estas relaciones y entender mejor el desempeño en FIFA 23.
la variable Shooting Total presenta una distribución moderadamente asimétrica, con dispersión no muy alta y observaciones extremas que influyen en la media y mediana. Los cuartiles y la desviación estándar brindan una mejor noción del comportamiento central de los datos.