Utilice la variable value del conjunto de datos, filtrando únicamente a los jugadores de dichos clubes.
Construya un diagrama de caja por cada club, de manera que se puedan observar la mediana, la dispersión y los valores atípicos.
A partir de la gráfica, describa las diferencias o similitudes que encuentre entre los salarios de los jugadores en los cuatro clubes seleccionados.
Para resolver el inciso a). Luego de instalar los paquetes necesarios para el desarrollo de los boxplot, se filtran los cuatro clubes de los que se quiere extraer la información, en este caso, del Real Madrid, París Saint-German, Chelsea y el FC Barcelona.
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Transformamos la base .csv a un archivo excel (.xlsx). Así, al importar como dataset el excel creado será más fácil trabajar con los paquetes en base a las columnas y categorías de las que se tiene registro. También, al tener signos de dinero ($) los números de la variable “value” hay que convertirlos a números concretos para que las variables puedan trabajar bien con cada valor.
Pasado esto, se filtran los clubes en los que se quiere trabajar, en este caso Real Madrid, Paris SG, Chelsea y el FC Barcelona con ayuda de la función “filter”.
Posterior al filtrado de datos, hacemos las gráficas de caja y bigotes con ayuda del paquete “ggplot”. A continuación, mostraré una tabla donde aparezcan los cuatro equipos filtrados anteriormente, con ello se realizará un análisis general y luego se hará un diagrama por cada gráfica y así se logrará digerir mejor los datos. Se crea una gráfica de caja y bigotes donde aparezcan los cuatro equipos:
Ahora vamos a analizarlas por separado:
Según la gráfica, el conjunto de datos del equipo Real Madrid se puede extraer que:
## La mediana de la variable value en el equipo Real Madrid es: 30000000
## La media de la variable value en el equipo Real Madrid es: 29486429
## La desviación estándar de la variable value en el equipo Real Madrid es: 31264597
## Los valores mínimo y máximo de la variable value en el equipo Real Madrid respectivamente son: 32500 77500000
## Los cuartiles en los que se divide value en el club Real Madrid son: 32500 2186250 30000000 47250000 77500000
Según la gráfica, el conjunto de datos del equipo París SG se puede extraer que:
## La mediana de la variable value en el equipo París SG es: 20000000
## La media de la variable value en el equipo París SG es: 45475000
## La desviación estándar de la variable value en el equipo París SG es: 51236789
## Los valores mínimo y máximo de la variable value en el equipo París SG respectivamente son: 60000 153500000
## Los cuartiles en los que se divide value en el club Paris SG son: 60000 4550000 20000000 77750000 153500000
Según la gráfica, el conjunto de datos del equipo Chelsea se puede extraer que:
cat("La mediana de la variable value en el equipo Chelsea es:", mediana.chelsea)
## La mediana de la variable value en el equipo Chelsea es: 27000000
cat("La media de la variable value en el equipo Chelsea es:", media.chelsea)
## La media de la variable value en el equipo Chelsea es: 23728889
cat("La desviación estándar de la variable value en el equipo Chelsea es:", desviación.chelsea)
## La desviación estándar de la variable value en el equipo Chelsea es: 17922444
cat("Los valores mínimo y máximo de la variable value en el equipo Chelsea respectivamente son:", minimo.chelsea, maximo.chelsea)
## Los valores mínimo y máximo de la variable value en el equipo Chelsea respectivamente son: 60000 46500000
cat("Los cuartiles en los que se divide value en el club Chelsea son:", quartil.chelsea)
## Los cuartiles en los que se divide value en el club Chelsea son: 60000 7500000 27000000 42000000 46500000
Según la gráfica, el conjunto de datos del equipo FC Barcelona se puede extraer que:
cat("La mediana de la variable value en el equipo FC Barcelona es:", mediana.barcelona)
## La mediana de la variable value en el equipo FC Barcelona es: 10000000
cat("La media de la variable value en el equipo FC Barcelona es:", media.barcelona)
## La media de la variable value en el equipo FC Barcelona es: 18634500
cat("La desviación estándar de la variable value en el equipo FC Barcelona es:", desviación.barcelona)
## La desviación estándar de la variable value en el equipo FC Barcelona es: 21443730
cat("Los valores mínimo y máximo de la variable value en el equipo FC Barcelona respectivamente son:", minimo.barcelona, maximo.barcelona)
## Los valores mínimo y máximo de la variable value en el equipo FC Barcelona respectivamente son: 27500 58500000
cat("Los cuartiles en los que se divide value en el club FC Barcelona son:", quartil.barcelona)
## Los cuartiles en los que se divide value en el club FC Barcelona son: 27500 350625 10000000 34250000 58500000
El club Real Madrid es el que tiene el salario promedio más alto de los cuatro clubes, seguido del Chelsea, el París SG y por último, el club con salario promedio más bajo, el FC Barcelona.
El París SG es el que paga los salarios más altos vistos en los cuatro equipos, seguido por el Real Madrid, luego el FC Barcelona y por último el Chelsea.
La dispersión del París SG supera por creces a la dispersión de los otros tres clubes.