El objetivo de este ejercicio es calcular la correlación y la covarianza entre dos variables numéricas provenientes de un conjunto de datos real, interpretando sus resultados estadísticos y representándolos gráficamente.
Se utilizará el dataset players_20.csv
de FIFA 2020, el
cual contiene características físicas y estadísticas de miles de
jugadores profesionales. Para este análisis, se seleccionan las
variables:
height_cm
: altura del jugador en centímetrosweight_kg
: peso del jugador en kilogramosdatos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/datos/players_20.csv",
stringsAsFactors = TRUE, encoding = "UTF-8")
# Selección de variables numéricas
datos <- datos[, c("height_cm", "weight_kg")]
colnames(datos) <- c("Altura", "Peso")
head(datos)
## Altura Peso
## 1 170 72
## 2 187 83
## 3 175 68
## 4 188 87
## 5 175 74
## 6 181 70
# Covarianza
covarianza <- cov(datos$Altura, datos$Peso, use = "complete.obs")
covarianza
## [1] 36.61206
# Correlación de Pearson
correlacion <- cor(datos$Altura, datos$Peso, method = "pearson", use = "complete.obs")
correlacion
## [1] 0.7688164
plot(datos$Altura, datos$Peso,
main = "Dispersión entre Altura y Peso (FIFA 20)",
xlab = "Altura (cm)",
ylab = "Peso (kg)",
col = "steelblue", pch = 19)
abline(lm(Peso ~ Altura, data = datos), col = "red", lwd = 2)
La covarianza calculada entre la altura y el peso es positiva, lo que indica que ambas variables tienden a aumentar juntas. Es decir, a mayor altura, los jugadores suelen tener mayor peso. Sin embargo, la covarianza por sí sola no nos dice qué tan fuerte es la relación. Para eso se calcula el coeficiente de correlación de Pearson, que en este caso es cercano a 0.87, lo cual representa una correlación positiva fuerte entre altura y peso. Esto es coherente con lo esperado en atletas de alto rendimiento como los futbolistas. La gráfica de dispersión refuerza esta conclusión, mostrando una nube de puntos con una clara tendencia lineal ascendente. Esto sugiere que la altura puede ser un buen predictor del peso en este conjunto de datos. Este análisis puede ayudar a entrenadores o médicos deportivos a identificar valores atípicos o confirmar patrones corporales esperados en atletas.
La correlación entre altura y peso en jugadores profesionales de FIFA 20 es fuerte y positiva. Esto sugiere una asociación natural entre estas dos variables físicas, como es de esperarse en el ámbito deportivo profesional.