1 Objetivo

El objetivo de este ejercicio es calcular la correlación y la covarianza entre dos variables numéricas provenientes de un conjunto de datos real, interpretando sus resultados estadísticos y representándolos gráficamente.


2 Desarrollo del ejercicio

Se utilizará el dataset players_20.csv de FIFA 2020, el cual contiene características físicas y estadísticas de miles de jugadores profesionales. Para este análisis, se seleccionan las variables:

  • height_cm: altura del jugador en centímetros
  • weight_kg: peso del jugador en kilogramos

2.1 Preguntas a resolver:

  1. ¿Cuál es la covarianza entre la altura y el peso de los jugadores?
  2. ¿Cuál es el coeficiente de correlación entre altura y peso?
  3. ¿Qué nos indica la relación entre estas variables?
  4. ¿La gráfica de dispersión apoya esta conclusión?

3 Cargar los datos

datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/datos/players_20.csv", 
                  stringsAsFactors = TRUE, encoding = "UTF-8")

# Selección de variables numéricas
datos <- datos[, c("height_cm", "weight_kg")]
colnames(datos) <- c("Altura", "Peso")

head(datos)
##   Altura Peso
## 1    170   72
## 2    187   83
## 3    175   68
## 4    188   87
## 5    175   74
## 6    181   70

4 Cálculo de Covarianza y Correlación

# Covarianza
covarianza <- cov(datos$Altura, datos$Peso, use = "complete.obs")
covarianza
## [1] 36.61206
# Correlación de Pearson
correlacion <- cor(datos$Altura, datos$Peso, method = "pearson", use = "complete.obs")
correlacion
## [1] 0.7688164

5 Gráfica de dispersión

plot(datos$Altura, datos$Peso,
     main = "Dispersión entre Altura y Peso (FIFA 20)",
     xlab = "Altura (cm)",
     ylab = "Peso (kg)",
     col = "steelblue", pch = 19)
abline(lm(Peso ~ Altura, data = datos), col = "red", lwd = 2)

6 Resultados

  • Covarianza: 36.61
  • Correlación de Pearson: 0.77

7 Interpretación

La covarianza calculada entre la altura y el peso es positiva, lo que indica que ambas variables tienden a aumentar juntas. Es decir, a mayor altura, los jugadores suelen tener mayor peso. Sin embargo, la covarianza por sí sola no nos dice qué tan fuerte es la relación. Para eso se calcula el coeficiente de correlación de Pearson, que en este caso es cercano a 0.87, lo cual representa una correlación positiva fuerte entre altura y peso. Esto es coherente con lo esperado en atletas de alto rendimiento como los futbolistas. La gráfica de dispersión refuerza esta conclusión, mostrando una nube de puntos con una clara tendencia lineal ascendente. Esto sugiere que la altura puede ser un buen predictor del peso en este conjunto de datos. Este análisis puede ayudar a entrenadores o médicos deportivos a identificar valores atípicos o confirmar patrones corporales esperados en atletas.


8 Conclusión

La correlación entre altura y peso en jugadores profesionales de FIFA 20 es fuerte y positiva. Esto sugiere una asociación natural entre estas dos variables físicas, como es de esperarse en el ámbito deportivo profesional.