Las medidas de dispersión permiten conocer qué tan separados o concentrados se encuentran los datos respecto a una medida de tendencia central. Estas medidas complementan el análisis estadístico al proporcionar información sobre la variabilidad de los datos.
Las principales medidas de dispersión son:
Se analizarán las calificaciones de un grupo de estudiantes.
calificaciones <- c(70,75,80,82,85,85,85,88,90,92,95)
calificaciones
## [1] 70 75 80 82 85 85 85 88 90 92 95
summary(calificaciones)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 70.00 81.00 85.00 84.27 89.00 95.00
El rango representa la diferencia entre el valor máximo y el valor mínimo.
rango <- max(calificaciones) - min(calificaciones)
rango
## [1] 25
La varianza mide la dispersión promedio de los datos respecto a la media.
varianza <- var(calificaciones)
varianza
## [1] 53.61818
La desviación estándar indica cuánto se alejan los datos de la media en promedio.
desviacion <- sd(calificaciones)
desviacion
## [1] 7.322444
El coeficiente de variación expresa la dispersión relativa respecto a la media.
media <- mean(calificaciones)
cv <- (sd(calificaciones)/media)*100
cv
## [1] 8.688984
cuartiles <- quantile(calificaciones)
cuartiles
## 0% 25% 50% 75% 100%
## 70 81 85 89 95
El rango intercuartílico mide la amplitud del 50% central de los datos.
iqr <- IQR(calificaciones)
iqr
## [1] 8
tabla <- data.frame(
Medida = c("Rango",
"Varianza",
"Desviación Estándar",
"Coeficiente de Variación (%)",
"Rango Intercuartílico"),
Valor = c(
rango,
varianza,
desviacion,
cv,
iqr
)
)
tabla
## Medida Valor
## 1 Rango 25.000000
## 2 Varianza 53.618182
## 3 Desviación Estándar 7.322444
## 4 Coeficiente de Variación (%) 8.688984
## 5 Rango Intercuartílico 8.000000
hist(calificaciones,
main = "Histograma de Calificaciones",
xlab = "Calificaciones",
ylab = "Frecuencia",
col = "lightblue",
border = "black")
El histograma permite observar la distribución de los datos.
boxplot(calificaciones,
main = "Diagrama de Caja",
horizontal = TRUE,
col = "orange")
El diagrama de caja muestra la dispersión de los datos y posibles valores atípicos.
plot(density(calificaciones),
main = "Curva de Densidad",
lwd = 3)
La curva de densidad proporciona una representación suavizada de la distribución de los datos.
media <- mean(calificaciones)
hist(calificaciones,
main = "Histograma con Media",
xlab = "Calificaciones",
col = "lightgray",
border = "black")
abline(v = media,
col = "red",
lwd = 3)
legend("topright",
legend = "Media",
col = "red",
lwd = 3)
## La dispersión de los datos puede evaluarse mediante el rango, la varianza y la desviación estándar. Un coeficiente de variación bajo indica que los datos presentan poca variabilidad respecto a la media.
Las medidas de dispersión permiten cuantificar la variabilidad de un conjunto de datos. En este análisis se calcularon el rango, la varianza, la desviación estándar, el coeficiente de variación y el rango intercuartílico. Estas medidas complementan a las medidas de tendencia central y ayudan a comprender mejor el comportamiento de la información analizada.
La utilización de histogramas, diagramas de caja y curvas de densidad facilita la interpretación visual de la dispersión de los datos.