Medidas de Dispersión

Introducción

Las medidas de dispersión permiten conocer qué tan separados o concentrados se encuentran los datos respecto a una medida de tendencia central. Estas medidas complementan el análisis estadístico al proporcionar información sobre la variabilidad de los datos.

Las principales medidas de dispersión son:

  • Rango
  • Varianza
  • Desviación estándar
  • Coeficiente de variación
  • Rango intercuartílico

Base de Datos

Se analizarán las calificaciones de un grupo de estudiantes.

calificaciones <- c(70,75,80,82,85,85,85,88,90,92,95)

calificaciones
##  [1] 70 75 80 82 85 85 85 88 90 92 95

Estadísticos Básicos

summary(calificaciones)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   70.00   81.00   85.00   84.27   89.00   95.00

Rango

El rango representa la diferencia entre el valor máximo y el valor mínimo.

rango <- max(calificaciones) - min(calificaciones)

rango
## [1] 25

Varianza

La varianza mide la dispersión promedio de los datos respecto a la media.

varianza <- var(calificaciones)

varianza
## [1] 53.61818

Desviación Estándar

La desviación estándar indica cuánto se alejan los datos de la media en promedio.

desviacion <- sd(calificaciones)

desviacion
## [1] 7.322444

Coeficiente de Variación

El coeficiente de variación expresa la dispersión relativa respecto a la media.

media <- mean(calificaciones)

cv <- (sd(calificaciones)/media)*100

cv
## [1] 8.688984

Cuartiles

cuartiles <- quantile(calificaciones)

cuartiles
##   0%  25%  50%  75% 100% 
##   70   81   85   89   95

Rango Intercuartílico (IQR)

El rango intercuartílico mide la amplitud del 50% central de los datos.

iqr <- IQR(calificaciones)

iqr
## [1] 8

Tabla Resumen

tabla <- data.frame(
  Medida = c("Rango",
             "Varianza",
             "Desviación Estándar",
             "Coeficiente de Variación (%)",
             "Rango Intercuartílico"),
  Valor = c(
    rango,
    varianza,
    desviacion,
    cv,
    iqr
  )
)

tabla
##                         Medida     Valor
## 1                        Rango 25.000000
## 2                     Varianza 53.618182
## 3          Desviación Estándar  7.322444
## 4 Coeficiente de Variación (%)  8.688984
## 5        Rango Intercuartílico  8.000000

Histograma

hist(calificaciones,
     main = "Histograma de Calificaciones",
     xlab = "Calificaciones",
     ylab = "Frecuencia",
     col = "lightblue",
     border = "black")

El histograma permite observar la distribución de los datos.


Diagrama de Caja

boxplot(calificaciones,
        main = "Diagrama de Caja",
        horizontal = TRUE,
        col = "orange")

El diagrama de caja muestra la dispersión de los datos y posibles valores atípicos.


Gráfico de Densidad

plot(density(calificaciones),
     main = "Curva de Densidad",
     lwd = 3)

La curva de densidad proporciona una representación suavizada de la distribución de los datos.


Histograma con Media

media <- mean(calificaciones)

hist(calificaciones,
     main = "Histograma con Media",
     xlab = "Calificaciones",
     col = "lightgray",
     border = "black")

abline(v = media,
       col = "red",
       lwd = 3)

legend("topright",
       legend = "Media",
       col = "red",
       lwd = 3)


Interpretación de Resultados

## La dispersión de los datos puede evaluarse mediante el rango, la varianza y la desviación estándar. Un coeficiente de variación bajo indica que los datos presentan poca variabilidad respecto a la media.

Conclusiones

Las medidas de dispersión permiten cuantificar la variabilidad de un conjunto de datos. En este análisis se calcularon el rango, la varianza, la desviación estándar, el coeficiente de variación y el rango intercuartílico. Estas medidas complementan a las medidas de tendencia central y ayudan a comprender mejor el comportamiento de la información analizada.

La utilización de histogramas, diagramas de caja y curvas de densidad facilita la interpretación visual de la dispersión de los datos.