Medidas de dispersión
Luego de determinar la localización de las observaciones, es conveniente estimar su grado de dispersión alrededor del centro. Las medidas que permiten especificar esta característica se denominan medidas de dispersión.
Estas medidas deben tener la propiedad de que si los datos están ampliamente extendidos, la medida será alta; y cuando los datos se encuentren muy agrupados, será baja.
Existen varias medidas de dispersión, nosotros vamos a analizar la desviación estándar, el rango y el rango intercuartil.
Existe una amplia variedad de medidas de localización; nos concentraremos en las más empleadas: el promedio, la mediana, la moda, la media geométrica y la media armónica.
La desviación estándar
Datos No Agrupados
Ejemplo. Calcular la desviación estándar de los sueldos (en dólares) de diez personas que ganan:
\[\begin{array}
{r}
560 & 472 & 539 & 664 & 573 & 628 & 520 & 715 & 437 & 602
\end{array}\]
Solución
- Crear una variable para guardar los datos de nombre var
- Utilizar la función sd para calcular la desviación estándar de los datos
- Para visualizar el valor, solo ejecutar el nombre de la variable sd
## [1] 85.05031
El rango y el rango intercuartil
Ejemplo. Calcular el rango y el RIQ de la estatura de 46 señoras, cuyas medidas se resumen en la siguiente tabla:
\[\begin{array}
{|r|r|}
\hline
Estatura & 1.45 & 1.48 & 1.50 & 1.53 & 1.55 & 1.57 & 1.60 & 1.63 & 1.65 \\
\hline
Frecuencia & 2 & 4 & 5 & 8 & 12 & 7 & 4 & 3 & 1 \\
\hline
\end{array}\]
Solución
- Crear dos variables para guardar los datos
var = c(1.45,1.48, 1.50, 1.53, 1.55, 1.57, 1.60,1.63, 1.65)
n_i = c(2,4,5,8,12,7,4,3,1)
- Para calcular la rango utilizar la siguiente sentencias
## [1] 0.2
- Para encontrar el RIQ se tiene que calcular Q3 y Q1 con las lineas de código de las medidas de localización
## [1] "El percentil 25 se encuentra entre 11 y 19"
## [1] "El percentil 75 se encuentra entre 31 y 38"
- Se toma el número mayor de 11 y 19. Se denomina clase media a la clase del 19
- Se toma el número mayor de 31 y 38. Se denomina clase media a la clase del 38
- Los cuartiles serán:
## [1] "Q1 = 1.53"
## [1] "Q3 = 1.57"
- Para calcular RIQ se tiene que restar el Q3 - Q1
## [1] 0.04
El coeficiente de variación
Datos No Agrupados
Ejemplo. Calcular el coeficiente de variación del sueldo de diez personas que ganan (en dólares):
\[\begin{array}
{r}
560 & 472 & 539 & 664 & 573 & 628 & 520 & 715 & 437 & 602
\end{array}\]
Solución
- Crear una variable para guardar los datos de nombre var
- Utilizar las funciones mean y sd para calcular la media y la desviación estándar respectivamente.
- Para calcular el coeficiente de variación, se efectua la siguiente división:
## [1] 0.1489498