Las medidas de posición o localización son valores que permiten dividir el conjunto de datos en partes porcentuales iguales y se usan para clasificar observaciones dentro de la población o muestra.
Caso 1. Los siguientes datos almacenados en https://raw.githubusercontent.com/anngelc/datos/master/indicefelicidad- latino-america.csv corresponden al Índice de Felicidad del Planeta o Índice del Planeta Feliz http://happyplanetindex.org/ que es un indicador del bienestar humano y del impacto ambiental de los países, especificamente de los países de Latinoamerica. y está publicado por el New Economics Foundation (NEF) en el 2016 por Karen Jeffrey, Hanna Wheatley y Saamah Abdallah.
los cuartiles son medidas que divide un conjunto de datos en cuatro partes iguales, por tanto tenemos: Cuartil 1 \(Q_1\), Cuartil 2 \(Q_2\) y Cuartil 3 \(Q_3\).
Para encontrar los cuartiles del índice de felicidad de los países latinoamericanos, primero ingresamos cada índice y almacenamos en la variable x
x=c(35.2,23.3,34.3,31.7,40.7,37,23.3,34.6,25.4,36.1,33.6)
Para determinar el cuartil 1 \(Q_1\), utilizamos la función quantile()
quantile(x, 0.25)
## 25%
## 28.55
Del resultado podemos afirmar que \(Q_1 = 28.55\), que justamente muestra la posición 25 del 100 por ciento (0.25).
También se puede determinar los tres cuartiles, usando el código de la siguiente manera
quantile(x, c(0.25, 0.50, 0.75))
## 25% 50% 75%
## 28.55 34.30 35.65
Por tanto los cuartiles son: \(Q_1 = 28.55\), \(Q_2 = 34.30\) y \(Q_3 = 35.65\)
Como pudimos observar para determinar los cuartiles es solo indicar la posición de un 100 por ciento expresado en proporciones, por tanto, deteminar el percentil 8, la mediana que es el percentil 50 y el decil 7 que corresponde al percentil 70, es necesario indicarle a la función quantile() que calcule los cuantiles para las ubicaciones 0.08, 0.50 y 0.70.
quantile(x, c(0.08, 0.50, 0.70))
## 8% 50% 70%
## 23.3 34.3 35.2
Del resultado encontramos que: \(P_8 = 23.3\), \(Me = P_{50} = 34.3\) y \(D_7 =P_{70}= 35.2\)
Para generar el diagrama de cajas y bigotes utilizamos la función boxplot()
boxplot(x)
Para mejorar el aspecto de este diagrama podemos enriquecer los parametros de la funcion boxplot(), en que main sirve para colocar el título, xlab para colocar la etiqueta en el eje x, ylab para la etiqueta en el eje y, y col para el color de la caja.
boxplot(x, main="Índice de felicidad de los países de Latinoamerica", xlab="Latinoamerica",
ylab="Índice", col = "green")