Estadística y Probabilidad

Clase 1.8
Medidas de posición para datos agrupados

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Medidas de posición para datos agrupados
    • Cuartiles
    • Deciles
    • Percentiles
  • Ejercicios

Medidas de posición para datos agrupados

Cuartiles (\(k=1,2,3\))

    • Si \(n\) es par: se busca el intervalo o fila \(i\), tal que \(F_i > \frac{k n }{4}\).
    • Si \(n\) es impar: se busca el intervalo o fila \(i\), tal que \(F_i > \frac{k (n+1)}{4}\).
  1. Se seleccionan los límites inferior (\(l_i\)) y superior (\(L_i\)) del intervalo \(i\).
  2. Los deciles de los datos agrupados viene dada por la siguiente fórmula:

\[Q_k = l_i + (L_i-l_i) \left[ \frac{\frac{kn}{4} - F_{i-1}}{f_i} \right] \]

Observación: las filas se enumeran de arriba hacia abajo; por lo tanto, la fila \(i-1\) será la fila que está inmediatamente arriba de la fila \(i\).

Ejemplo 1

A continuación, se presenta una tabla de frecuencia (datos agrupados) del número de defectos que se encuentran en la fabricación de un lote de cuarenta motores diesel.

\(Clase\) \(f\) \(F\) \(l\) \(L\)
\([1,3)\) 6 6 1 3
\([3,5)\) 8 14 3 5
\([5,7)\) 14 28 5 7
\([7,9)\) 5 33 7 9
\([9,11]\) 7 40 9 11

Calcular los cuartiles de los datos agrupados

Solución

  1. Para el cuartil 1, \(\frac{kn}{4} = \frac{1\cdot40}{4} = 10\), luego si \(F_i > 10\), la fila es \(i=2\).
  1. Los límites son: \(l_i=3\) y \(L_i = 5\)

Por lo tanto, el primer cuartil de los datos agrupados \(Q_1\), es: \[Q_1 = 3 + (5-3) \left[ \frac{\frac{1(40)}{4} - 6}{8} \right] = 4\]

En R

Code
n = 40
k = 1
i = 2
li = 3
Li = 5
Fimenos1 = 6
fi = 8

# cuartiles de datos agrupados
li + (Li-li)*((k*n/4 - Fimenos1)/fi)

Calcule los cuartiles 2 y 3.

Medidas de posición para datos agrupados

Calculamos la fila o el intervalo de los deciles y percentiles.

Deciles (\(k=1,2,\dots,9\))

    • Si \(n\) es par: se busca el intervalo o fila \(i\), tal que \(F_i > \frac{k n }{10}\).
    • Si \(n\) es impar: se busca el intervalo o fila \(i\), tal que \(F_i > \frac{k (n+1)}{10}\).
  1. Se seleccionan los límites inferior (\(l_i\)) y superior (\(L_i\)) del intervalo \(i\).
  2. Los deciles de los datos agrupados viene dada por la siguiente fórmula:

\[D_k = l_i + (L_i-l_i) \left[ \frac{\frac{kn}{10} - F_{i-1}}{f_i} \right]\]

Percentiles (\(k=1,2,\dots,99\))

    • Si \(n\) es par: se busca el intervalo o fila \(i\), tal que \(F_i > \frac{k n }{100}\).
    • Si \(n\) es impar: se busca el intervalo o fila \(i\), tal que \(F_i > \frac{k (n+1)}{100}\).
  1. Se seleccionan los límites inferior (\(l_i\)) y superior (\(L_i\)) del intervalo \(i\).
  2. Los deciles de los datos agrupados viene dada por la siguiente fórmula:

\[P_k = l_i + (L_i-l_i) \left[ \frac{\frac{kn}{100} - F_{i-1}}{f_i} \right]\]

Ejemplo 2

Del ejemplo 1, tenemos la tabla:

\(Clase\) \(f\) \(F\) \(l\) \(L\)
\([1,3)\) 6 6 1 3
\([3,5)\) 8 14 3 5
\([5,7)\) 14 28 5 7
\([7,9)\) 5 33 7 9
\([9,11]\) 7 40 9 11

Calcular el decil 3 de los datos agrupados.

Solución

  1. Para el decil 3, \(\frac{kn}{10} = \frac{3\cdot 40}{10} = 12\), luego si \(F > 12\), la fila es \(i=2\).
  2. \(l_i=3\) y \(L_i = 5\)

Por lo tanto, el primer decil de los datos agrupados \(D_1\), es: \[Q_3 = 3 + (5-3) \left[ \frac{\frac{3(40)}{10} - 6}{8} \right] = 4.5\]

En R

Code
n = 40
k = 3
i = 2
li = 3
Li = 5
Fimenos1 = 6
fi = 8

# cuartiles de datos agrupados
li + (Li-li)*((k*n/10 - Fimenos1)/fi)

Medidas de posición para datos agrupados (percentiles)

Percentiles

Los percentiles son 99: \(P_1, P_2,\dots, P_{99}\). Para encontrar los deciles de datos agrupados, se procede de la siguiente forma:

Análogamente, como se procedió en el cálculo de los cuartiles y deciles, se realizan los percentiles; solo se debe tener en cuenta, que en la fórmula para la fila debe ser \(\frac{kn}{100}\).

Ejemplo 3

Calcule en R el percentil 65, usando la tabla del ejemplo 1.

Code
n = 40
k = 65
i = 3
li = 5
Li = 7
Fimenos1 = 14
fi = 14

# cuartiles de datos agrupados
li + (Li-li)*((k*n/100 - Fimenos1)/fi)

Ejercicios

  1. Los datos representan el número de llamas telefónicas diarias que recibe un grup de 125 estudiantes universitarios durante el día. Los estudiantes fueron seleccionados en forma aleatoria.
\(Llamadas\) \(f\)
\([2,4)\) 28
\([4,6)\) 53
\([6,8)\) 42
\([8,10]\) 2

Calcule los cuartiles de los datos agrupados. Interprete.

  1. De la producción diaria de una máquina se eligió una muestra de 100 baterías que se probaron para estimar cuanto tiempo operarían en una lámpara medida en horas. Los resultados fueron los siguientes.
\(Clase\) \([60,63)\) \([63,66)\) \([66,69)\) \([69,72)\) \([72,75]\)
\(f\) \(5\) \(18\) \(42\) \(27\) \(8\)
  1. Calcule los deciles 4 y 7 de los datos agrupados. Interprete.
  2. Calcule los percentiles 32 y 85 de los datos agrupados. Interprete.