Estadística y Probabilidad

Clase 1.6
Medidas de tendencia central para datos agrupados

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Medidas de tendencia central para datos agrupados
    • Problema ilustrativo
    • La media aritmética para datos agrupados \(\bar{x}\)
    • La mediana para datos agrupados \(Me\)
    • La moda para datos agrupados \(Mo\)
    • Ejercicios

Medidas de tendencia central para datos agrupados

Problema ilustrativo

A continuación, se presenta una tabla con 40 medidas datos representan el número de defectos que se encuentran en la fabricación de un lote de un tipo de motor diesel.

1 2 2 2 2 3 3 3 3 3 3 4 4 4 5 5 5 5 5 5
5 5 6 6 6 6 6 6 8 8 8 8 8 9 10 10 10 11 11 11

Con la información de este problema generemos una tabla de distribución con 5 intervalos. Es decir:

Code
x = c(1,1,1,2,2,2,3,3,3,3,3,4,4,4,5,5,5,5,5,5,5,5,5,6,6,6,6,6,8,8,8,8,8,9,10,10,10,11,11,11)
xmax = max(x)
xmin = min(x)
ancho = 2
cortes = seq(from = xmin, to = 12, by = ancho)
#encontramos el intervalo al cual pertenece cada dato
interv = cut(x, include.lowest = TRUE, right = FALSE, breaks = cortes)
n = length(interv)
# frecuencia de cada intervalo
frec_basica = table(interv)
# tabla de frecuencia basica
tabla = data.frame(frec_basica)
# agregamos otras columnas
tabla$F = cumsum(tabla$Freq)
tabla$marca = cortes[1:(length(cortes)-1)] + ancho/2
tabla$linf = cortes[1:(length(cortes)-1)]
tabla$lsup = cortes[2:length(cortes)]

tabla1 = tabla

#Cambiamos los nombres de la tabla 
names(tabla)[1] <- "Clase"
names(tabla)[2] <- "f"
names(tabla)[4] <- "Marca de clase ($x_i$)"
names(tabla)[5] <- "$L_{inf}$"
names(tabla)[6] <- "$L_{sup}$"

knitr::kable(tabla, align = "c")
Clase f F Marca de clase (\(x_i\)) \(L_{inf}\) \(L_{sup}\)
[1,3) 6 6 2 1 3
[3,5) 8 14 4 3 5
[5,7) 14 28 6 5 7
[7,9) 5 33 8 7 9
[9,11] 7 40 10 9 11

Ahora calculemos la media aritmética, la mediana y la moda usando el problema para ilustrar el procedimiento.

La media aritmética para datos agrupados \(\bar{x}\)

La media aritmética para datos agrupados (\(\bar{x}\)) consiste en multiplicar cada frecuencia absoluta \(f\) por la marca de clase \(x_i\) del intervalo; luego se suman todos estos resultados, y por último se divide entre el total de datos \(n\). La fórmula es la siguiente:

\[\bar{x}= \frac{\displaystyle \sum_{i=1}^n f_i x_i}{n}\]

  • Cada \(f_i\) es la frecuencia absoluta de la clase \(i\). También se le llama ponderación o peso.
  • \(x_i\) es la marca de clase o el centro de cada intervalo.

Veamos un ejemplo a continuación.

La media aritmética para datos agrupados \(\bar{x}\)

Ejemplo 1

Code
tablaxbar_agrupado <- tabla[,c(1,2,4)]
tablaxbar_agrupado$fixi = paste(tabla$f, tabla$`Marca de clase ($x_i$)`, sep = "\U00B7")
names(tablaxbar_agrupado)[3] <- "$x_i$"
names(tablaxbar_agrupado)[4] <- "$f_ix_i$"
knitr::kable(tablaxbar_agrupado, align = "c")
Clase f \(x_i\) \(f_ix_i\)
[1,3) 6 2 6·2
[3,5) 8 4 8·4
[5,7) 14 6 14·6
[7,9) 5 8 5·8
[9,11] 7 10 7·10
\[\begin{align*} \bar{x} &= \frac{\displaystyle \sum_{i=1}^n f_i x_i}{n} \\ & =\frac{\displaystyle 12+32+84+40+70}{40} \\ & = 5.95 \end{align*}\]

Por lo tanto, la media aritmética \(\bar{x} =\) 5.95

La mediana para datos agrupados \(Me\)

Para calcular la mediana de datos agrupados (\(Me\)) se realiza de la sigueinte forma:

  1. Se calcula \(n/2\), donde \(n\) es el total de datos.
  2. Se busca el primer intervalo donde la frecuencia acumulada sea mayor que \(n/2\). Este será el intevalo o fila \(i\).
  3. Se seleccionan los límites inferior (\(L_{inf}\)) y superior (\(L_{sup}\)) de este intervalo. Por simplicidad los llamaremos: \(L_i\) y \(L_s\) respectivamente.

De acuerdo a los pasos anteriores, la mediana de los datos agrupados viene dada por la siguiente fórmula:

\[Me = L_i + (L_s-L_i) \left[ \frac{\frac{n}{2} - F_{i-1}}{f_{i}} \right] \]

Observación: Notemos que las filas se enumeran de arriba hacia abajo; por lo tanto, la fila \(i-1\) será la fila anterior a la fila \(i\), es decir, la fila que está imediatamente arriba.

La mediana para datos agrupados \(Me\)

Ejemplo 2

Para los datos agrupados del problema propuesto, tenemos que:

  1. \(n/2= \frac{40}{2} =\) 20
  2. Luego el intervalo seleccionado es [5,7), ya que la frecuencia acumulada en ese intervalo es 28 > 20.
  3. Veamos la fórmula junto con la tabla:
Code
knitr::kable(tabla[,1:3], align = "c")
Clase f F
[1,3) 6 6
[3,5) 8 14
[5,7) 14 28
[7,9) 5 33
[9,11] 7 40
\[\begin{align*} Me &= L_i + (L_s-L_i) \left[ \frac{\frac{n}{2} - F_{i-1}}{f_{i}} \right]\\ &= 5 + (7 - 5)\left[ \frac{\frac{40}{2} - 14}{14} \right]\\ &= 5.86 \end{align*}\]

Por lo tanto, la mediana es 5.86. Interprete el resultado.

La moda para datos agrupados \(Mo\)

La moda para datos agrupados \(Mo\) es el valor que tiene mayor frecuencia entre todos los datos agrupados; es decir, es el valor que se repite más veces en el conjunto de datos inicial. Para calcularla debemos tener en cuenta lo siguiente:

  1. Encontramos el intervalo \([L_i,L_s)\) que tiene la mayor frecuencia absoluta. A este intervalo lo llamaremos \(i\).
  2. Aplicamos la fórmula a continuación.

\[Mo = Li + (Ls-Li)\left[ \frac{f_{i+1}}{f_{i-1}+f_{i+1} } \right]\] Veamos un ejemplo.

La moda para datos agrupados \(Mo\)

Ejemplo 3

Code
knitr::kable(tabla[,1:3], align = "c")
Clase f F
[1,3) 6 6
[3,5) 8 14
[5,7) 14 28
[7,9) 5 33
[9,11] 7 40

Por lo tanto,

\[\begin{align*} Mo &= Li + (Ls-Li)\left[ \frac{f_{i+1}}{f_{i-1}+f_{i+1} } \right]\\ &= 5 + (7 - 5)\left[ \frac{5}{8 + 5} \right]\\ &= 5.86 \end{align*}\]

¡Interprete el resultado!

Ejercicios

  1. Los datos representan el número de llamas telefónicas diarias que recibe un grup de 125 estudiantes universitarios durante el día. Los estudiantes fueron seleccionados en forma aleatoria.
Llamadas f
[2,4) 28
[4,6) 53
[6,8) 42
[8,10] 2

Calcule la media, mediana y moda para los datos agrupados. Interprete cuando sea pertinente.

  1. De la producción diaria de una máquina se eligió una muestra de 100 baterías que se probaron para estimar cuanto tiempo operarían en una lámpara medida en horas. Los resultados fueron los siguientes.
Clase [60,63) [63,66) [66,69) [69,72) [72,75]
f 5 18 42 27 8

Calcule la media, mediana y moda para los datos agrupados. Interprete cuando sea pertinente.