Clase 1.6
Medidas de tendencia central para datos agrupados
Msc. Roberto Trespalacios
Universidad Tecnológica de Bolivar
2024-01-29
Tabla de contenido
Medidas de tendencia central para datos agrupados
Problema ilustrativo
La media aritmética para datos agrupados \(\bar{x}\)
La mediana para datos agrupados \(Me\)
La moda para datos agrupados \(Mo\)
Ejercicios
Medidas de tendencia central para datos agrupados
Problema ilustrativo
A continuación, se presenta una tabla con 40 medidas datos representan el número de defectos que se encuentran en la fabricación de un lote de un tipo de motor diesel.
1
2
2
2
2
3
3
3
3
3
3
4
4
4
5
5
5
5
5
5
5
5
6
6
6
6
6
6
8
8
8
8
8
9
10
10
10
11
11
11
Con la información de este problema generemos una tabla de distribución con 5 intervalos. Es decir:
Code
x =c(1,1,1,2,2,2,3,3,3,3,3,4,4,4,5,5,5,5,5,5,5,5,5,6,6,6,6,6,8,8,8,8,8,9,10,10,10,11,11,11)xmax =max(x)xmin =min(x)ancho =2cortes =seq(from = xmin, to =12, by = ancho)#encontramos el intervalo al cual pertenece cada datointerv =cut(x, include.lowest =TRUE, right =FALSE, breaks = cortes)n =length(interv)# frecuencia de cada intervalofrec_basica =table(interv)# tabla de frecuencia basicatabla =data.frame(frec_basica)# agregamos otras columnastabla$F =cumsum(tabla$Freq)tabla$marca = cortes[1:(length(cortes)-1)] + ancho/2tabla$linf = cortes[1:(length(cortes)-1)]tabla$lsup = cortes[2:length(cortes)]tabla1 = tabla#Cambiamos los nombres de la tabla names(tabla)[1] <-"Clase"names(tabla)[2] <-"f"names(tabla)[4] <-"Marca de clase ($x_i$)"names(tabla)[5] <-"$L_{inf}$"names(tabla)[6] <-"$L_{sup}$"knitr::kable(tabla, align ="c")
Clase
f
F
Marca de clase (\(x_i\))
\(L_{inf}\)
\(L_{sup}\)
[1,3)
6
6
2
1
3
[3,5)
8
14
4
3
5
[5,7)
14
28
6
5
7
[7,9)
5
33
8
7
9
[9,11]
7
40
10
9
11
Ahora calculemos la media aritmética, la mediana y la moda usando el problema para ilustrar el procedimiento.
La media aritmética para datos agrupados \(\bar{x}\)
La media aritmética para datos agrupados (\(\bar{x}\)) consiste en multiplicar cada frecuencia absoluta \(f\) por la marca de clase \(x_i\) del intervalo; luego se suman todos estos resultados, y por último se divide entre el total de datos \(n\). La fórmula es la siguiente:
Por lo tanto, la media aritmética \(\bar{x} =\) 5.95
La mediana para datos agrupados \(Me\)
Para calcular la mediana de datos agrupados (\(Me\)) se realiza de la sigueinte forma:
Se calcula \(n/2\), donde \(n\) es el total de datos.
Se busca el primer intervalo donde la frecuencia acumulada sea mayor que \(n/2\). Este será el intevalo o fila \(i\).
Se seleccionan los límites inferior (\(L_{inf}\)) y superior (\(L_{sup}\)) de este intervalo. Por simplicidad los llamaremos: \(L_i\) y \(L_s\) respectivamente.
De acuerdo a los pasos anteriores, la mediana de los datos agrupados viene dada por la siguiente fórmula:
Observación: Notemos que las filas se enumeran de arriba hacia abajo; por lo tanto, la fila \(i-1\) será la fila anterior a la fila \(i\), es decir, la fila que está imediatamente arriba.
La mediana para datos agrupados \(Me\)
Ejemplo 2
Para los datos agrupados del problema propuesto, tenemos que:
\(n/2= \frac{40}{2} =\) 20
Luego el intervalo seleccionado es [5,7), ya que la frecuencia acumulada en ese intervalo es 28 > 20.
Por lo tanto, la mediana es 5.86. Interprete el resultado.
La moda para datos agrupados \(Mo\)
La moda para datos agrupados \(Mo\) es el valor que tiene mayor frecuencia entre todos los datos agrupados; es decir, es el valor que se repite más veces en el conjunto de datos inicial. Para calcularla debemos tener en cuenta lo siguiente:
Encontramos el intervalo \([L_i,L_s)\) que tiene la mayor frecuencia absoluta. A este intervalo lo llamaremos \(i\).
Aplicamos la fórmula a continuación.
\[Mo = Li + (Ls-Li)\left[ \frac{f_{i+1}}{f_{i-1}+f_{i+1} } \right]\] Veamos un ejemplo.
Los datos representan el número de llamas telefónicas diarias que recibe un grup de 125 estudiantes universitarios durante el día. Los estudiantes fueron seleccionados en forma aleatoria.
Llamadas
f
[2,4)
28
[4,6)
53
[6,8)
42
[8,10]
2
Calcule la media, mediana y moda para los datos agrupados. Interprete cuando sea pertinente.
De la producción diaria de una máquina se eligió una muestra de 100 baterías que se probaron para estimar cuanto tiempo operarían en una lámpara medida en horas. Los resultados fueron los siguientes.
Clase
[60,63)
[63,66)
[66,69)
[69,72)
[72,75]
f
5
18
42
27
8
Calcule la media, mediana y moda para los datos agrupados. Interprete cuando sea pertinente.