Tendencia Central

Ejercicio: edades del grupo en diagrama tallo (años) - hojas (meses)

Media Aritmética

\[\mu = \frac{\sum_{i=1}^N X_i}{N}\qquad(1)\]

\[\bar X = \frac{\sum_{i=1}^n X_i}{n}\qquad(2)\]


EJEMPLO 1

Muestra de n = 24 mediciones de la longitud de alas de mariposas (cm):

#mediciones de las alas (cm)
Xi <- c(3.3,3.5,3.6,3.6,3.7,3.8,3.8,3.8,3.9,3.9,3.9,
        4.0,4.0,4.0,4.0,4.1,4.1,4.1,4.2,4.2,4.3,4.3,4.4,4.5)
n <- length(Xi)
#cálculos usando fórmula (2)
SumXi <- sum(Xi)
MediaMuestra <- SumXi/n
sprintf("Media: %g", MediaMuestra)
## [1] "Media: 3.95833"
#forma directa en R
MediaXi <- mean(Xi)
sprintf("Media con 'mean' en R: %g", MediaXi)
## [1] "Media con 'mean' en R: 3.95833"

Cálculo de la media a partir de frecuencias

A partir de una tabla de frecuencias se puede calcular la media utilizando la siguiente fórmula:

\[\bar X = \frac{\sum_{i=1}^k f_iX_i}{n}\qquad(3)\] dónde \(f_i\) es la frecuencia (ocurrencia) de los \(k\) valores diferentes de \(X_i\).


EJEMPLO 2

A partir de los datos anteriores, obtenemos una tabla de frecuencias (\(f_i\)) para los valores diferentes de \(X_i\) y luego calculamos la media utilizando la fórmula (3):

library(data.table)
#Datos de las mariposas
Xi <- c(3.3,3.5,3.6,3.6,3.7,3.8,3.8,3.8,3.9,3.9,3.9,
        4.0,4.0,4.0,4.0,4.1,4.1,4.1,4.2,4.2,4.3,4.3,4.4,4.5)
n <- length(Xi)
#Cálculo de la frecuencia de los valores diferentes de Xi
Fi <- table(Xi)
Frec <- data.table(Fi)
Frec
#Vectores de las categoría de valores de Xi (Xv) y de las frecuencias respectivas (fi)
Xv <- as.numeric(Frec$Xi)
Xv
##  [1] 3.3 3.5 3.6 3.7 3.8 3.9 4.0 4.1 4.2 4.3 4.4 4.5
fi <- c(Frec$N)
fi
##  [1] 1 1 2 1 3 3 4 3 2 2 1 1
#cálculo de la media usando fórmula (3)
media <- sum(fi*Xv)/n
sprintf("Media: %g", media)
## [1] "Media: 3.95833"

Media Ponderada

Vamos a imaginar la siguiente situación: encontramos dos estudios más sobre el tamaño de las alas de las mariposas, pero solamente tenemos los valores de la media y el tamaño de la muestra (estudio B: \(\bar X_B\)=3.78 cm, \(n_B\)=30; estudio C: \(\bar X_C\)=4.02 cm, \(n_C\)=15). Queremos calcular una media global, utilizando estos nuevos valores, pero los tamaños de las muestras son diferentes; la solución es calcular la media ponderada (weighted mean). Usaremos una adaptación de la fórmula (3):

media.ponderada <- ((3.96*24)+(3.78*30)+(4.02*15))/(24+30+15)
sprintf("Media Ponderada: %g", media.ponderada)
## [1] "Media Ponderada: 3.89478"

Mediana

Se define como la medición en la mitad, en una lista ordenada de las mediciones de la población (o muestra).

mediana

mediana

En general se calcula de la siguiente manera, usando \(n\) datos ordenados (usualmente de menor a mayor) de una muestra:

\[Mediana = X_{(n+1)/2} \qquad(4)\]


EJEMPLO 3

Datos del largo de vida (meses) de dos especies de aves.

#datos de las dos especies, duración de vida, en meses
Esp1 <- c(16, 32, 37, 39, 40, 41, 42, 50, 82)
n1 = length(Esp1)
sprintf("Tamaño de muestra especie 1: %g", n1)
## [1] "Tamaño de muestra especie 1: 9"
Esp2 <- c(34, 36, 38, 45, 50, 54, 56, 59, 69, 91)
n2 = length(Esp2)
sprintf("Tamaño de muestra especie 2: %g", n2)
## [1] "Tamaño de muestra especie 2: 10"
#cálculo de posición de la mediana usando fórmula (4)
MedianaEsp1 = (n1+1)/2
sprintf("Posicuón de la mediana de muestra especie 1: %g", MedianaEsp1)
## [1] "Posicuón de la mediana de muestra especie 1: 5"
MedianaEsp2 = (n2+1)/2
sprintf("Posición de la mediana de muestra especie 2: %g", MedianaEsp2)
## [1] "Posición de la mediana de muestra especie 2: 5.5"

Para la especie 1 la posición de la mediana es la 5, que corresponde al valor \(X_i\)=40; para la especie 2 la posición de la mediana es 5.5, es decir entre los valores 50 y 54, y se toma como valor de la mediana el promedio entre ambos, 52.


Comparación de media y mediana

¿Son semejantes las medianas y las medias de las muestras? Mediana Especie 1: 40 y Mediana Especie 2: 52

MXsp1 <- mean(Esp1)
MXsp2 <- mean(Esp2)
sprintf("Media especie 1: %g", MXsp1)
## [1] "Media especie 1: 42.1111"
sprintf("Media especie 2: %g", MXsp2)
## [1] "Media especie 2: 53.2"

Comparación de media y mediana

Distribución de Datos ***

Moda

Otras Medidas de la Tendencia Central

Media Geométrica

Se utiliza en escalas proporcionales, para medir la tendencia central de proporciones o tasas de cambio (tasas de interés, tasas de crecimiento poblacional).

\[\bar X_G = (\prod_{i=1}^n X_i)^{1/n} \qquad(5)\]

Otra forma de calcularla:

\[\bar X_G = antilog\frac{\sum_{i=1}^n logX_i}{n} \qquad(6)\] Media Geométrica


Media Armónica

Es utilizada cuando se necesita el promedio de tasas de cambio (velocidad).

\[\bar X_H = \frac{n}{\sum_{i=1}^n \frac{1}{X_i}} \qquad(7)\] ,


¿Cuál fue la velocidad promedio de las aves?

*Usando la media aritmética:

\[\bar X = \frac{40 km/h + 20 km/h}{2} = 30 km/h\] *Si multiplicamos esta velocidad promedio por el tiempo volado, nos debería dar la distancia recorrida: 30 km/h x 1.5 = 45 km, pero sabemos que la distancia total recorrida fue de solo 40 km.

*Ahora calcularemos la media armónica:

\[\bar X_H = \frac{2}{\frac{1}{40km/h} + \frac{1}{20km/h}} = 26.67km/h\] *Multiplicando esta velocidad por el tiempo total: 26.67 km/h x 1.5 h = 40 km, que fue la verdadera distancia recorrida.


Punto Medio

*valor promedio entre la medición de valor mínimo y la máxima.

*no es un buen indicador de la tendencia central, pero se utiliza en muestras que se toman repetidas veces y usualmente no varían mucho sus valores máximos y mínimos (temperatura media diaria).


moRdizco

Box-plot

Representación de la distribución de los valores de mediciones (datos) usando un ‘box-plot’.

box-plot

box-plot

#boxplot datos de alas de mariposas
Xi <- c(3.3,3.5,3.6,3.6,3.7,3.8,3.8,3.8,3.9,3.9,3.9,
        4.0,4.0,4.0,4.0,4.1,4.1,4.1,4.2,4.2,4.3,4.3,4.4,4.5)
Xiboxplot <- boxplot(Xi, ylab="Longitud alas (cm)")

Xistats <- Xiboxplot$stats
colnames(Xistats) <- Xiboxplot$names
rownames(Xistats) <- c('lower whisker','lower quartile','median','upper quartile','upper whisker')
Xistats
##                    
## lower whisker  3.30
## lower quartile 3.80
## median         4.00
## upper quartile 4.15
## upper whisker  4.50