Código
datos <- c(4, 8, 15, 16, 23, 42)
media <- mean(datos)
cat("Media aritmética:", media)Media aritmética: 18
Los promedios son medidas de tendencia central que nos permiten resumir información sobre un conjunto de datos. Estas medidas son fundamentales en estadística descriptiva y nos ayudan a comprender la distribución de los datos.
Las medidas de tendencia central nos permiten:
Existen diferentes tipos de promedios, cada uno con sus propias características y aplicaciones.
La media aritmética es el promedio más común. Se calcula sumando todos los valores y dividiendo por el número total de observaciones.
\[\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}\]
datos <- c(4, 8, 15, 16, 23, 42)
media <- mean(datos)
cat("Media aritmética:", media)Media aritmética: 18
La mediana es el valor que divide el conjunto de datos en dos partes iguales. Es menos sensible a valores extremos que la media aritmética.
mediana <- median(datos)
cat("Mediana:", mediana)Mediana: 15.5
La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Un conjunto puede tener más de una moda.
datos_con_moda <- c(2, 3, 3, 4, 5, 5, 5, 6, 7)
# Función para calcular la moda
calcular_moda <- function(x) {
tabla <- table(x)
as.numeric(names(tabla)[tabla == max(tabla)])
}
cat("Moda:", calcular_moda(datos_con_moda))Moda: 5
Cada medida de tendencia central tiene sus ventajas y desventajas:
| Medida | Ventajas | Desventajas |
|---|---|---|
| Media | Utiliza todos los valores | Sensible a valores extremos |
| Mediana | Resistente a valores extremos | No considera todos los valores |
| Moda | Útil para datos categóricos | Puede no ser única |
Veamos un ejemplo práctico de cómo estas medidas pueden variar:
# Conjunto de datos normal
datos_normal <- c(10, 12, 13, 14, 15, 16, 18)
# Conjunto con valor extremo
datos_extremo <- c(10, 12, 13, 14, 15, 16, 100)
# Comparación
comparacion <- data.frame(
Conjunto = c("Normal", "Con valor extremo"),
Media = c(mean(datos_normal), mean(datos_extremo)),
Mediana = c(median(datos_normal), median(datos_extremo))
)
# Mostrar tabla
library(knitr)
kable(comparacion)| Conjunto | Media | Mediana |
|---|---|---|
| Normal | 14.00000 | 14 |
| Con valor extremo | 25.71429 | 14 |
Comparación de medidas de tendencia central
# Visualización
par(mfrow=c(1,2))
boxplot(datos_normal, main="Datos normales")
boxplot(datos_extremo, main="Datos con valor extremo")