Ejemplo:

Estimación de la Media de Ingresos Anuales

Suponer que se desea estimar la media de ingresos anuales de los habitantes de una ciudad que se distribuyen de manera normal con una desviación estándar conocida de $15,000. Tomar una muestra aleatoria de 100 individuos y utilizamos la media muestral como estimador de la media de ingresos para toda la población.

# Datos de ejemplo
set.seed(42)
ingresos <- rnorm(100, mean = 50000, sd = 15000)

# Estimador de la media muestral
media_estimada <- mean(ingresos)

# Verdadera media de ingresos
media_real <- 50000

# Sesgo
sesgo <- media_estimada - media_real

# Eficiencia
varianza_estimada <- var(ingresos)
varianza_eficiente <- varianza_estimada / 100  # Eficiencia para la media muestral
eficiencia <- varianza_eficiente / varianza_estimada

# Consistencia
tamanos_muestra <- seq(10, 1000, by = 10)
medias_muestrales <- sapply(tamanos_muestra, function(n) mean(rnorm(n, mean = 50000, sd = 15000)))
consistencia <- abs(medias_muestrales - media_real)

# Resultados
cat("Media Estimada:", media_estimada, "\n")
## Media Estimada: 50487.72
cat("Sesgo:", sesgo, "\n")
## Sesgo: 487.7222
cat("Eficiencia (para media muestral):", eficiencia, "\n")
## Eficiencia (para media muestral): 0.01
# Gráfico de consistencia
plot(tamanos_muestra, consistencia, type = "l", xlab = "Tamaño de la Muestra", ylab = "Diferencia Absoluta", main = "Consistencia del Estimador")

Media Estimada:

La media estimada es el resultado de aplicar el estimador de la media muestral a los datos simulados. En este caso, debería ser cercana a la verdadera media de ingresos anuales en la población, que es $50,000. Sesgo:

El sesgo es la diferencia entre la media estimada y la verdadera media. En este contexto, el sesgo indica cuán sistemáticamente se aleja la media estimada de la verdadera media. Si el sesgo es cercano a cero, el estimador es considerado insesgado. Si es diferente de cero, se considera sesgado. Interpretación: Si el sesgo es cercano a cero, nuestro estimador de la media muestral es insesgado, lo que significa que, en promedio, no sobreestima ni subestima la verdadera media de ingresos.

Eficiencia:

La eficiencia se refiere a cuán bien el estimador utiliza la información disponible en los datos para estimar el parámetro de interés. En este caso, calculamos la eficiencia relativa del estimador de la media muestral utilizando la varianza de la media muestral y la varianza real de la población. Interpretación: Una eficiencia cercana a 1 indica que el estimador está utilizando eficientemente la información en la muestra para estimar la media de la población.

Consistencia:

La consistencia se evalúa observando cómo el estimador se comporta a medida que aumenta el tamaño de la muestra. En este caso, se presenta un gráfico de la diferencia absoluta entre las medias muestrales y la verdadera media para diferentes tamaños de muestra.

Si la diferencia entre la media muestral y la verdadera media disminuye a medida que aumenta el tamaño de la muestra, el estimador es consistente, lo que significa que converge en probabilidad a la verdadera media de la población.