Informe sobre Propiedades de Estimadores

Introducción

En este informe, realizaremos una evaluación de cuatro estimadores diferentes para un parámetro asociado a una distribución exponencial. Los estimadores se denotan como θ̂1, θ̂2, θ̂3 y θ̂4, y se calcularán utilizando muestras aleatorias de diferentes tamaños. El parámetro θ que estamos tratando de estimar se fijará en θ = 20. Utilizaremos una simulación para evaluar las propiedades de insesgadez, eficiencia y consistencia de estos estimadores en diferentes tamaños de muestra.

Metodología

Simulación

Para realizar la evaluación de los estimadores, se llevará a cabo una simulación. La simulación consiste en los siguientes pasos:

  1. Generar muestras aleatorias de tamaño n de una distribución exponencial con parámetro θ = 20. Esto se realizará para cada uno de los cuatro estimadores y para diferentes tamaños de muestra (n = 20, 50, 100, 1000).

  2. Calcular los estimadores θ̂1, θ̂2, θ̂3 y θ̂4 para cada muestra.

  3. Repetir el proceso de simulación un gran número de veces (en este caso, 1000 veces) para cada tamaño de muestra.

  4. Almacenar los valores estimados en un data frame para su análisis posterior.

Análisis

Una vez completada la simulación, se analizarán los resultados en función de los tamaños de muestra. Se generará un gráfico de caja y bigotes para cada estimador y tamaño de muestra, lo que nos permitirá visualizar la distribución de los valores estimados y comparar el desempeño de los estimadores en términos de insesgadez, eficiencia y consistencia.

Código y Resultados

A continuación, se presenta el código R que se utilizó para llevar a cabo la simulación y el análisis:

# Definir una función para realizar la simulación
simulacion_estimadores <- function(n, m, theta) {
  # Generar todas las muestras aleatorias de tamaño n con distribución exponencial
  muestras <- matrix(rexp(n * m, rate = 1 / theta), ncol = n)
  
  # Calcular los estimadores para cada muestra
  estimador1 <- rowMeans(muestras[, c(1, 2, 3, 4)]) / 6 + rowMeans(muestras[, c(3, 4)]) / 3
  estimador2 <- rowMeans(muestras[, c(1, 2, 3, 4)]) / 2
  estimador3 <- rowMeans(muestras)
  estimador4 <- (apply(muestras, 1, min) + apply(muestras, 1, max)) / 2
  
  # Combinar los resultados en un data frame
  resultados <- data.frame(
    Tamaño_de_Muestra = rep(n, m),
    Estimador = rep(c("Estimador1", "Estimador2", "Estimador3", "Estimador4"), each = m),
    Valor_Estimado = c(estimador1, estimador2, estimador3, estimador4)
  )
  
  return(resultados)
}

# Tamaños de muestra a evaluar
tamanos_muestra <- c(20, 50, 100, 1000)
theta <- 20

# Realizar la simulación para diferentes tamaños de muestra
resultados_simulacion <- lapply(tamanos_muestra, function(n) simulacion_estimadores(n, 1000, theta))

# Combinar los resultados en un único data frame
resultados_df <- do.call(rbind, resultados_simulacion)

# Generar un gráfico de caja y bigotes para cada estimador
library(ggplot2)
ggplot(resultados_df, aes(x = factor(Tamaño_de_Muestra), y = Valor_Estimado, fill = Estimador)) +
  geom_boxplot() +
  labs(
    title = "Evaluación de Estimadores para Distribución Exponencial (θ = 20)",
    x = "Tamaño de Muestra",
    y = "Valor Estimado"
  ) +
  theme_minimal()

Resultados

Se generaron gráficos de caja y bigotes para cada uno de los cuatro estimadores en diferentes tamaños de muestra. Los gráficos muestran la distribución de los valores estimados para cada estimador y tamaño de muestra.

Conclusiones

  • En general, se observa que a medida que aumenta el tamaño de muestra, todos los estimadores tienden a ser menos sesgados y más eficientes.

  • El Estimador 4, que utiliza el mínimo y el máximo de la muestra, tiende a ser sesgado en todos los tamaños de muestra, pero su sesgo disminuye a medida que aumenta el tamaño de muestra.

  • El Estimador 3, que es simplemente el promedio de la muestra, parece ser el más insesgado y eficiente en todos los tamaños de muestra.

  • El Estimador 1 y el Estimador 2 también mejoran con el aumento del tamaño de muestra en términos de sesgo y eficiencia, pero tienden a ser menos insesgados que el Estimador 3.

En resumen, la elección del estimador depende de los objetivos específicos y las restricciones del problema. Si se valora la insesgadez y la eficiencia, el Estimador 3 es una buena elección, especialmente en tamaños de muestra grandes. Sin embargo, es importante recordar que cada estimador tiene sus ventajas y desventajas, y la elección debe basarse en el contexto y los requisitos del problema.