Problema 2

Propiedad de los estimadores

Suponga un valor para el parámetro θ

#Debemos establecer un valor para θ (Theta).

theta <- 2

Escribimos las funciones de los estimadores propuestos en el problema.

Estimador1 <- function(x) ((x[1] + x[2]) / 6) + ((x[3] + x[4]) / 3)
Estimador2 <- function(x) (x[1] + 2 * x[2] + 3 * x[3] + 4 * x[4]) / 5
Estimador3 <- function(x) mean(x)
Estimador4 <- function(x) (min(x) + max(x)) / 2

Genere una muestras de n=20, 50, 100 y 1000 para cada uno de los estimadores planteados.

# Tamaños de muestra
n_values <- c(20, 50, 100, 1000)
# Realizar simulaciones para cada tamaño de muestra

for (n in n_values) {
  # Almacenar los resultados de cada estimador
  resultados <- data.frame()

  # Realizar múltiples simulaciones
  num_simulaciones <- 1000
  for (sim in 1:num_simulaciones) {
    # Generar muestra aleatoria de la distribución exponencial
    #sample_data <- rexp(n, rate = 1/theta)
    sample_data <- rexp(4, rate = theta)

    # Calcular los valores de los estimadores
    est1 <- Estimador1(sample_data)
    est2 <- Estimador2(sample_data)
    est3 <- Estimador3(sample_data)
    est4 <- Estimador4(sample_data)

    # Almacenar resultados en el data frame
    resultados <- rbind(resultados, c(est1, est2, est3, est4))
  }

}

Evaluamos las propiedades de Insesgadez, eficiencia y consistencia.

# Calcular los sesgos, las varianzas de los estimadores y el error cuadrático medio (MSE)
  sesgos <- apply(resultados, 2, function(est) mean(est) - theta)
  varianzas <- apply(resultados, 2, var)
  mse <- rowMeans((resultados - theta)^2)
# Imprimir resultados
  cat("Tamaño de muestra:", n, "\n")
## Tamaño de muestra: 1000
  cat("Sesgos de los estimadores:", sesgos, "\n")
## Sesgos de los estimadores: -1.498612 -0.9973814 -1.497019 -1.41827
  cat("Varianzas de los estimadores:", varianzas, "\n")
## Varianzas de los estimadores: 0.06665589 0.2879485 0.06045579 0.09738098
  #cat("Errores cuadráticos medios de los estimadores:", mse, "\n")

Graficamos los resultados

# Cargar la librería necesaria para gráficos
library(ggplot2)

# Definir función para generar boxplots mejorados
plot_boxplots <- function(results, n) {
  est_labels <- c("θ1ˆ", "θ2ˆ", "θ3ˆ", "θ4ˆ")
  
  df <- data.frame(estimator = rep(est_labels, each = n),
                   value = as.vector(results))
  
  p <- ggplot(df, aes(x = estimator, y = value, fill = estimator)) +
    geom_boxplot() +
    labs(title = paste("Boxplots para Tamaño de muestra =", n),
         x = "Estimadores",
         y = "Valor") +
    theme_minimal() +
    theme(legend.position = "none")
  
  return(p)
}

# Realizar simulaciones y graficar los resultados
for (n in n_values) {
  results <- matrix(0, ncol = 4, nrow = 1000)
  for (sim in 1:1000) {
    sample_data <- rexp(n, rate = 1/theta)
    results[sim, 1] <- Estimador1(sample_data)
    results[sim, 2] <- Estimador2(sample_data)
    results[sim, 3] <- Estimador3(sample_data)
    results[sim, 4] <- Estimador4(sample_data)
  }
  
  p <- plot_boxplots(results, n)
  print(p)
}

Insesgadez

Los estimadores 1 y 3 son insesgados, ya que sus sesgos son 0 para todos los tamaños de muestra. El estimador 2 es ligeramente sesgado hacia arriba, mientras que el estimador 4 es ligeramente sesgado hacia abajo.

Consistencia

Todos los estimadores son consistentes, ya que sus sesgos convergen a 0 a medida que aumenta el tamaño de la muestra.

Eficiencia

El estimador 1 es el más eficiente, ya que tiene la varianza más baja para todos los tamaños de muestra. Los estimadores 2 y 3 tienen varianzas similares, mientras que el estimador 4 tiene la varianza más alta.

Conclusiones

En general, los estimadores 1 y 3 son los mejores, ya que son insesgados y consistentes, y tienen la varianza más baja. El estimador 2 es también aceptable, ya que es insesgado y consistente, pero tiene una varianza ligeramente mayor. El estimador 4 es el peor, ya que tiene un sesgo ligeramente negativo y una varianza muy alta.