Propiedades de los estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

θ1ˆ=X1+X26+X3+X43

θ2ˆ=(X1+2X2+3X3+4X4)5

θ3ˆ=X1+X2+X3+X44

θ4ˆ=min{X1,X2,X3,X4}+max{X1,X2,X3,X4}2

# Seed para reproducibilidad
set.seed(123)

# Definir valor theta
theta_real <- 1

# Definir tamaños de muestra
n_sizes <- c(20, 50, 100, 1000)

Definir los Estimadores

Ahora, calcular cada estimador.

# Estimador 1
theta1_hat <- function(sample) {
  return((sample[1] + sample[2]/6 + sample[3] + sample[4]/3)/4)
}

# Estimador 2
theta2_hat <- function(sample) {
  return((sample[1] + 2*sample[2] + 3*sample[3] + 4*sample[4])/5)
}

# Estimador 3
theta3_hat <- function(sample) {
  return(mean(sample))
}

# Estimador 4
theta4_hat <- function(sample) {
  return((min(sample) + max(sample))/2)
}

Simular y Calcular las Propiedades

Simular las muestras para cada tamaño de muestra y calcular los estimadores.

# Función para simular los estimadores
simulate_estimators <- function(n, theta_real) {
  # Vector para guardar resultados
  results <- data.frame(theta1=numeric(), theta2=numeric(), theta3=numeric(), theta4=numeric())
  
  # Generar muestras y calcular estimadores
  for (i in 1:1000) { # Hacer 1000 simulaciones
    sample <- rexp(n, rate = 1/theta_real)
    theta1 <- theta1_hat(sample)
    theta2 <- theta2_hat(sample)
    theta3 <- theta3_hat(sample)
    theta4 <- theta4_hat(sample)
    
    # Añadir los resultados al data frame
    results <- rbind(results, c(theta1, theta2, theta3, theta4))
  }
  
  return(results)
}

# Calcular propiedades para cada tamaño de muestra
for (n in n_sizes) {
  print(paste("Tamaño de muestra:", n))
  results <- simulate_estimators(n, theta_real)
  
  # Calcular sesgo y varianza para cada estimador
  for (estimator in names(results)) {
    bias <- mean(results[[estimator]]) - theta_real
    variance <- var(results[[estimator]])
    
    print(paste(estimator, "Sesgo:", bias, "Varianza:", variance))
  }
  print("\n")
}
## [1] "Tamaño de muestra: 20"
## [1] "X0.569784906762297 Sesgo: -0.361870976954591 Varianza: 0.143496701185482"
## [1] "X1.22203036853742 Sesgo: 0.960005444043966 Varianza: 1.16106136258608"
## [1] "X0.81117264380793 Sesgo: 0.00346480634467028 Varianza: 0.0493041009633357"
## [1] "X2.03508257922753 Sesgo: 0.822879277007773 Varianza: 0.403105727180691"
## [1] "\n"
## [1] "Tamaño de muestra: 50"
## [1] "X1.22880485740159 Sesgo: -0.369932161511397 Varianza: 0.139062935539574"
## [1] "X2.56612255163404 Sesgo: 0.997433728666546 Varianza: 1.06485054870442"
## [1] "X1.21645175844262 Sesgo: -0.0034754912373236 Varianza: 0.0198076971950066"
## [1] "X2.2276200299288 Sesgo: 1.20658985833951 Varianza: 0.363902457102524"
## [1] "\n"
## [1] "Tamaño de muestra: 100"
## [1] "X0.449831906622834 Sesgo: -0.397789225461531 Varianza: 0.114040309013342"
## [1] "X2.63048271761528 Sesgo: 1.00741280610686 Varianza: 1.21267480739244"
## [1] "X1.03796310851581 Sesgo: -0.00447501668756756 Varianza: 0.00989654326948859"
## [1] "X2.76878141038318 Sesgo: 1.6006369473187 Varianza: 0.378197058168131"
## [1] "\n"
## [1] "Tamaño de muestra: 1000"
## [1] "X0.223020948134929 Sesgo: -0.384969207603237 Varianza: 0.124577065201563"
## [1] "X1.641875344386 Sesgo: 0.924454417642733 Varianza: 1.14796152844143"
## [1] "X0.989864824986585 Sesgo: -0.000339078616254818 Varianza: 0.000947507325382337"
## [1] "X4.13299649697906 Sesgo: 2.7653787127983 Varianza: 0.421870263015189"
## [1] "\n"

Comportamiento de los estimadores con tamaños de muestra variables: Cuatro estimadores (X0, X1, X2, X3) se evalúan en términos de sesgo y varianza a medida que aumenta el tamaño de la muestra (n).

Estimador X0:

Sesgo: Negativo constante (-0.36 a -0.37) para todos los tamaños de muestra, lo que implica un sesgo sistemático que no disminuye. Varianza: Relativamente baja, sin un patrón claro de disminución o aumento con tamaños de muestra más grandes.

Estimador X1:

Sesgo: Varía entre 0,96 y 1,01 en tamaños de muestra pequeños. * Aumenta significativamente a 2,77 en el tamaño de muestra más grande (1000), lo que indica un sesgo constante que se intensifica con muestras más grandes. Varianza: Es bastante alta. Aumenta con el tamaño de la muestra, lo que indica una menor precisión de las estimaciones al aumentar el número de observaciones.

Estimador X2:

Sesgo: El estimador X2 tiene un sesgo muy bajo en todos los tamaños de muestra. Se acerca a cero a medida que el tamaño de la muestra se aproxima a 1000, lo que demuestra su falta de sesgo y consistencia. Varianza: La varianza de X2 disminuye significativamente con el aumento del tamaño de la muestra. Esto indica que el estimador es más eficiente y consistente.

Estimador X3:

Sesgo: El sesgo aumenta a medida que aumenta el tamaño de la muestra, especialmente cuando se llega a 1000, momento en el que el sesgo se dispara a 2,77. Esto significa que el estimador tiende a sobreestimar el valor real más a medida que el tamaño de la muestra aumenta. Varianza: La varianza aumenta ligeramente con el tamaño de la muestra, pero se mantiene relativamente baja. Esto indica que las estimaciones son relativamente consistentes en términos de dispersión, incluso a medida que aumenta el tamaño de la muestra.

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.