library(knitr)

Propiedades de los Estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son: insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean \(X_1\), \(X_2\), \(X_3\) y \(X_4\) una muestra aleatoria de tamaño \(n=4\) cuya población la conforma una distribución exponencial con parámetro \(θ\) desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

\[ \hat{θ_1} = (X_1 + X_2)/6 + (X_3 + X_4)/3 \]

\[ \hat{θ_2} = (X_1 + 2 * X_2 + 3 * X_3 + 4 * X_4) / 5 \]

\[ \hat{θ_3} = (X_1 + X_2 + X_3 + X_4) / 4 \]

\[ \hat{θ_4} = ( min(X_1, X_2, X_3, X_4) + max(X_1, X_2, X_3, X_4) ) / 2 \]

Nota:

  • Genere una muestras de \(n = 20, 50, 100\) y \(1000\) para cada uno de los estimadores planteados.

  • En cada caso evalue las propiedades de insesgadez, eficiencia y consistencia

  • Suponga un valor para el parámetro \(θ\)

  • Funciones recomendadas: function(){}, rexp(), data.frame(), apply(), boxplot()

Solución

Definición de las constantes a utilizar

N_SIMULACIONES <- 1000 #Define la cantidad de simulaciones a realizar
THETA_REAL <- 2 #Define el valor real de theta

Definición de las funciones a utilizar

Paso 1: Definción de los estimadores

#Definición del estimador theta 1 ---------------------------------
theta_1 <- function(x){
  return( (x[1] + x[2]) / 6 + (x[3] + x[4]) / 3 )
}

#Definición del estimador theta 2 ---------------------------------
theta_2 <- function(x){
  return( (x[1] + 2 * x[2] + 3 * x[3] + 4 * x[4] ) / 5 )
}

#Definición del estimador theta 3 ---------------------------------
theta_3 <- function(x){
  return( (x[1] + x[2] + x[3] + x[4]) / 4 )
}

#Definición del estimador theta 4 ---------------------------------
theta_4 <- function(x){
  return( (min(x) + max(x)) / 2 )
}

Paso 2: Denifinición de la función encargada de realizar el muestro según el tamaño de n y la cantidad de simulaciones

muestreo <- function(n, valor_theta_real, simulaciones){
  #Define el dataframe que guardará el resultado de las simulaciones
  estimaciones = data.frame( 
    theta_1 = numeric(0),
    theta_2 = numeric(0),
    theta_3 = numeric(0),
    theta_4 = numeric(0)
  )
  
  #Ejecución de las simulaciones
  for (i in 1:simulaciones) {
    x_muestra = rexp(n, rate = (1/valor_theta_real))
    nuevo_registro <- data.frame(
      theta_1 = theta_1(x = x_muestra),
      theta_2 = theta_2(x = x_muestra),
      theta_3 = theta_3(x = x_muestra),
      theta_4 = theta_4(x = x_muestra)
    )
    estimaciones <- rbind(estimaciones, nuevo_registro)
  }
  return(estimaciones)
}

Paso 3: Para calcular el sesgo de cada estimador se utilizó la siguiente ecuación:\[ Sesgo = θ_{verdadero} - Promedio(\hat {θ}) \]

Donde:

\(\hat{θ}\) son las estimaciones realizadas por cada estimador

sesgo <- function(theta_verd, theta_est){
  return( theta_verd - mean(theta_est) )
}

Paso 4: Para calcular la eficiencia de cada estimador se utilizó la siguiente ecuación

\[ Eficiencia = Varianza Del Estimador + (SesgoDelEstimador)^2 \]

eficiencia <- function(sesgo_est, theta_est){
  return( var(theta_est) + (sesgo_est) ^ 2 )
}

Paso 5: Para calcular la consistencia de cada estimador se utilizó la siguiente ecuación

\[ Consistencia = (1/n) * \sum_{i=1}^{n} (\hat {θ} - θ_{verdadero})^2 \]

consistencia <- function(theta_verd, theta_est, n){
  sumatoria <- 0
  for (i in 1:n) {
    sumatoria <- sumatoria + (theta_est[i] - theta_verd) ^ 2
  }
  return(sumatoria / n)
}

Paso 6: Función encargada de cálcular las propiedades de los estimadores

propiedades_estimadores <- function(tamanio_muestra) {

  #Cálculo del tamanio de la muestra
  muestra <- muestreo(
    n = tamanio_muestra, 
    valor_theta_real = THETA_REAL,
    simulaciones = N_SIMULACIONES
  )
  vector_theta <- c('theta_1', 'theta_2', 'theta_3', 'theta_4')
  
  #Dataframe para almacenar las propiedades de los cuatro estimadores
  propiedades <- data.frame(
    sesgo         = numeric(0),
    eficiencia    = numeric(0),
    consistencia  = numeric(0)
  )
  
  for (i in 1:4) {
    #Cálculo del sesgo
    val_sesgo <- sesgo(
      theta_verd = THETA_REAL, 
      theta_est = muestra[[vector_theta[i]]]
    )
    #Cálculo de la eficiencia
    val_eficiencia <- eficiencia(
      sesgo_est = val_sesgo,
      theta_est = muestra[[vector_theta[i]]]
    )
    #Cálculo de la consistencia
    val_consistencia <- consistencia(
      theta_verd = THETA_REAL,
      theta_est = muestra[[vector_theta[i]]],
      n = tamanio_muestra
    )
    
    nuevo_registro <- data.frame(
      sesgo         = val_sesgo,
      eficiencia    = val_eficiencia,
      consistencia  = val_consistencia
    )
    
    propiedades <- rbind(propiedades, nuevo_registro)
  }
  rownames(propiedades) <- vector_theta
  
  return(propiedades)
}

Cálculo de las propiedades de los estimadores

Paso 7: Cálculo del sesgo, eficiencia y consistencia para \(\hat {θ_1}\), \(\hat {θ_2}\), \(\hat {θ_3}\) y \(\hat {θ_4}\) para \(n=20\)

kable(propiedades_estimadores(tamanio_muestra = 20))
sesgo eficiencia consistencia
theta_1 -0.0193546 1.146958 1.2100772
theta_2 -2.0504656 9.275935 9.3900683
theta_3 -0.0344365 1.073887 0.8513522
theta_4 -1.6738787 4.425588 4.9091157

Paso 8: Cálculo del sesgo, eficiencia y consistencia para \(\hat {θ_1}\), \(\hat {θ_2}\), \(\hat {θ_3}\) y \(\hat {θ_4}\) para \(n=50\)

kable(propiedades_estimadores(tamanio_muestra = 50))
sesgo eficiencia consistencia
theta_1 0.0295579 1.0897998 1.264263
theta_2 -1.9364824 8.3515079 10.016322
theta_3 0.0265222 0.9964499 1.019615
theta_4 -2.5105701 7.9507832 6.537535

Paso 9: Cálculo del sesgo, eficiencia y consistencia para \(\hat {θ_1}\), \(\hat {θ_2}\), \(\hat {θ_3}\) y \(\hat {θ_4}\) para \(n=100\)

kable(propiedades_estimadores(tamanio_muestra = 100))
sesgo eficiencia consistencia
theta_1 0.0858914 1.0574711 1.298671
theta_2 -1.8284731 7.8564415 9.678618
theta_3 0.0891418 0.9825276 1.251668
theta_4 -3.2551946 12.1851526 12.894553

Paso 10: Cálculo del sesgo, eficiencia y consistencia para \(\hat {θ_1}\), \(\hat {θ_2}\), \(\hat {θ_3}\) y \(\hat {θ_4}\) para \(n=1000\)

kable(propiedades_estimadores(tamanio_muestra = 1000))
sesgo eficiencia consistencia
theta_1 0.0261922 1.0030144 1.0020121
theta_2 -1.9567492 8.1992458 8.1948754
theta_3 0.0363486 0.8723245 0.8714535
theta_4 -5.5006659 31.8139241 31.8123675

Conclusión

Entre los cuatro estimadores se considera que el estimador 3 sobresale como la elección óptima por las siguientes razones:

  • Durante las simulaciones con diversos tamaños de muestra, este estimador tiende a exhibir el menor sesgo.

  • De los cuatro, este estimador destaca por su eficiencia sobresaliente.

  • Además, se nota que su consistencia es relativamente baja y empieza a decrecer a medida que se aumenta el tamaño de las muestras.