Propiedades de los estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean \(X_{1}\), \(X_{2}\), \(X_{3}\) y \(X_{4}\) una muestra aleatoria de tamaño \(n = 4\) cuya población la conforma una distribución exponencial con parámetro \(θ\) desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

  • \(\widehat{θ_{1}}= \frac{X_{1}+X_{2}}{6} + \frac{X_{3}+X_{4}}{3}\)

  • \(\widehat{θ_{2}}= \frac{(X_{1} + 2X_{2} + 3X_{3} + 4X_{4})}{5}\)

  • \(\widehat{θ_{3}}= \frac{(X_{1} + X_{2} + X_{3} + X_{4})}{4}\)

  • \(\widehat{θ_{4}}= \frac{min(X_{1} , X_{2} , X_{3} , X_{4}) + max(X_{1} , X_{2} , X_{3} , X_{4})}{2}\)

Método solución

Creación de función principal

Se ha creado una función que permite realizar un número variable de simulaciones, de acuerdo a las necesidades.

Los parámetros de esta función son los siguientes:

N_Simul: Número de simulaciones a realizar. Parametro_Exp: Parámetro de la distribución exponencial que se emplea en las simulaciones.

# Establecer una semilla
set.seed(4812)

Muestra_Aleatoria <- function(N_Simul, Parametro_Exp)
  {
    #Se crea una lista vacia
    Datos_Acum <- list()
    
    #Inicia el ciclo
    for (i in 1:N_Simul) 
      {
    Xi <- rexp(4,Parametro_Exp)
    
        theta1 = (Xi[1] + Xi[2]) / 6 + (Xi[3] + Xi[4]) / 3
        theta2 = (Xi[1] + 2 * Xi[2] + 3 * Xi[3] + 4 * Xi[4]) / 5
        theta3 = (Xi[1]+Xi[2]+Xi[3]+Xi[4]) / 4
        theta4 = (min(Xi[1],Xi[2],Xi[3],Xi[4]) + max(Xi[1],Xi[2],Xi[3],Xi[4])) / 2
        
    Datos <- data.frame(theta1, theta2, theta3 , theta4)
    
        # Acumular resultados
          if (i == 1) 
            {Datos_Acum <- Datos} 
          else 
            {Datos_Acum <- rbind(Datos_Acum, Datos)}
     }
  return(Datos_Acum)
  
  }

Creación de función para resultados

Se ha desarrollado una función que permite llevar a cabo simulaciones con los siguientes parámetros:

Sm: Número de simulaciones.

Ra: Parámetro de la distribución exponencial.

Esta función realiza la simulación y presenta los resultados de manera visual mediante un Boxplot, así como una tabla que resume las propiedades de los estimadores utilizados en la simulación.

Graficos_Propiedades <- function(Sm, Ra)
{
  Simulación <- Muestra_Aleatoria(N_Simul = Sm, Parametro_Exp =  Ra)

  #Mostrar las primeras simulaciones
  cat("\nPrimeras filas de simulación:\n")
  print(head(Simulación))

  #Crear un boxplot
  boxplot(Simulación,
        col= c("#FFFFE0", "#E6E6FA", "#87CEEB","#98FB98", "#FFB6C1"),
        main= paste("Boxplot - Muestra:", Sm))
  
  #Línea punteada
  segments(0, 1/Ra , 5, 1/Ra , col = "darkgreen", lty = 2)

  Valor_Del_Parametro <- 1/Ra

  SesgoTheta1 <- mean(Simulación$theta1) - Valor_Del_Parametro
  SesgoTheta2 <- mean(Simulación$theta2) - Valor_Del_Parametro
  SesgoTheta3 <- mean(Simulación$theta3) - Valor_Del_Parametro
  SesgoTheta4 <- mean(Simulación$theta4) - Valor_Del_Parametro

  #Crear la tabla para las propiedades
  tabla_Prop <- data.frame(
    Estimador = c("Theta1", "Theta2", "Theta3", "Theta4"),
    Valor_Parametro= c(Valor_Del_Parametro,Valor_Del_Parametro,Valor_Del_Parametro,Valor_Del_Parametro),
    Media = c(mean(Simulación$theta1),mean(Simulación$theta2),mean(Simulación$theta3),mean(Simulación$theta4)),
    Sesgo = c(SesgoTheta1, SesgoTheta2, SesgoTheta3, SesgoTheta4),
    Varianza = c(var(Simulación$theta1),var(Simulación$theta2),var(Simulación$theta3),var(Simulación$theta4) )
  )

  return(tabla_Prop)

}

Analizando 20 simulaciones

Graficos_Propiedades(Sm= 20, Ra= 0.1)
## 
## Primeras filas de simulación:
##      theta1   theta2    theta3    theta4
## 1  7.686540 14.05629  8.177644  6.892725
## 2 12.952227 29.30038 11.805015 14.818655
## 3 10.384925 19.43822 10.923835 10.738455
## 4 12.808774 27.62911 10.932461 14.085050
## 5  6.924143 15.34932  8.400607 12.829999
## 6 19.107783 35.55082 16.287593 22.814982

Estimador Valor_Parametro Media Sesgo Varianza
Theta1 10 9.971388 -0.0286124 21.38500
Theta2 10 19.889789 9.8897891 88.79377
Theta3 10 10.230795 0.2307947 17.93064
Theta4 10 11.939128 1.9391278 32.98881

Analizando 50 simulaciones

Graficos_Propiedades(Sm= 50, Ra= 0.1)
## 
## Primeras filas de simulación:
##      theta1    theta2    theta3    theta4
## 1  3.690835  7.577692  4.195573  5.190368
## 2  4.008498  8.360610  3.804430  4.416636
## 3  9.858530 23.294449  8.393362 12.788866
## 4 18.577672 38.390866 17.014037 15.488869
## 5 12.971105 23.074844 13.638386 15.640227
## 6 10.206980 22.191813 12.066179 17.643776

Estimador Valor_Parametro Media Sesgo Varianza
Theta1 10 9.257032 -0.7429678 20.12111
Theta2 10 18.616856 8.6168563 83.71130
Theta3 10 9.415964 -0.5840363 18.10427
Theta4 10 11.210872 1.2108719 28.51771

Analizando 100 simulaciones

Graficos_Propiedades(Sm= 100, Ra= 0.1)
## 
## Primeras filas de simulación:
##      theta1   theta2    theta3    theta4
## 1 10.876098 16.27891 12.958967 19.032890
## 2 10.707835 23.11661 12.147618 16.466967
## 3  7.641596 14.56538  8.414311  9.436116
## 4 10.376808 21.07180  8.023179  8.983667
## 5  6.412889 13.20746  6.445938  6.545086
## 6  7.447004 15.33238  6.945686  6.351079

Estimador Valor_Parametro Media Sesgo Varianza
Theta1 10 10.11531 0.1153075 24.64950
Theta2 10 20.43623 10.4362296 102.76938
Theta3 10 10.03299 0.0329929 22.53336
Theta4 10 11.55327 1.5532686 35.64411

Analizando 1000 simulaciones

Graficos_Propiedades(Sm= 1000, Ra= 0.1)
## 
## Primeras filas de simulación:
##      theta1    theta2    theta3    theta4
## 1  2.880410  5.567768  2.587444  2.362937
## 2 14.354529 29.397485 12.823288 12.941209
## 3  7.663774 14.458939  9.512474  9.835298
## 4 11.140718 21.338342  9.790537 13.498450
## 5  7.087895 12.042101  8.510343 12.422119
## 6 11.635716 25.018602 12.497499 15.082848

Estimador Valor_Parametro Media Sesgo Varianza
Theta1 10 9.992229 -0.0077707 28.06292
Theta2 10 19.973710 9.9737100 123.44975
Theta3 10 9.868477 -0.1315231 24.49784
Theta4 10 11.490063 1.4900628 38.79046

Conclusión

Al comparar los estimadores \(\widehat{θ_{1}}\), \(\widehat{θ_{2}}\), \(\widehat{θ_{3}}\) y \(\widehat{θ_{4}}\) en función de sus propiedades de insesgadez, eficiencia y consistencia, observamos patrones que revelan similitudes y diferencias entre ellos a medida que se aumenta el número de simulaciones.

\(\widehat{θ_{1}}\) y \(\widehat{θ_{3}}\) son similares en términos de insesgadez, eficiencia y consistencia. Ambos estimadores muestran una mejora constante a medida que se acumulan más datos, disminuyendo su sesgo y varianza. Esto sugiere que estos estimadores tienden a aproximarse al valor real del parámetro (10) y a mejorar su precisión a medida que se obtiene más información.

\(\widehat{θ_{4}}\) también muestra características positivas, mostrando menos sesgo, mayor eficiencia y mejor consistencia a medida que se aumenta el número de simulaciones. Aunque sus mejoras son evidentes, puede no ser tan eficiente como Theta1 y Theta3 en términos de varianza.

Por otro lado, \(\widehat{θ_{2}}\) destaca como el estimador con un sesgo más alto en comparación con los demás. A pesar de que su sesgo disminuye a medida que se acumulan más datos, sigue siendo menos deseable en términos de insesgadez. Sin embargo, su eficiencia y consistencia mejoran con más iteraciones, lo que indica que se vuelve más preciso con una mayor cantidad de información.