Problema 2: Propiedades de los estimadores

La simulación ayuda a entender y validar las propiedades de los estimadores estadísticos como son: insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

\[\hat{θ1} = (X_1+X_2)/6 + (X_3+X_4)/3\]

\[\hat{θ2} = (X_1+2X_2+3X_3+4X_4)/5\] \[\hat{θ3} = (X_1+X_2+X_3+X_4)/4\] \[\hat{θ4} = min[X_1,X_2,X_3,X_4]+max[X_1,X_2,X_3,X_4]/2\]

Lambda <- 2

PrimeraM <- vector("numeric") #Creacion de vectores vacios para recolectar resultados de iteración
SegundaM <- vector("numeric")
TerceraM <- vector("numeric")
CuartaM  <- vector("numeric")
x1 <- list() # Creacion de listas de recolección de los 4 primeros registros acorde a iteracciones
x2 <- list()
x3 <- list()
x4 <- list()

Propiedades <- function(x, y){
  for (i in seq(1, x)) {
    Muestra <- rexp(4, y)
    # Aplicacion de formulas segun estimador
    PrimeraM[i] <- (Muestra[1] + Muestra[2])/6 + (Muestra[3] + Muestra[4])/3
    SegundaM[i] <- (Muestra[1] + 2*Muestra[2] + 3*Muestra[3] + 4*Muestra[4])/5
    TerceraM[i] <- (Muestra[1] + Muestra[2] + Muestra[3] + Muestra[4])/4
    CuartaM[i]  <- min(c(Muestra[1],Muestra[2],Muestra[3],Muestra[4])) + max(c(Muestra[1],Muestra[2],Muestra[3],Muestra[4]))/2
    
    # Creación de vectores de respuesta por estimador
  subx1 <- Muestra[1]
  subx2 <- Muestra[2]
  subx3 <- Muestra[3]
  subx4 <- Muestra[4]
  
    # Respuestas por estimador condensadas
  x1 <- append(x1, subx1)
  x2 <- append(x2, subx2)
  x3 <- append(x3, subx3)
  x4 <- append(x4, subx4)
  
    # Creación de base de datos y conversion de clase a cada variable
  df <- cbind(x1, x2, x3, x4)
  df <- as.data.frame(df)
 df$x1 <- as.numeric(df$x1)
 df$x2 <- as.numeric(df$x2)
 df$x3 <- as.numeric(df$x3)
 df$x4 <- as.numeric(df$x4)
 
    # Pasar columnas a filas para graficar
 df_2 <- pivot_longer(df, cols = c(x1,x2,x3,x4),
names_to = "Estimadores",
values_to = "Values")

    #Grafico boxplot
d <- ggplot(df_2, aes(x = Estimadores, y = Values))+
  geom_boxplot(aes(fill = Estimadores))+ geom_jitter(alpha = 0.5)

  }
  # Retorno de dos salidas, por un lado el resgistro de medias y varianzas; y por otro, gráfico representativos de las observaciones segun muestra
  return(
    list(Respuestas = cat(
      paste("Media Primer estimador:", round(mean(PrimeraM),2)),
      paste("Media Segundo estimador:", round(mean(SegundaM),2)),
      paste("Media Tercer estimador:", round(mean(TerceraM),2)),
      paste("Media Cuarto estimador:" , round(mean(CuartaM),2)),
      paste("Varianza Primer estimador:", round(var(PrimeraM),2)),
      paste("Varianza Segundo estimador:", round(var(SegundaM),2)),
      paste("Varianza Tercer estimador:", round(var(TerceraM),2)),
      paste("Varianza Cuarto estimador:" , round(var(CuartaM),2)),
      sep = "\n"
      ), Grafico_boxplot = d)
  )
}
Itera_1 <- 20
Propiedades(Itera_1, Lambda) #Respuesta al punto c
## Media Primer estimador: 0.5
## Media Segundo estimador: 0.99
## Media Tercer estimador: 0.49
## Media Cuarto estimador: 0.63
## Varianza Primer estimador: 0.1
## Varianza Segundo estimador: 0.45
## Varianza Tercer estimador: 0.08
## Varianza Cuarto estimador: 0.14
## $Respuestas
## NULL
## 
## $Grafico_boxplot

Itera_2 <- 50
Propiedades(Itera_2, Lambda)
## Media Primer estimador: 0.47
## Media Segundo estimador: 0.95
## Media Tercer estimador: 0.47
## Media Cuarto estimador: 0.64
## Varianza Primer estimador: 0.07
## Varianza Segundo estimador: 0.3
## Varianza Tercer estimador: 0.05
## Varianza Cuarto estimador: 0.1
## $Respuestas
## NULL
## 
## $Grafico_boxplot

Itera_3 <- 100
Propiedades(Itera_3, Lambda)
## Media Primer estimador: 0.5
## Media Segundo estimador: 1.01
## Media Tercer estimador: 0.49
## Media Cuarto estimador: 0.62
## Varianza Primer estimador: 0.05
## Varianza Segundo estimador: 0.25
## Varianza Tercer estimador: 0.04
## Varianza Cuarto estimador: 0.07
## $Respuestas
## NULL
## 
## $Grafico_boxplot

Itera_4 <- 1000
Propiedades(Itera_4, Lambda)
## Media Primer estimador: 0.51
## Media Segundo estimador: 1.01
## Media Tercer estimador: 0.5
## Media Cuarto estimador: 0.65
## Varianza Primer estimador: 0.08
## Varianza Segundo estimador: 0.33
## Varianza Tercer estimador: 0.07
## Varianza Cuarto estimador: 0.13
## $Respuestas
## NULL
## 
## $Grafico_boxplot

Conclusiones

Los resultados dependeran de la ejecución del codigo dado a la aletoriedad de escogencia de las variables, sin embargo, el comportamiento de los estimadores tiende a ser el mismo, por ello, por propiedad de las estimaciones evaluadas se tiene que:

  • El primer, segundo y tercer estimador podemos observar que es consistente dado a que el aumento gradual del tamaño de la muestra la acerca más a la media.

  • El segundo estimador no es consistente dado a que se aleja mucho de la media.

  • El primer, tercer y cuarto estimador presenta insesgadez dada su cercania con la media.

  • El tercer estimador es aquel que presenta menor varianza.

  • El mejor estimador de los evaluados es el tercero