Ejercicio

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

• θ1 = ((X1+X2) / 6) + ((X3+X4) / 3)

• θ2 = (X1+2X2+3X3+4X4) / 5

• θ3 = ((X1+X2+X3+X4) / 4)

• θ4 = ((min{X1,X2,X3,X4} ) + (max{X1,X2,X3,X4})) / 2

Código

values = c(20, 50, 100, 1000)
lambda = 0.5

x1 = rexp(max(values),2)
x2 = rexp(max(values),2)
x3 = rexp(max(values),2)
x4 = rexp(max(values),2)

datos = data.frame(x1,x2,x3,x4)

estimar_n <- function(data,n){
  muestra = data[sample(nrow(data), size=n), ]
  
  dmin = apply(muestra,1,min)
  dmax = apply(muestra,1,max)
  
  estimadores = data.frame(
    t1 = ((muestra$x1+muestra$x2)/6)+((muestra$x3+muestra$x4)/3),
    t2 = (muestra$x1+2*muestra$x2+3*muestra$x3+4*muestra$x4)/5,
    t3 = (muestra$x1+muestra$x2+muestra$x3+muestra$x4)/4,
    t4 = (dmin+dmax)/2
  )
  
  summary(estimadores)
  boxplot(estimadores, col = c("blue","green","orange","gray"))
  abline(h=0.5, col = "red" )
  
  
  medias = apply(estimadores, 2, mean)
  varianza = apply(estimadores, 2, var)
  sesgo = lambda - medias 

  print_table(medias, varianza, sesgo)
}

Muestra n=20

Estimador Media Varianza Sesgo
t1 0.5244765 0.0990685 -0.0244765
t2 1.0692051 0.4436834 -0.5692051
t3 0.5677776 0.0973772 -0.0677776
t4 0.7054278 0.1608844 -0.2054278

Muestra n=50

Estimador Media Varianza Sesgo
t1 0.4592976 0.0514877 0.0407024
t2 0.8985059 0.2179303 -0.3985059
t3 0.4731303 0.0462131 0.0268697
t4 0.5319041 0.0556570 -0.0319041

Muestra n=100

Estimador Media Varianza Sesgo
t1 0.4803610 0.0655187 0.0196390
t2 0.9676538 0.3037041 -0.4676538
t3 0.4775235 0.0488035 0.0224765
t4 0.5627360 0.0949789 -0.0627360

Muestra n=1000

Estimador Media Varianza Sesgo
t1 0.4920005 0.0690378 0.0079995
t2 0.9777278 0.2958733 -0.4777278
t3 0.4945668 0.0587644 0.0054332
t4 0.5753709 0.1005299 -0.0753709

Conclusiones

Se puede observar que los estimadores t1, t3 y t4 son insesgados, eficientes y consistentes, ya que su media tiende a acercarse al valor real del parámetro, su varianza tiende a disminuir y su sesgo tiende a cero a medida que el tamaño de la muestra aumenta. Por otro lado, el estimador t2 no es eficiente, puesto que a pesar de que su varianza disminuya, esta tiende a estabilizarse. También podemos observar que el estimador t2 no es concistente, debido a que su media tiende a no acercarse del valor real del parámetro a medida que el tamaño de la muestra aumenta, y como consecuencia generar un sesgo positivo ya que el valor de la media tiende a estar por encima del valor real del parámetro.

Es evidente que para obtener y evidenciar las propiedades de los estimadores, es necesario realizar una simulación con diferentes tamaños de muestra, debido a que nos permite evidenciar de forma clara y precisa las propiedades de los estimadores, y así poder tomar decisiones acertadas en la selección de los estimadores.