La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
• θ1 = ((X1+X2) / 6) + ((X3+X4) / 3)
• θ2 = (X1+2X2+3X3+4X4) / 5
• θ3 = ((X1+X2+X3+X4) / 4)
• θ4 = ((min{X1,X2,X3,X4} ) + (max{X1,X2,X3,X4})) / 2
values = c(20, 50, 100, 1000)
lambda = 0.5
x1 = rexp(max(values),2)
x2 = rexp(max(values),2)
x3 = rexp(max(values),2)
x4 = rexp(max(values),2)
datos = data.frame(x1,x2,x3,x4)
estimar_n <- function(data,n){
muestra = data[sample(nrow(data), size=n), ]
dmin = apply(muestra,1,min)
dmax = apply(muestra,1,max)
estimadores = data.frame(
t1 = ((muestra$x1+muestra$x2)/6)+((muestra$x3+muestra$x4)/3),
t2 = (muestra$x1+2*muestra$x2+3*muestra$x3+4*muestra$x4)/5,
t3 = (muestra$x1+muestra$x2+muestra$x3+muestra$x4)/4,
t4 = (dmin+dmax)/2
)
summary(estimadores)
boxplot(estimadores, col = c("blue","green","orange","gray"))
abline(h=0.5, col = "red" )
medias = apply(estimadores, 2, mean)
varianza = apply(estimadores, 2, var)
sesgo = lambda - medias
print_table(medias, varianza, sesgo)
}
| Estimador | Media | Varianza | Sesgo |
|---|---|---|---|
| t1 | 0.5244765 | 0.0990685 | -0.0244765 |
| t2 | 1.0692051 | 0.4436834 | -0.5692051 |
| t3 | 0.5677776 | 0.0973772 | -0.0677776 |
| t4 | 0.7054278 | 0.1608844 | -0.2054278 |
| Estimador | Media | Varianza | Sesgo |
|---|---|---|---|
| t1 | 0.4592976 | 0.0514877 | 0.0407024 |
| t2 | 0.8985059 | 0.2179303 | -0.3985059 |
| t3 | 0.4731303 | 0.0462131 | 0.0268697 |
| t4 | 0.5319041 | 0.0556570 | -0.0319041 |
| Estimador | Media | Varianza | Sesgo |
|---|---|---|---|
| t1 | 0.4803610 | 0.0655187 | 0.0196390 |
| t2 | 0.9676538 | 0.3037041 | -0.4676538 |
| t3 | 0.4775235 | 0.0488035 | 0.0224765 |
| t4 | 0.5627360 | 0.0949789 | -0.0627360 |
| Estimador | Media | Varianza | Sesgo |
|---|---|---|---|
| t1 | 0.4920005 | 0.0690378 | 0.0079995 |
| t2 | 0.9777278 | 0.2958733 | -0.4777278 |
| t3 | 0.4945668 | 0.0587644 | 0.0054332 |
| t4 | 0.5753709 | 0.1005299 | -0.0753709 |
Se puede observar que los estimadores t1, t3 y t4 son insesgados, eficientes y consistentes, ya que su media tiende a acercarse al valor real del parámetro, su varianza tiende a disminuir y su sesgo tiende a cero a medida que el tamaño de la muestra aumenta. Por otro lado, el estimador t2 no es eficiente, puesto que a pesar de que su varianza disminuya, esta tiende a estabilizarse. También podemos observar que el estimador t2 no es concistente, debido a que su media tiende a no acercarse del valor real del parámetro a medida que el tamaño de la muestra aumenta, y como consecuencia generar un sesgo positivo ya que el valor de la media tiende a estar por encima del valor real del parámetro.
Es evidente que para obtener y evidenciar las propiedades de los estimadores, es necesario realizar una simulación con diferentes tamaños de muestra, debido a que nos permite evidenciar de forma clara y precisa las propiedades de los estimadores, y así poder tomar decisiones acertadas en la selección de los estimadores.