La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
θ1=(X1+X2)/6+(X3+X4)/3
θ2=(X1+2X2+3X3+4*X4)/5
θ3=(X1+X2+X3+X4)/4
θ4=(min{X1,X2,X3,X4}+max{X1,X2,X3,X4})/2
## Se hace simulacion con una muestra de 20, se visualiza en el grafico de cajas de la siguiente manera.
## t1 t2 t3 t4
## Min. :0.6383 Min. : 1.429 Min. :0.8236 Min. :1.225
## 1st Qu.:1.4075 1st Qu.: 2.765 1st Qu.:1.4202 1st Qu.:1.441
## Median :1.8321 Median : 3.588 Median :1.8055 Median :2.078
## Mean :2.0708 Mean : 4.088 Mean :2.0343 Mean :2.402
## 3rd Qu.:2.3790 3rd Qu.: 4.914 3rd Qu.:2.4166 3rd Qu.:2.654
## Max. :5.5113 Max. :10.112 Max. :4.5191 Max. :7.496
la varianza para θ1 para un muestreo de n=20 (t1) es de
:1.0885332
la varianza para θ2 para un muestreo de n=20 (t2) es de
:3.507508
la varianza para θ3 para un muestreo de n=20 (t3) es de
:0.7943927
la varianza para θ4 para un muestreo de n=20 (t4) es de
:2.0829069
El estimador θ3 es el de menor sesgo y menor
variabilidad por lo tanto es más eficiente.
## Se hace simulacion con una muestra de 50, se visualiza en el grafico de cajas de la siguiente manera.
## t11 t22 t33 t44
## Min. :0.5102 Min. :1.064 Min. :0.6093 Min. :0.676
## 1st Qu.:1.4591 1st Qu.:2.886 1st Qu.:1.4432 1st Qu.:1.605
## Median :1.9465 Median :4.084 Median :1.9781 Median :2.017
## Mean :2.0625 Mean :4.130 Mean :2.0430 Mean :2.274
## 3rd Qu.:2.6326 3rd Qu.:5.289 3rd Qu.:2.6419 3rd Qu.:2.901
## Max. :4.3065 Max. :9.069 Max. :3.9782 Max. :4.871
la varianza para θ1 para un muestreo de n=50 (t11) es de
:0.8127212
la varianza para θ2 para un muestreo de n=50 (t22) es de
:3.3892327
la varianza para θ3 para un muestreo de n=50 (t33) es de
:0.7031238
la varianza para θ4 para un muestreo de n=50 (t44) es de
:1.0177557
El estimador θ3 es el de menor sesgo y menor
variabilidad por lo tanto es más eficiente.
## Se hace simulacion con una muestra de 100, se visualiza en el grafico de cajas de la siguiente manera.
## t111 t222 t333 t444
## Min. :0.2884 Min. :0.6546 Min. :0.3359 Min. :0.4784
## 1st Qu.:1.1878 1st Qu.:2.4492 1st Qu.:1.2645 1st Qu.:1.4818
## Median :1.9002 Median :3.7662 Median :1.8003 Median :2.1112
## Mean :1.9959 Mean :4.0438 Mean :1.9929 Mean :2.3376
## 3rd Qu.:2.4386 3rd Qu.:5.2135 3rd Qu.:2.5811 3rd Qu.:3.0610
## Max. :4.9961 Max. :9.7441 Max. :4.8329 Max. :5.6426
la varianza para θ1 para un muestreo de n=100 (t111) es de
:1.0865853
la varianza para θ2 para un muestreo de n=100 (t222) es
de :4.4094993
la varianza para θ3 para un muestreo de n=100 (t333)
es de :0.9607281
la varianza para θ4 para un muestreo de n=100
(t444) es de :1.4199101
El estimador θ3 es el de menor sesgo y
menor variabilidad por lo tanto es más eficiente.
## Se hace simulacion con una muestra de 1000, se visualiza en el grafico de cajas de la siguiente manera.
## t1111 t2222 t3333 t4444
## Min. :0.1792 Min. : 0.369 Min. :0.2253 Min. :0.2535
## 1st Qu.:1.2131 1st Qu.: 2.359 1st Qu.:1.2530 1st Qu.:1.4214
## Median :1.8361 Median : 3.558 Median :1.8149 Median :2.0778
## Mean :2.0079 Mean : 4.012 Mean :2.0101 Mean :2.3498
## 3rd Qu.:2.5642 3rd Qu.: 5.149 3rd Qu.:2.5631 3rd Qu.:3.0682
## Max. :7.1958 Max. :16.300 Max. :8.2596 Max. :9.1370
la varianza para θ1 para un muestreo de n=1000 (t1211) es de
:1.1764557
la varianza para θ2 para un muestreo de n=1000 (t2322)
es de :5.088401
la varianza para θ3 para un muestreo de n=1000
(t3333) es de :1.100337
la varianza para θ4 para un muestreo de
n=1000 (t4444) es de :1.6915804
El estimador θ3 es el de menor
sesgo y menor variabilidad por lo tanto es más eficiente.
El estimador θ3 es el de mayor consistencia, ya que independiente del número de muestras fúe el de menor varianza y cuyo promedio fue el más cercano a la media de la población.