La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son, insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine la características de cada uno de los siguientes estimadores propuestos:
Procedemos a generar muestras con los requerimientos del problema, de la siguiente manera n=20, n=50, n=100 y n=1000. Para cada uno de los estimadores planteados y para cada caso se evalúa las propiedades de insesgadez, eficiencia y consistencia
n <- 4
lambda <- 2
X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)
dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)
estimadores <- data.frame(
theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
theta3 = (X1 + X2 + X3 + X4) / 4,
theta4 = (dmin + dmax) / 2
)
## medias varianzas sesgo
## theta1 0.4711330 0.08483235 1.528867
## theta2 0.9542320 0.34079936 1.045768
## theta3 0.4345892 0.06084292 1.565411
## theta4 0.4884223 0.07821680 1.511578
n <- 20
lambda <- 2
X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)
dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)
estimadores <- data.frame(
theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
theta3 = (X1 + X2 + X3 + X4) / 4,
theta4 = (dmin + dmax) / 2
)
summary(estimadores)
## theta1 theta2 theta3 theta4
## Min. :0.2009 Min. :0.3184 Min. :0.1631 Min. :0.1925
## 1st Qu.:0.3329 1st Qu.:0.6152 1st Qu.:0.3227 1st Qu.:0.3575
## Median :0.3735 Median :0.7776 Median :0.4267 Median :0.5179
## Mean :0.5140 Mean :1.0035 Mean :0.5207 Mean :0.6352
## 3rd Qu.:0.6259 3rd Qu.:1.2187 3rd Qu.:0.6384 3rd Qu.:0.8453
## Max. :1.4182 Max. :2.5904 Max. :1.2029 Max. :1.6244
## medias varianzas sesgo
## theta1 0.5139722 0.09251608 1.4860278
## theta2 1.0035363 0.35484799 0.9964637
## theta3 0.5206552 0.07923083 1.4793448
## theta4 0.6352426 0.12518164 1.3647574
Teniendo en cuenta lo mostrado anterior mente theta3 el estimador más eficiente en términos de precisión, Por su parte también podemos decir:
Insesgadez: Los sesgos son aproximadamente 1.58, 1.18, 1.57 y 1.49 para theta1, theta2, theta3 y theta4, respectivamente. Estos valores sugieren cierto grado de sesgo en los estimadores evaluados.
Varianzas: Las varianzas son aproximadamente 0.064, 0.284, 0.053 y 0.055 para theta1, theta2, theta3 y theta4, respectivamente. Podemos identificar que theta3 tiene la varianza más baja, lo que evidencia que podría ser el estimador más eficiente en términos de precisión.
Medias: Las medias son aproximadamente 0.42, 0.82, 0.43 y 0.51 para theta1, theta2, theta3 y theta4, respectivamente. Ninguna de las medias parece estar muy cerca del valor verdadero del parámetro (0.5), lo que sugiere que los estimadores podrían no ser consistentes en este caso.
##Estimadores
n <- 50
lambda <- 2
X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)
dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)
estimadores <- data.frame(
theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
theta3 = (X1 + X2 + X3 + X4) / 4,
theta4 = (dmin + dmax) / 2
)
summary(estimadores)
## theta1 theta2 theta3 theta4
## Min. :0.1849 Min. :0.3094 Min. :0.2208 Min. :0.2244
## 1st Qu.:0.3788 1st Qu.:0.7651 1st Qu.:0.3648 1st Qu.:0.4028
## Median :0.5217 Median :0.9751 Median :0.5110 Median :0.5959
## Mean :0.5435 Mean :1.0749 Mean :0.5365 Mean :0.6390
## 3rd Qu.:0.6804 3rd Qu.:1.2779 3rd Qu.:0.6643 3rd Qu.:0.8190
## Max. :1.0794 Max. :2.2488 Max. :1.0208 Max. :1.2217
## medias varianzas sesgo
## theta1 0.5434714 0.04950390 1.456529
## theta2 1.0749080 0.20077319 0.925092
## theta3 0.5365087 0.04401968 1.463491
## theta4 0.6390124 0.07301425 1.360988
Teniendo en cuenta lo anterior, los hallazgos siguen presentando una variación similar, en donde:
Insesgadez: los sesgos son aproximadamente 1.53, 1.07, 1.51 y 1.43 para theta1, theta2, theta3 y theta4, respectivamente. Estos valores sugieren cierto grado de sesgo en todos los estimadores.
Varianzas: Son aproximadamente 0.070, 0.278, 0.069 y 0.102 para theta1, theta2, theta3 y theta4, respectivamente. Se puede identificar que theta3 tiene la varianza más baja, lo que sugiere que podría ser el estimador más eficiente en términos de precisión.
Medias: Las medias son aproximadamente 0.47, 0.93, 0.49 y 0.57 para theta1, theta2, theta3 y theta4, respectivamente. Ninguna de las medias parece estarcerca del valor verdadero del parámetro (0.5), lo que sugiere que los estimadores podrían no ser consistentes.
##Estimadores
n <- 100
lambda <- 2
X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)
dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)
estimadores <- data.frame(
theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
theta3 = (X1 + X2 + X3 + X4) / 4,
theta4 = (dmin + dmax) / 2
)
summary(estimadores)
## theta1 theta2 theta3 theta4
## Min. :0.04582 Min. :0.1037 Min. :0.05068 Min. :0.06528
## 1st Qu.:0.33389 1st Qu.:0.6555 1st Qu.:0.34402 1st Qu.:0.38607
## Median :0.50441 Median :1.0033 Median :0.50964 Median :0.52339
## Mean :0.51451 Mean :1.0290 Mean :0.50958 Mean :0.58331
## 3rd Qu.:0.66088 3rd Qu.:1.3244 3rd Qu.:0.63821 3rd Qu.:0.74780
## Max. :1.20556 Max. :2.6800 Max. :1.38353 Max. :1.43653
## medias varianzas sesgo
## theta1 0.5145135 0.06080772 1.485487
## theta2 1.0289610 0.27407881 0.971039
## theta3 0.5095780 0.05430918 1.490422
## theta4 0.5833137 0.07757127 1.416686
Teniendo en cuanta lo anterior encontramos que todos los estimadores muestran cierto grado de sesgo, mientras que theta3 parece el más eficiente en términos de precisión.
n <- 1000
lambda <- 2
X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)
dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)
estimadores <- data.frame(
theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
theta3 = (X1 + X2 + X3 + X4) / 4,
theta4 = (dmin + dmax) / 2
)
summary(estimadores)
## theta1 theta2 theta3 theta4
## Min. :0.06235 Min. :0.1122 Min. :0.0551 Min. :0.05726
## 1st Qu.:0.30708 1st Qu.:0.6104 1st Qu.:0.3163 1st Qu.:0.35445
## Median :0.46333 Median :0.9185 Median :0.4684 Median :0.52282
## Mean :0.50152 Mean :1.0015 Mean :0.5037 Mean :0.58640
## 3rd Qu.:0.63132 3rd Qu.:1.2609 3rd Qu.:0.6374 3rd Qu.:0.73638
## Max. :2.00038 Max. :3.6987 Max. :2.0319 Max. :3.21981
## medias varianzas sesgo
## theta1 0.5015247 0.06774980 1.4984753
## theta2 1.0014831 0.28747500 0.9985169
## theta3 0.5037147 0.06323485 1.4962853
## theta4 0.5863996 0.10256694 1.4136004
Teniendo en cuenna lo anterior podemos inferir lo siguiente:
Insesgadez: Los sesgos para los estimadores theta1, theta2, theta3 y theta4 son aproximadamente 1.49, 0.98, 1.49 y 1.41, respectivamente. Todos los estimadores muestran cierto grado de sesgo.
Varianzas: Las varianzas para theta1, theta2, theta3 y theta4 son aproximadamente 0.067, 0.297, 0.061 y 0.100, respectivamente. Se identifica que theta3 tiene la varianza más baja, lo que sugiere que podría ser el estimador más eficiente.
Medias: Las medias para theta1, theta2, theta3 y theta4 son aproximadamente 0.51, 1.02, 0.51 y 0.59, respectivamente. Ninguna de las medias parece estar cerca del valor verdadero del parámetro.
Finalmente podemos identificar que el todas las muetras representadas en este informe, es theta3 el estimador más eficiente.