La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad. Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine la características de cada uno de los siguientes estimadores propuestos:
θ1ˆ= (X1+X2 / 6) + (X3+X4 / 3)
θ2ˆ= (X1+2X2+3X3+4X4) / 5
θ3ˆ= ((X1+X2+X3+X4) / 4)
θ4ˆ= ((min{X1,X2,X3,X4} ) + (max{X1,X2,X3,X4})) / 2
a continuación se genera una muestras de n=20, 50, 100 y 1000 para cada uno de los estimadores planteados y para cada caso se evalua las propiedades de insesgadez, eficiencia y consistencia
n <- 4
lambda <- 2
X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)
dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)
estimadores <- data.frame(
theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
theta3 = (X1 + X2 + X3 + X4) / 4,
theta4 = (dmin + dmax) / 2
)
medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias
valores <- data.frame(medias, varianzas, sesgo)
print(valores)
## medias varianzas sesgo
## theta1 0.3481489 0.01298809 1.651851
## theta2 0.6123448 0.05596066 1.387655
## theta3 0.4077684 0.02039555 1.592232
## theta4 0.5869938 0.12570166 1.413006
n <- 20
lambda <- 2
X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)
dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)
estimadores <- data.frame(
theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
theta3 = (X1 + X2 + X3 + X4) / 4,
theta4 = (dmin + dmax) / 2
)
summary(estimadores)
## theta1 theta2 theta3 theta4
## Min. :0.2233 Min. :0.4685 Min. :0.2370 Min. :0.2779
## 1st Qu.:0.3831 1st Qu.:0.7746 1st Qu.:0.4294 1st Qu.:0.4568
## Median :0.5516 Median :1.1196 Median :0.5400 Median :0.5944
## Mean :0.5637 Mean :1.1556 Mean :0.5742 Mean :0.6655
## 3rd Qu.:0.6784 3rd Qu.:1.4681 3rd Qu.:0.7189 3rd Qu.:0.7556
## Max. :1.2242 Max. :2.3479 Max. :1.0670 Max. :1.4757
boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")
medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias
valores <- data.frame(medias, varianzas, sesgo)
print(valores)
## medias varianzas sesgo
## theta1 0.5636811 0.05605548 1.4363189
## theta2 1.1555799 0.24835791 0.8444201
## theta3 0.5741561 0.04071696 1.4258439
## theta4 0.6654980 0.09123784 1.3345020
theta3 parece ser el estimador más eficiente en términos de precisión, al analizar los datos podemos evidenciar:
Insesgadez: Los sesgos son aproximadamente 1.58, 1.18, 1.57 y 1.49 para theta1, theta2, theta3 y theta4, respectivamente. Estos valores sugieren cierto grado de sesgo en todos los estimadores.
Varianzas: Las varianzas son aproximadamente 0.064, 0.284, 0.053 y 0.055 para theta1, theta2, theta3 y theta4, respectivamente. Podemos observar que theta3 tiene la varianza más baja, lo que sugiere que podría ser el estimador más eficiente en términos de precisión.
Medias: Las medias son aproximadamente 0.42, 0.82, 0.43 y 0.51 para theta1, theta2, theta3 y theta4, respectivamente. Ninguna de las medias parece estar muy cerca del valor verdadero del parámetro (0.5), lo que sugiere que los estimadores podrían no ser consistentes en este caso.
n <- 50
lambda <- 2
X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)
dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)
estimadores <- data.frame(
theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
theta3 = (X1 + X2 + X3 + X4) / 4,
theta4 = (dmin + dmax) / 2
)
summary(estimadores)
## theta1 theta2 theta3 theta4
## Min. :0.1198 Min. :0.2462 Min. :0.1321 Min. :0.1608
## 1st Qu.:0.3415 1st Qu.:0.6833 1st Qu.:0.3010 1st Qu.:0.3325
## Median :0.4947 Median :0.9103 Median :0.4857 Median :0.5424
## Mean :0.5109 Mean :1.0345 Mean :0.5179 Mean :0.6215
## 3rd Qu.:0.6729 3rd Qu.:1.4235 3rd Qu.:0.6766 3rd Qu.:0.8328
## Max. :1.2479 Max. :2.6162 Max. :1.5098 Max. :2.0728
boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")
medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias
valores <- data.frame(medias, varianzas, sesgo)
print(valores)
## medias varianzas sesgo
## theta1 0.5108752 0.05976752 1.4891248
## theta2 1.0345325 0.27256316 0.9654675
## theta3 0.5179209 0.07100185 1.4820791
## theta4 0.6215135 0.13772699 1.3784865
Los resultado siguen teniendo la misma variación donde:
Insesgadez: En este caso, los sesgos son aproximadamente 1.53, 1.07, 1.51 y 1.43 para theta1, theta2, theta3 y theta4, respectivamente. Estos valores sugieren cierto grado de sesgo en todos los estimadores.
Varianzas: Las varianzas son aproximadamente 0.070, 0.278, 0.069 y 0.102 para theta1, theta2, theta3 y theta4, respectivamente. Podemos observar que theta3 tiene la varianza más baja, lo que sugiere que podría ser el estimador más eficiente en términos de precisión.
Medias: Las medias son aproximadamente 0.47, 0.93, 0.49 y 0.57 para theta1, theta2, theta3 y theta4, respectivamente. Ninguna de las medias parece estar muy cerca del valor verdadero del parámetro (0.5), lo que sugiere que los estimadores podrían no ser consistentes en este caso.
n <- 100
lambda <- 2
X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)
dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)
estimadores <- data.frame(
theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
theta3 = (X1 + X2 + X3 + X4) / 4,
theta4 = (dmin + dmax) / 2
)
summary(estimadores)
## theta1 theta2 theta3 theta4
## Min. :0.1131 Min. :0.2174 Min. :0.09789 Min. :0.1122
## 1st Qu.:0.3171 1st Qu.:0.5828 1st Qu.:0.29612 1st Qu.:0.3324
## Median :0.4661 Median :0.9097 Median :0.46729 Median :0.5424
## Mean :0.5084 Mean :1.0050 Mean :0.50368 Mean :0.5711
## 3rd Qu.:0.6729 3rd Qu.:1.3291 3rd Qu.:0.64074 3rd Qu.:0.7438
## Max. :1.7200 Max. :3.4824 Max. :1.46506 Max. :1.5523
boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")
medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias
valores <- data.frame(medias, varianzas, sesgo)
print(valores)
## medias varianzas sesgo
## theta1 0.5084221 0.08681576 1.4915779
## theta2 1.0049607 0.34628028 0.9950393
## theta3 0.5036837 0.07196632 1.4963163
## theta4 0.5710739 0.09913090 1.4289261
Todos los estimadores muestran cierto grado de sesgo, mientras que theta3 parece ser el estimador más eficiente en términos de precisión.
n <- 1000
lambda <- 2
X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)
dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)
estimadores <- data.frame(
theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
theta3 = (X1 + X2 + X3 + X4) / 4,
theta4 = (dmin + dmax) / 2
)
summary(estimadores)
## theta1 theta2 theta3 theta4
## Min. :0.04339 Min. :0.06577 Min. :0.05442 Min. :0.05194
## 1st Qu.:0.30637 1st Qu.:0.59216 1st Qu.:0.31621 1st Qu.:0.35297
## Median :0.45931 Median :0.88699 Median :0.46060 Median :0.53604
## Mean :0.50058 Mean :0.99620 Mean :0.50249 Mean :0.58596
## 3rd Qu.:0.64275 3rd Qu.:1.28672 3rd Qu.:0.64890 3rd Qu.:0.76459
## Max. :2.13916 Max. :4.37834 Max. :1.77667 Max. :2.16487
boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")
medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias
valores <- data.frame(medias, varianzas, sesgo)
print(valores)
## medias varianzas sesgo
## theta1 0.5005795 0.07147451 1.499420
## theta2 0.9961998 0.30936661 1.003800
## theta3 0.5024899 0.06373484 1.497510
## theta4 0.5859630 0.09733799 1.414037
Insesgade: Los sesgos para los estimadores theta1, theta2, theta3 y theta4 son aproximadamente 1.49, 0.98, 1.49 y 1.41, respectivamente. Todos los estimadores muestran cierto grado de sesgo.
Varianzas: Las varianzas para theta1, theta2, theta3 y theta4 son aproximadamente 0.067, 0.297, 0.061 y 0.100, respectivamente. Se observa que theta3 tiene la varianza más baja, lo que sugiere que podría ser el estimador más eficiente.
Medias: Las medias para theta1, theta2, theta3 y theta4 son aproximadamente 0.51, 1.02, 0.51 y 0.59, respectivamente. Ninguna de las medias parece estar muy cerca del valor verdadero del parámetro.
Dentro de todas las muestras evidenciamos que theta3 fue el estimador más eficiente en términos de precisión.