PROPIEDADES DE LOS ESTIMADORES

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad. Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine la características de cada uno de los siguientes estimadores propuestos:

a continuación se genera una muestras de n=20, 50, 100 y 1000 para cada uno de los estimadores planteados y para cada caso se evalua las propiedades de insesgadez, eficiencia y consistencia

n <- 4
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)
medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias 

valores <- data.frame(medias, varianzas, sesgo) 
print(valores)
##           medias  varianzas    sesgo
## theta1 0.3481489 0.01298809 1.651851
## theta2 0.6123448 0.05596066 1.387655
## theta3 0.4077684 0.02039555 1.592232
## theta4 0.5869938 0.12570166 1.413006

MUESTRA DE n=20

n <- 20
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)
##      theta1           theta2           theta3           theta4      
##  Min.   :0.2233   Min.   :0.4685   Min.   :0.2370   Min.   :0.2779  
##  1st Qu.:0.3831   1st Qu.:0.7746   1st Qu.:0.4294   1st Qu.:0.4568  
##  Median :0.5516   Median :1.1196   Median :0.5400   Median :0.5944  
##  Mean   :0.5637   Mean   :1.1556   Mean   :0.5742   Mean   :0.6655  
##  3rd Qu.:0.6784   3rd Qu.:1.4681   3rd Qu.:0.7189   3rd Qu.:0.7556  
##  Max.   :1.2242   Max.   :2.3479   Max.   :1.0670   Max.   :1.4757
boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")

medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias 

valores <- data.frame(medias, varianzas, sesgo) 
print(valores)
##           medias  varianzas     sesgo
## theta1 0.5636811 0.05605548 1.4363189
## theta2 1.1555799 0.24835791 0.8444201
## theta3 0.5741561 0.04071696 1.4258439
## theta4 0.6654980 0.09123784 1.3345020

theta3 parece ser el estimador más eficiente en términos de precisión, al analizar los datos podemos evidenciar:

MUESTRA DE n=50

n <- 50
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)
##      theta1           theta2           theta3           theta4      
##  Min.   :0.1198   Min.   :0.2462   Min.   :0.1321   Min.   :0.1608  
##  1st Qu.:0.3415   1st Qu.:0.6833   1st Qu.:0.3010   1st Qu.:0.3325  
##  Median :0.4947   Median :0.9103   Median :0.4857   Median :0.5424  
##  Mean   :0.5109   Mean   :1.0345   Mean   :0.5179   Mean   :0.6215  
##  3rd Qu.:0.6729   3rd Qu.:1.4235   3rd Qu.:0.6766   3rd Qu.:0.8328  
##  Max.   :1.2479   Max.   :2.6162   Max.   :1.5098   Max.   :2.0728
boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")

medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias 

valores <- data.frame(medias, varianzas, sesgo) 
print(valores)
##           medias  varianzas     sesgo
## theta1 0.5108752 0.05976752 1.4891248
## theta2 1.0345325 0.27256316 0.9654675
## theta3 0.5179209 0.07100185 1.4820791
## theta4 0.6215135 0.13772699 1.3784865

Los resultado siguen teniendo la misma variación donde:

MUESTRA DE n=100

n <- 100
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)
##      theta1           theta2           theta3            theta4      
##  Min.   :0.1131   Min.   :0.2174   Min.   :0.09789   Min.   :0.1122  
##  1st Qu.:0.3171   1st Qu.:0.5828   1st Qu.:0.29612   1st Qu.:0.3324  
##  Median :0.4661   Median :0.9097   Median :0.46729   Median :0.5424  
##  Mean   :0.5084   Mean   :1.0050   Mean   :0.50368   Mean   :0.5711  
##  3rd Qu.:0.6729   3rd Qu.:1.3291   3rd Qu.:0.64074   3rd Qu.:0.7438  
##  Max.   :1.7200   Max.   :3.4824   Max.   :1.46506   Max.   :1.5523
boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")

medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias 

valores <- data.frame(medias, varianzas, sesgo) 
print(valores)
##           medias  varianzas     sesgo
## theta1 0.5084221 0.08681576 1.4915779
## theta2 1.0049607 0.34628028 0.9950393
## theta3 0.5036837 0.07196632 1.4963163
## theta4 0.5710739 0.09913090 1.4289261

Todos los estimadores muestran cierto grado de sesgo, mientras que theta3 parece ser el estimador más eficiente en términos de precisión.

MUESTRA DE n=1000

n <- 1000
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)
##      theta1            theta2            theta3            theta4       
##  Min.   :0.04339   Min.   :0.06577   Min.   :0.05442   Min.   :0.05194  
##  1st Qu.:0.30637   1st Qu.:0.59216   1st Qu.:0.31621   1st Qu.:0.35297  
##  Median :0.45931   Median :0.88699   Median :0.46060   Median :0.53604  
##  Mean   :0.50058   Mean   :0.99620   Mean   :0.50249   Mean   :0.58596  
##  3rd Qu.:0.64275   3rd Qu.:1.28672   3rd Qu.:0.64890   3rd Qu.:0.76459  
##  Max.   :2.13916   Max.   :4.37834   Max.   :1.77667   Max.   :2.16487
boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")

medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias 

valores <- data.frame(medias, varianzas, sesgo) 
print(valores)
##           medias  varianzas    sesgo
## theta1 0.5005795 0.07147451 1.499420
## theta2 0.9961998 0.30936661 1.003800
## theta3 0.5024899 0.06373484 1.497510
## theta4 0.5859630 0.09733799 1.414037

Dentro de todas las muestras evidenciamos que theta3 fue el estimador más eficiente en términos de precisión.