Problema No. 2 - Propiedades de los Estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son, insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine la características de cada uno de los siguientes estimadores propuestos:

Solución

Procedemos a generar muestras con los requerimientos del problema, de la siguiente manera n=20, n=50, n=100 y n=1000. Para cada uno de los estimadores planteados y para cada caso se evalúa las propiedades de insesgadez, eficiencia y consistencia

n <- 4
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)
##           medias  varianzas    sesgo
## theta1 0.4711330 0.08483235 1.528867
## theta2 0.9542320 0.34079936 1.045768
## theta3 0.4345892 0.06084292 1.565411
## theta4 0.4884223 0.07821680 1.511578

Ejercicio con muestra n=20

Estimadores

n <- 20
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)
##      theta1           theta2           theta3           theta4      
##  Min.   :0.2009   Min.   :0.3184   Min.   :0.1631   Min.   :0.1925  
##  1st Qu.:0.3329   1st Qu.:0.6152   1st Qu.:0.3227   1st Qu.:0.3575  
##  Median :0.3735   Median :0.7776   Median :0.4267   Median :0.5179  
##  Mean   :0.5140   Mean   :1.0035   Mean   :0.5207   Mean   :0.6352  
##  3rd Qu.:0.6259   3rd Qu.:1.2187   3rd Qu.:0.6384   3rd Qu.:0.8453  
##  Max.   :1.4182   Max.   :2.5904   Max.   :1.2029   Max.   :1.6244

##           medias  varianzas     sesgo
## theta1 0.5139722 0.09251608 1.4860278
## theta2 1.0035363 0.35484799 0.9964637
## theta3 0.5206552 0.07923083 1.4793448
## theta4 0.6352426 0.12518164 1.3647574

Teniendo en cuenta lo mostrado anterior mente theta3 el estimador más eficiente en términos de precisión, Por su parte también podemos decir:

Insesgadez: Los sesgos son aproximadamente 1.58, 1.18, 1.57 y 1.49 para theta1, theta2, theta3 y theta4, respectivamente. Estos valores sugieren cierto grado de sesgo en los estimadores evaluados.

Varianzas: Las varianzas son aproximadamente 0.064, 0.284, 0.053 y 0.055 para theta1, theta2, theta3 y theta4, respectivamente. Podemos identificar que theta3 tiene la varianza más baja, lo que evidencia que podría ser el estimador más eficiente en términos de precisión.

Medias: Las medias son aproximadamente 0.42, 0.82, 0.43 y 0.51 para theta1, theta2, theta3 y theta4, respectivamente. Ninguna de las medias parece estar muy cerca del valor verdadero del parámetro (0.5), lo que sugiere que los estimadores podrían no ser consistentes en este caso.

Ejercicio con muestra n=50

##Estimadores

n <- 50
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)
##      theta1           theta2           theta3           theta4      
##  Min.   :0.1849   Min.   :0.3094   Min.   :0.2208   Min.   :0.2244  
##  1st Qu.:0.3788   1st Qu.:0.7651   1st Qu.:0.3648   1st Qu.:0.4028  
##  Median :0.5217   Median :0.9751   Median :0.5110   Median :0.5959  
##  Mean   :0.5435   Mean   :1.0749   Mean   :0.5365   Mean   :0.6390  
##  3rd Qu.:0.6804   3rd Qu.:1.2779   3rd Qu.:0.6643   3rd Qu.:0.8190  
##  Max.   :1.0794   Max.   :2.2488   Max.   :1.0208   Max.   :1.2217

##           medias  varianzas    sesgo
## theta1 0.5434714 0.04950390 1.456529
## theta2 1.0749080 0.20077319 0.925092
## theta3 0.5365087 0.04401968 1.463491
## theta4 0.6390124 0.07301425 1.360988

Teniendo en cuenta lo anterior, los hallazgos siguen presentando una variación similar, en donde:

Insesgadez: los sesgos son aproximadamente 1.53, 1.07, 1.51 y 1.43 para theta1, theta2, theta3 y theta4, respectivamente. Estos valores sugieren cierto grado de sesgo en todos los estimadores.

Varianzas: Son aproximadamente 0.070, 0.278, 0.069 y 0.102 para theta1, theta2, theta3 y theta4, respectivamente. Se puede identificar que theta3 tiene la varianza más baja, lo que sugiere que podría ser el estimador más eficiente en términos de precisión.

Medias: Las medias son aproximadamente 0.47, 0.93, 0.49 y 0.57 para theta1, theta2, theta3 y theta4, respectivamente. Ninguna de las medias parece estarcerca del valor verdadero del parámetro (0.5), lo que sugiere que los estimadores podrían no ser consistentes.

Ejercicio con muestra n=100

##Estimadores

n <- 100
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)
##      theta1            theta2           theta3            theta4       
##  Min.   :0.04582   Min.   :0.1037   Min.   :0.05068   Min.   :0.06528  
##  1st Qu.:0.33389   1st Qu.:0.6555   1st Qu.:0.34402   1st Qu.:0.38607  
##  Median :0.50441   Median :1.0033   Median :0.50964   Median :0.52339  
##  Mean   :0.51451   Mean   :1.0290   Mean   :0.50958   Mean   :0.58331  
##  3rd Qu.:0.66088   3rd Qu.:1.3244   3rd Qu.:0.63821   3rd Qu.:0.74780  
##  Max.   :1.20556   Max.   :2.6800   Max.   :1.38353   Max.   :1.43653

##           medias  varianzas    sesgo
## theta1 0.5145135 0.06080772 1.485487
## theta2 1.0289610 0.27407881 0.971039
## theta3 0.5095780 0.05430918 1.490422
## theta4 0.5833137 0.07757127 1.416686

Teniendo en cuanta lo anterior encontramos que todos los estimadores muestran cierto grado de sesgo, mientras que theta3 parece el más eficiente en términos de precisión.

Ejercicio con muestra n=1000

n <- 1000
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)
##      theta1            theta2           theta3           theta4       
##  Min.   :0.06235   Min.   :0.1122   Min.   :0.0551   Min.   :0.05726  
##  1st Qu.:0.30708   1st Qu.:0.6104   1st Qu.:0.3163   1st Qu.:0.35445  
##  Median :0.46333   Median :0.9185   Median :0.4684   Median :0.52282  
##  Mean   :0.50152   Mean   :1.0015   Mean   :0.5037   Mean   :0.58640  
##  3rd Qu.:0.63132   3rd Qu.:1.2609   3rd Qu.:0.6374   3rd Qu.:0.73638  
##  Max.   :2.00038   Max.   :3.6987   Max.   :2.0319   Max.   :3.21981

##           medias  varianzas     sesgo
## theta1 0.5015247 0.06774980 1.4984753
## theta2 1.0014831 0.28747500 0.9985169
## theta3 0.5037147 0.06323485 1.4962853
## theta4 0.5863996 0.10256694 1.4136004

Teniendo en cuenna lo anterior podemos inferir lo siguiente:

Insesgadez: Los sesgos para los estimadores theta1, theta2, theta3 y theta4 son aproximadamente 1.49, 0.98, 1.49 y 1.41, respectivamente. Todos los estimadores muestran cierto grado de sesgo.

Varianzas: Las varianzas para theta1, theta2, theta3 y theta4 son aproximadamente 0.067, 0.297, 0.061 y 0.100, respectivamente. Se identifica que theta3 tiene la varianza más baja, lo que sugiere que podría ser el estimador más eficiente.

Medias: Las medias para theta1, theta2, theta3 y theta4 son aproximadamente 0.51, 1.02, 0.51 y 0.59, respectivamente. Ninguna de las medias parece estar cerca del valor verdadero del parámetro.

Finalmente podemos identificar que el todas las muetras representadas en este informe, es theta3 el estimador más eficiente.