PROBLEMA 2

PROPIEDADES DE LOS ESTIMADORES

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad. Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine la características de cada uno de los siguientes estimadores propuestos:

θ1ˆ= (X1+X2 / 6) + (X3+X4 / 3)
θ2ˆ= (X1+2X2+3X3+4X4) / 5
θ3ˆ= ((X1+X2+X3+X4) / 4)
θ4ˆ= ((min{X1,X2,X3,X4} ) + (max{X1,X2,X3,X4})) / 2

a continuación se genera una muestras de n=20, 50, 100 y 1000 para cada uno de los estimadores planteados y para cada caso se evalua las propiedades de insesgadez, eficiencia y consistencia

n <- 4
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias 

valores <- data.frame(medias, varianzas, sesgo) 
print(valores)

##           medias  varianzas    sesgo
## theta1 0.3481489 0.01298809 1.651851
## theta2 0.6123448 0.05596066 1.387655
## theta3 0.4077684 0.02039555 1.592232
## theta4 0.5869938 0.12570166 1.413006

MUESTRA DE n=20

n <- 20
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)

##      theta1           theta2           theta3           theta4      
##  Min.   :0.2233   Min.   :0.4685   Min.   :0.2370   Min.   :0.2779  
##  1st Qu.:0.3831   1st Qu.:0.7746   1st Qu.:0.4294   1st Qu.:0.4568  
##  Median :0.5516   Median :1.1196   Median :0.5400   Median :0.5944  
##  Mean   :0.5637   Mean   :1.1556   Mean   :0.5742   Mean   :0.6655  
##  3rd Qu.:0.6784   3rd Qu.:1.4681   3rd Qu.:0.7189   3rd Qu.:0.7556  
##  Max.   :1.2242   Max.   :2.3479   Max.   :1.0670   Max.   :1.4757

boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")

medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias 

valores <- data.frame(medias, varianzas, sesgo) 
print(valores)

##           medias  varianzas     sesgo
## theta1 0.5636811 0.05605548 1.4363189
## theta2 1.1555799 0.24835791 0.8444201
## theta3 0.5741561 0.04071696 1.4258439
## theta4 0.6654980 0.09123784 1.3345020

theta3 parece ser el estimador más eficiente en términos de precisión, al analizar los datos podemos evidenciar:

Insesgadez: Los sesgos son aproximadamente 1.58, 1.18, 1.57 y 1.49 para theta1, theta2, theta3 y theta4, respectivamente. Estos valores sugieren cierto grado de sesgo en todos los estimadores.
Varianzas: Las varianzas son aproximadamente 0.064, 0.284, 0.053 y 0.055 para theta1, theta2, theta3 y theta4, respectivamente. Podemos observar que theta3 tiene la varianza más baja, lo que sugiere que podría ser el estimador más eficiente en términos de precisión.
Medias: Las medias son aproximadamente 0.42, 0.82, 0.43 y 0.51 para theta1, theta2, theta3 y theta4, respectivamente. Ninguna de las medias parece estar muy cerca del valor verdadero del parámetro (0.5), lo que sugiere que los estimadores podrían no ser consistentes en este caso.

MUESTRA DE n=50

n <- 50
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)

##      theta1           theta2           theta3           theta4      
##  Min.   :0.1198   Min.   :0.2462   Min.   :0.1321   Min.   :0.1608  
##  1st Qu.:0.3415   1st Qu.:0.6833   1st Qu.:0.3010   1st Qu.:0.3325  
##  Median :0.4947   Median :0.9103   Median :0.4857   Median :0.5424  
##  Mean   :0.5109   Mean   :1.0345   Mean   :0.5179   Mean   :0.6215  
##  3rd Qu.:0.6729   3rd Qu.:1.4235   3rd Qu.:0.6766   3rd Qu.:0.8328  
##  Max.   :1.2479   Max.   :2.6162   Max.   :1.5098   Max.   :2.0728

boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")

medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias 

valores <- data.frame(medias, varianzas, sesgo) 
print(valores)

##           medias  varianzas     sesgo
## theta1 0.5108752 0.05976752 1.4891248
## theta2 1.0345325 0.27256316 0.9654675
## theta3 0.5179209 0.07100185 1.4820791
## theta4 0.6215135 0.13772699 1.3784865

Los resultado siguen teniendo la misma variación donde:

Insesgadez: En este caso, los sesgos son aproximadamente 1.53, 1.07, 1.51 y 1.43 para theta1, theta2, theta3 y theta4, respectivamente. Estos valores sugieren cierto grado de sesgo en todos los estimadores.
Varianzas: Las varianzas son aproximadamente 0.070, 0.278, 0.069 y 0.102 para theta1, theta2, theta3 y theta4, respectivamente. Podemos observar que theta3 tiene la varianza más baja, lo que sugiere que podría ser el estimador más eficiente en términos de precisión.
Medias: Las medias son aproximadamente 0.47, 0.93, 0.49 y 0.57 para theta1, theta2, theta3 y theta4, respectivamente. Ninguna de las medias parece estar muy cerca del valor verdadero del parámetro (0.5), lo que sugiere que los estimadores podrían no ser consistentes en este caso.

MUESTRA DE n=100

n <- 100
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)

##      theta1           theta2           theta3            theta4      
##  Min.   :0.1131   Min.   :0.2174   Min.   :0.09789   Min.   :0.1122  
##  1st Qu.:0.3171   1st Qu.:0.5828   1st Qu.:0.29612   1st Qu.:0.3324  
##  Median :0.4661   Median :0.9097   Median :0.46729   Median :0.5424  
##  Mean   :0.5084   Mean   :1.0050   Mean   :0.50368   Mean   :0.5711  
##  3rd Qu.:0.6729   3rd Qu.:1.3291   3rd Qu.:0.64074   3rd Qu.:0.7438  
##  Max.   :1.7200   Max.   :3.4824   Max.   :1.46506   Max.   :1.5523

boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")

medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias 

valores <- data.frame(medias, varianzas, sesgo) 
print(valores)

##           medias  varianzas     sesgo
## theta1 0.5084221 0.08681576 1.4915779
## theta2 1.0049607 0.34628028 0.9950393
## theta3 0.5036837 0.07196632 1.4963163
## theta4 0.5710739 0.09913090 1.4289261

Todos los estimadores muestran cierto grado de sesgo, mientras que theta3 parece ser el estimador más eficiente en términos de precisión.

MUESTRA DE n=1000

n <- 1000
lambda <- 2

X1 <- rexp(n, lambda)
X2 <- rexp(n, lambda)
X3 <- rexp(n, lambda)
X4 <- rexp(n, lambda)

dmin <- apply(data.frame(X1, X2, X3, X4), 1, min)
dmax <- apply(data.frame(X1, X2, X3, X4), 1, max)

estimadores <- data.frame(
  theta1 = (X1 + X2) / 6 + (X3 + X4) / 3,
  theta2 = (X1 + 2*X2 + 3*X3 + 4*X4) / 5,
  theta3 = (X1 + X2 + X3 + X4) / 4,
  theta4 = (dmin + dmax) / 2
)

summary(estimadores)

##      theta1            theta2            theta3            theta4       
##  Min.   :0.04339   Min.   :0.06577   Min.   :0.05442   Min.   :0.05194  
##  1st Qu.:0.30637   1st Qu.:0.59216   1st Qu.:0.31621   1st Qu.:0.35297  
##  Median :0.45931   Median :0.88699   Median :0.46060   Median :0.53604  
##  Mean   :0.50058   Mean   :0.99620   Mean   :0.50249   Mean   :0.58596  
##  3rd Qu.:0.64275   3rd Qu.:1.28672   3rd Qu.:0.64890   3rd Qu.:0.76459  
##  Max.   :2.13916   Max.   :4.37834   Max.   :1.77667   Max.   :2.16487

boxplot(estimadores, xlab = "Estimadores", ylab = "Valores")
abline(h = lambda, col = "red")

medias <- apply(estimadores, 2, mean)
varianzas <- apply(estimadores, 2, var)
sesgo <- lambda - medias 

valores <- data.frame(medias, varianzas, sesgo) 
print(valores)

##           medias  varianzas    sesgo
## theta1 0.5005795 0.07147451 1.499420
## theta2 0.9961998 0.30936661 1.003800
## theta3 0.5024899 0.06373484 1.497510
## theta4 0.5859630 0.09733799 1.414037

Insesgade: Los sesgos para los estimadores theta1, theta2, theta3 y theta4 son aproximadamente 1.49, 0.98, 1.49 y 1.41, respectivamente. Todos los estimadores muestran cierto grado de sesgo.
Varianzas: Las varianzas para theta1, theta2, theta3 y theta4 son aproximadamente 0.067, 0.297, 0.061 y 0.100, respectivamente. Se observa que theta3 tiene la varianza más baja, lo que sugiere que podría ser el estimador más eficiente.
Medias: Las medias para theta1, theta2, theta3 y theta4 son aproximadamente 0.51, 1.02, 0.51 y 0.59, respectivamente. Ninguna de las medias parece estar muy cerca del valor verdadero del parámetro.

Dentro de todas las muestras evidenciamos que theta3 fue el estimador más eficiente en términos de precisión.

PROBLEMA 2

Yulieth Ibañez Aristizabal

Nelson Agreda Villota

2024-03-10

PROPIEDADES DE LOS ESTIMADORES

MUESTRA DE n=20

MUESTRA DE n=50

MUESTRA DE n=100

MUESTRA DE n=1000