PROPIEDADES DE LOS ESTIMADORES

La simulación ayuda a entender y validar las propiedades de los estimadores estadísticos como son insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

θ1ˆ=(X1+X2)/6+(X3+X4)/3

θ2ˆ=(X1+2X2+3X3+4X4)/5

θ3ˆ=(X1+X2+X3+X4)/4

θ4ˆ=(min{X1,X2,X3,X4}+max{X1,X2,X3,X4})/2

Nota:

-Genere una muestras de n=20, 50, 100 y 1000 para cada uno de los estimadores planteados.

-En cada caso evalue las propiedades de insesgadez, eficiencia y consistencia

-Suponga un valor para el parámetro θ

-funciones recomendadas : function(){}, rexp() , data.frame(), apply(), boxplot()

-Entregable : enlace en RPubs con informe 2

x <- c(20, 50, 100, 1000)
for (n in x) {
lambda <- 8
set.seed (123)
x1 = rexp(n, lambda)
x2 = rexp(n, lambda)
x3 = rexp(n, lambda)
x4 = rexp(n, lambda)

datos = data.frame(x1, x2, x3, x4)
dato_min = apply(datos, 1, min)
dato_max = apply(datos, 1, max)
estimadores = data.frame(
    t1 = (x1 + x2)/6 + (x3 + x4)/3,
    t2 = (x1 +2*x2 + 3*x3 + 4*x4)/5,
    t3 = (x1 + x2 + x3 + x4)/4,
    t4 = (dato_min + dato_max)/2
  )

# Media
medias <- colMeans(estimadores)
sesgo <- medias - 0.125

#Varianza
varianza <- apply(estimadores, 2, var)
print(varianza)

#Calculo MSE
verdadero_valor <- 1/lambda
mse_t1 = mean((estimadores$t1 - verdadero_valor)^2)
mse_t2 = mean((estimadores$t2 - verdadero_valor)^2)
mse_t3 = mean((estimadores$t3 - verdadero_valor)^2)
mse_t4 = mean((estimadores$t4 - verdadero_valor)^2)
mse = c(mse_t1, mse_t2, mse_t3, mse_t4)

#Desviación estándar
desv_est1 = sd(estimadores$t1)
desv_est2 = sd(estimadores$t2)
desv_est3 = sd(estimadores$t3)
desv_est4 = sd(estimadores$t4)
desv_est = c(desv_est1, desv_est2, desv_est3, desv_est4)

boxplot(estimadores, main = paste("Estimadores n =", n), xlab = "Estimadores", ylab = "Valor", col = terrain.colors(4))
abline(h=0.125, col = "Red")
 
resultados <- data.frame(Insesgadez = sesgo, Eficiencia = varianza, 
              consistencia = mse, Media = medias, desviacion_estandar = desv_est)
print(paste("Resultados para n = ", n))
print(resultados)
}
##          t1          t2          t3          t4 
## 0.004252083 0.013701203 0.003103096 0.008136355

## [1] "Resultados para n =  20"
##     Insesgadez  Eficiencia consistencia     Media desviacion_estandar
## t1 0.004428048 0.004252083  0.004059086 0.1294280          0.06520800
## t2 0.130494848 0.013701203  0.030045048 0.2554948          0.11705214
## t3 0.002141112 0.003103096  0.002952526 0.1271411          0.05570544
## t4 0.025098480 0.008136355  0.008359471 0.1500985          0.09020175
##          t1          t2          t3          t4 
## 0.004185770 0.016747256 0.004202688 0.007704705

## [1] "Resultados para n =  50"
##       Insesgadez  Eficiencia consistencia     Media desviacion_estandar
## t1 -0.0006994143 0.004185770  0.004102544 0.1243006          0.06469753
## t2  0.1223774163 0.016747256  0.031388543 0.2473774          0.12941119
## t3  0.0009041490 0.004202688  0.004119452 0.1259041          0.06482814
## t4  0.0197030131 0.007704705  0.007938820 0.1447030          0.08777645
##          t1          t2          t3          t4 
## 0.003237885 0.014675232 0.003091019 0.005142787

## [1] "Resultados para n =  100"
##       Insesgadez  Eficiencia consistencia     Media desviacion_estandar
## t1 -0.0014561182 0.003237885  0.003207626 0.1235439          0.05690241
## t2  0.1195810557 0.014675232  0.028828109 0.2445811          0.12114137
## t3 -0.0008660514 0.003091019  0.003060859 0.1241339          0.05559693
## t4  0.0183479971 0.005142787  0.005428008 0.1433480          0.07171323
##          t1          t2          t3          t4 
## 0.004472038 0.018385208 0.004060076 0.006307498

## [1] "Resultados para n =  1000"
##       Insesgadez  Eficiencia consistencia     Media desviacion_estandar
## t1 -4.948764e-04 0.004472038  0.004467811 0.1245051          0.06687330
## t2  1.224627e-01 0.018385208  0.033363945 0.2474627          0.13559207
## t3 -3.106624e-06 0.004060076  0.004056016 0.1249969          0.06371872
## t4  2.025507e-02 0.006307498  0.006711458 0.1452551          0.07941976

Resultados obtenidos

  • Se evaluaron los 4 estimadores escogiendo un lambda de 8, con lo que la media debe aproximarse a 0.125, revisando los diagramas de cajas y bigotes pareciera que el estimador t4 se aproxima más a la media, sin embargo,observando las tablas generadas con los valores para Insesgadez, Eficiencia, Consistencia, media y desviación estándar, se puede deetrminar que lo mejores estimadores son t1 y t3, ya que se aproximas más a la media y finalmente escogemos t3 como el mejor estimador que aunque la media está un poco más alejada que t1, presenta valores más pequeños en desviación estandar, consistencia, eficiencia e insesgadez.

  • A medida que n crece el valor de la media se va aproximando cada vez más al valor esperado de 0.125.