Se procede a la construcción de una función que permita evaluar los diferentes estimadores propuestos
set.seed(44)
est <- function(rep, theta) {
X_rep <- lapply(1:rep, function(x) rexp(4, rate=1/theta))
X_rep <- do.call(rbind, X_rep)
res <- t(apply(X_rep, 1, function(x) {
theta1 <- ((x[1]+x[2])/6) + ((x[3]+x[4])/3)
theta2 <- (x[1]+(2*x[2])+(3*x[3])+(4*x[4]))/5
theta3 <- (x[1]+x[2]+x[3]+x[4])/4
theta4 <- (pmin(x[1],x[2],x[3],x[4])+pmax(x[1],x[2],x[3],x[4]))/2
c(theta1, theta2, theta3, theta4)
}))
colnames(res) <- c("theta1", "theta2", "theta3", "theta4")
res <- as.data.frame(res)
return(res)
}
Una vez construida la función, se define un valor para el parámetro, el cual sera de \(\theta=3\), para posteriormente evaluar los estimadores para diferentes tamaños de muestra.
theta <- 3
res_20 <- est(20, theta)
res_50 <- est(50, theta)
res_100 <- est(100, theta)
res_1000 <- est(1000, theta)
res_20
## theta1 theta2 theta3 theta4
## 1 0.8242602 1.677003 1.1099957 1.2597498
## 2 3.5940538 6.504533 4.3217168 5.2439866
## 3 2.6693171 5.583425 2.8309809 3.3159724
## 4 2.8206662 5.888828 2.7011378 2.3425528
## 5 1.5760423 3.075327 1.8096565 1.8513768
## 6 0.6888210 1.238536 0.7346091 0.8719735
## 7 3.2304665 6.705241 2.8986784 3.1776595
## 8 2.0314335 3.816869 2.1129524 1.8683955
## 9 2.5020378 5.682124 2.5327495 2.4406144
## 10 1.1544734 2.075877 1.5028978 1.5797491
## 11 1.8888460 3.898852 1.4558633 1.5859463
## 12 1.3454404 2.576836 1.3904514 1.2554184
## 13 1.9534910 4.446292 2.0419941 2.3075035
## 14 6.0827740 10.849229 5.0999828 7.5709858
## 15 2.6167873 4.758730 2.0523860 3.4713912
## 16 2.9615389 6.795500 2.7189700 2.8930608
## 17 5.1931979 9.121980 5.7285694 7.3346840
## 18 5.3315971 10.561376 5.2725239 5.0953042
## 19 4.3631896 6.876755 5.5982440 8.9872502
## 20 3.5269449 7.648090 3.2115327 2.6229700
Ahora se procede a realizar el calculo de la media, varianza y su respectivo sesgo para los 4 estimadores.
res <- list(res_20, res_50, res_100, res_1000)
n <- c("20", "50", "100", "1000")
estadisticas <- lapply(res, function(x) {
media <- colMeans(x)
varianza <- apply(x, 2, var)
sesgo <- media - theta
c(media, varianza, sesgo)
})
estadisticas_df <- do.call(rbind, estadisticas)
rownames(estadisticas_df) <- n
colnames(estadisticas_df) <- c(paste0("media_theta", 1:4), paste0("varianza_theta", 1:4), paste0("sesgo_theta", 1:4))
Media <- estadisticas_df[,1:4]
Varianza <- estadisticas_df[,5:8]
Sesgo <- estadisticas_df[,9:12]
Media
## media_theta1 media_theta2 media_theta3 media_theta4
## 20 2.817769 5.489070 2.856295 3.353827
## 50 3.036017 5.953656 3.015250 3.311078
## 100 3.122129 6.031787 3.154144 3.552475
## 1000 2.977708 5.959583 2.980393 3.442825
Varianza
## varianza_theta1 varianza_theta2 varianza_theta3 varianza_theta4
## 20 2.298954 7.587869 2.395490 5.336917
## 50 2.394750 8.825313 2.217627 2.770183
## 100 2.517633 9.240620 2.150738 3.007343
## 1000 2.365101 9.982625 2.174706 3.390491
Sesgo
## sesgo_theta1 sesgo_theta2 sesgo_theta3 sesgo_theta4
## 20 -0.18223107 2.489070 -0.14370538 0.3538273
## 50 0.03601721 2.953656 0.01525008 0.3110777
## 100 0.12212892 3.031787 0.15414399 0.5524755
## 1000 -0.02229236 2.959583 -0.01960667 0.4428247
Con los resultados anteriores se inicia la evaluación y comparación de los cuatro estimadores a partir de las propiedades de insesgadez, eficiencia y consistencia.
Para evaluar esta propiedad, se realiza una comparación de los resultados del sesgo para cada conjunto de datos mediante su valor absoluto.
sesgosAbs <- abs(Sesgo)
sesgosAbs
## sesgo_theta1 sesgo_theta2 sesgo_theta3 sesgo_theta4
## 20 0.18223107 2.489070 0.14370538 0.3538273
## 50 0.03601721 2.953656 0.01525008 0.3110777
## 100 0.12212892 3.031787 0.15414399 0.5524755
## 1000 0.02229236 2.959583 0.01960667 0.4428247
min_sesgos_pos <- apply(sesgosAbs, 1, which.min)
for (i in seq_along(n)) {
cat(paste("Para", n[i], "repeticiones, el estimador más insesgado es el estimador", min_sesgos_pos[i], "\n"))
}
## Para 20 repeticiones, el estimador más insesgado es el estimador 3
## Para 50 repeticiones, el estimador más insesgado es el estimador 3
## Para 100 repeticiones, el estimador más insesgado es el estimador 1
## Para 1000 repeticiones, el estimador más insesgado es el estimador 3
Se observa para este caso que el estimador \(\hat{\theta}_3\) es el que presenta y cumple la propiedad de insesgadez para la mayoria de los tamaños de muestra evaluados, a excepción para el tamaño de muestra de 100 repeticiones, esto quiza se deba a un factor de aleatoriedad a la hora de generar los datos.
Para evaluar esta propiedad, se analizarán los resultados de la varianza para cada conjunto de datos, para indentificar cual es la menor y asi el estimador mas eficiente
min_var_pos <- apply(Varianza, 1, which.min)
for (i in seq_along(n)) {
cat(paste("Para", n[i], "repeticiones, el estimador más eficiente es el estimador", min_var_pos[i], "\n"))
}
## Para 20 repeticiones, el estimador más eficiente es el estimador 1
## Para 50 repeticiones, el estimador más eficiente es el estimador 3
## Para 100 repeticiones, el estimador más eficiente es el estimador 3
## Para 1000 repeticiones, el estimador más eficiente es el estimador 3
Se observa para este caso que el estimador \(\hat{\theta}_3\) es el que presenta la propiedad de eficiencia para la mayoria de los tamaños de muestra evaluados, a excepción para el tamaño de muestra de 20 repeticiones.
Un estimador se considera consistente si, a medida que se recopilan más datos, las estimaciones tienden a acercarse cada vez más al valor real del parámetro que para esta caso fue de \(\theta=3\)
Media
## media_theta1 media_theta2 media_theta3 media_theta4
## 20 2.817769 5.489070 2.856295 3.353827
## 50 3.036017 5.953656 3.015250 3.311078
## 100 3.122129 6.031787 3.154144 3.552475
## 1000 2.977708 5.959583 2.980393 3.442825
Se observa para este caso que los estimadores \(\hat{\theta}_3\) y \(\hat{\theta}_1\) son los que mejor presentan la propiedad de consistencia a manera general para distintos tamaños de muestra evaluados.
Los estimadores que mejores resultados presentaron a manera general son \(\hat{\theta}_3\) y \(\hat{\theta}_1\). Aunque el estimador \(\hat{\theta}_3\) es el que mejores resultados presenta en las tres propiedades, concluyendo que este es el mejor estimador de los cuatro propuestos.