Actividad 2 - Problema 2

Construcción de la función

Se procede a la construcción de una función que permita evaluar los diferentes estimadores propuestos

set.seed(44)
est <- function(rep, theta) {
  X_rep <- lapply(1:rep, function(x) rexp(4, rate=1/theta))
  X_rep <- do.call(rbind, X_rep)
  
  res <- t(apply(X_rep, 1, function(x) {
    theta1 <- ((x[1]+x[2])/6) + ((x[3]+x[4])/3)
    theta2 <- (x[1]+(2*x[2])+(3*x[3])+(4*x[4]))/5
    theta3 <- (x[1]+x[2]+x[3]+x[4])/4
    theta4 <- (pmin(x[1],x[2],x[3],x[4])+pmax(x[1],x[2],x[3],x[4]))/2
    c(theta1, theta2, theta3, theta4)
  }))
  
  colnames(res) <- c("theta1", "theta2", "theta3", "theta4")
  
  res <- as.data.frame(res)
  
  return(res)
}

Una vez construida la función, se define un valor para el parámetro, el cual sera de \(\theta=3\), para posteriormente evaluar los estimadores para diferentes tamaños de muestra.

theta <- 3

res_20 <- est(20, theta)
res_50 <- est(50, theta)
res_100 <- est(100, theta)
res_1000 <- est(1000, theta)
res_20

##       theta1    theta2    theta3    theta4
## 1  0.8242602  1.677003 1.1099957 1.2597498
## 2  3.5940538  6.504533 4.3217168 5.2439866
## 3  2.6693171  5.583425 2.8309809 3.3159724
## 4  2.8206662  5.888828 2.7011378 2.3425528
## 5  1.5760423  3.075327 1.8096565 1.8513768
## 6  0.6888210  1.238536 0.7346091 0.8719735
## 7  3.2304665  6.705241 2.8986784 3.1776595
## 8  2.0314335  3.816869 2.1129524 1.8683955
## 9  2.5020378  5.682124 2.5327495 2.4406144
## 10 1.1544734  2.075877 1.5028978 1.5797491
## 11 1.8888460  3.898852 1.4558633 1.5859463
## 12 1.3454404  2.576836 1.3904514 1.2554184
## 13 1.9534910  4.446292 2.0419941 2.3075035
## 14 6.0827740 10.849229 5.0999828 7.5709858
## 15 2.6167873  4.758730 2.0523860 3.4713912
## 16 2.9615389  6.795500 2.7189700 2.8930608
## 17 5.1931979  9.121980 5.7285694 7.3346840
## 18 5.3315971 10.561376 5.2725239 5.0953042
## 19 4.3631896  6.876755 5.5982440 8.9872502
## 20 3.5269449  7.648090 3.2115327 2.6229700

Ahora se procede a realizar el calculo de la media, varianza y su respectivo sesgo para los 4 estimadores.

res <- list(res_20, res_50, res_100, res_1000)
n <- c("20", "50", "100", "1000")

estadisticas <- lapply(res, function(x) {
  media <- colMeans(x)
  varianza <- apply(x, 2, var)
  sesgo <- media - theta
  c(media, varianza, sesgo)
})

estadisticas_df <- do.call(rbind, estadisticas)
rownames(estadisticas_df) <- n
colnames(estadisticas_df) <- c(paste0("media_theta", 1:4), paste0("varianza_theta", 1:4), paste0("sesgo_theta", 1:4))

Media <- estadisticas_df[,1:4]
Varianza <- estadisticas_df[,5:8]
Sesgo <- estadisticas_df[,9:12]

Media

##      media_theta1 media_theta2 media_theta3 media_theta4
## 20       2.817769     5.489070     2.856295     3.353827
## 50       3.036017     5.953656     3.015250     3.311078
## 100      3.122129     6.031787     3.154144     3.552475
## 1000     2.977708     5.959583     2.980393     3.442825

Varianza

##      varianza_theta1 varianza_theta2 varianza_theta3 varianza_theta4
## 20          2.298954        7.587869        2.395490        5.336917
## 50          2.394750        8.825313        2.217627        2.770183
## 100         2.517633        9.240620        2.150738        3.007343
## 1000        2.365101        9.982625        2.174706        3.390491

Sesgo

##      sesgo_theta1 sesgo_theta2 sesgo_theta3 sesgo_theta4
## 20    -0.18223107     2.489070  -0.14370538    0.3538273
## 50     0.03601721     2.953656   0.01525008    0.3110777
## 100    0.12212892     3.031787   0.15414399    0.5524755
## 1000  -0.02229236     2.959583  -0.01960667    0.4428247

Propiedades

Con los resultados anteriores se inicia la evaluación y comparación de los cuatro estimadores a partir de las propiedades de insesgadez, eficiencia y consistencia.

Insesgadez

Para evaluar esta propiedad, se realiza una comparación de los resultados del sesgo para cada conjunto de datos mediante su valor absoluto.

sesgosAbs <- abs(Sesgo)
sesgosAbs

##      sesgo_theta1 sesgo_theta2 sesgo_theta3 sesgo_theta4
## 20     0.18223107     2.489070   0.14370538    0.3538273
## 50     0.03601721     2.953656   0.01525008    0.3110777
## 100    0.12212892     3.031787   0.15414399    0.5524755
## 1000   0.02229236     2.959583   0.01960667    0.4428247

min_sesgos_pos <- apply(sesgosAbs, 1, which.min)
for (i in seq_along(n)) {
  cat(paste("Para", n[i], "repeticiones, el estimador más insesgado es el estimador", min_sesgos_pos[i], "\n"))
}

## Para 20 repeticiones, el estimador más insesgado es el estimador 3 
## Para 50 repeticiones, el estimador más insesgado es el estimador 3 
## Para 100 repeticiones, el estimador más insesgado es el estimador 1 
## Para 1000 repeticiones, el estimador más insesgado es el estimador 3

Se observa para este caso que el estimador \(\hat{\theta}_3\) es el que presenta y cumple la propiedad de insesgadez para la mayoria de los tamaños de muestra evaluados, a excepción para el tamaño de muestra de 100 repeticiones, esto quiza se deba a un factor de aleatoriedad a la hora de generar los datos.

Eficiencia

Para evaluar esta propiedad, se analizarán los resultados de la varianza para cada conjunto de datos, para indentificar cual es la menor y asi el estimador mas eficiente

min_var_pos <- apply(Varianza, 1, which.min) 

for (i in seq_along(n)) {
  cat(paste("Para", n[i], "repeticiones, el estimador más eficiente es el estimador", min_var_pos[i], "\n"))
}

## Para 20 repeticiones, el estimador más eficiente es el estimador 1 
## Para 50 repeticiones, el estimador más eficiente es el estimador 3 
## Para 100 repeticiones, el estimador más eficiente es el estimador 3 
## Para 1000 repeticiones, el estimador más eficiente es el estimador 3

Se observa para este caso que el estimador \(\hat{\theta}_3\) es el que presenta la propiedad de eficiencia para la mayoria de los tamaños de muestra evaluados, a excepción para el tamaño de muestra de 20 repeticiones.

Consistencia

Un estimador se considera consistente si, a medida que se recopilan más datos, las estimaciones tienden a acercarse cada vez más al valor real del parámetro que para esta caso fue de \(\theta=3\)

Media

##      media_theta1 media_theta2 media_theta3 media_theta4
## 20       2.817769     5.489070     2.856295     3.353827
## 50       3.036017     5.953656     3.015250     3.311078
## 100      3.122129     6.031787     3.154144     3.552475
## 1000     2.977708     5.959583     2.980393     3.442825

Se observa para este caso que los estimadores \(\hat{\theta}_3\) y \(\hat{\theta}_1\) son los que mejor presentan la propiedad de consistencia a manera general para distintos tamaños de muestra evaluados.

Conclusiones

Los estimadores que mejores resultados presentaron a manera general son \(\hat{\theta}_3\) y \(\hat{\theta}_1\). Aunque el estimador \(\hat{\theta}_3\) es el que mejores resultados presenta en las tres propiedades, concluyendo que este es el mejor estimador de los cuatro propuestos.