Problema 2

Propiedades de los estimadores


Para calcular las características para cada uno de los siguientes estimadores:

\[ \hat{\theta}_1 = \frac{X_1 + X_2}{6} + \frac{X_3 + X_4}{3} \]

\[ \hat{\theta}_2 = \frac{X_1 + 2X_2 + 3X_3 + 4X_4}{5} \]

\[ \hat{\theta}_3 = \frac{X_1 + X_2 + X_3 + X_4}{4} \]

\[ \hat{\theta}_4 = \frac{\min(X_1, X_2, X_3, X_4) + \max(X_1, X_2, X_3, X_4)}{2} \] Supondremos un valor esperado de \(\theta = 5\), por lo tanto \(\lambda = 1/\theta\). Así mismo, utilizaremos las siguientes funciones:

rexp(): genera números aleatorios con distribución exponencial
data.frame(): genere un dataframe de datos
boxplot(): genera un digrama de cajas y bigotes



Resultado

set.seed(123)
muestra <- c(20, 50, 100, 1000)
resultados <- data.frame(
  tamano_muestra = integer(),
  estimador = character(),
  media = numeric(),
  varianza = numeric(),
  stringsAsFactors = FALSE
)
for(n in muestra) {
theta <- 5
lamda <- 1/theta
x1 <- rexp(n,lamda)
x2 <- rexp(n,lamda)
x3 <- rexp(n,lamda)
x4 <- rexp(n,lamda)

x1234 = data.frame(x1,x2,x3,x4)
minx = apply(x1234,1,min)
maxx = apply(x1234,1,max)

data <- data.frame(
t1 <-(x1+x2)/6 + (x3+x4)/3,
t2 <- (x1+2*x2+3*x3+4*x4)/5,
t3 <- (x1+x2+x3+x4)/4,
t4 <- (minx+maxx)/2
)
names(data) <- c("t1","t2","t3","t4")

boxplot(data, main = paste("boxplot con tamano de muestra = ",n))
abline(h=theta, col='red')

  media_t1 <- mean(t1)
  media_t2 <- mean(t2)
  media_t3 <- mean(t3)
  media_t4 <- mean(t4)
  
  varianza_t1 <- var(t1)
  varianza_t2 <- var(t2)
  varianza_t3 <- var(t3)
  varianza_t4 <- var(t4)
  
  # Agregar los resultados al dataframe usando rbind()
  resultados <- rbind(resultados, data.frame(
    tamaño_muestra = n,
    estimador = "t1",
    media = media_t1,
    varianza = varianza_t1
  ))
  
  resultados <- rbind(resultados, data.frame(
    tamaño_muestra = n,
    estimador = "t2",
    media = media_t2,
    varianza = varianza_t2
  ))
  
  resultados <- rbind(resultados, data.frame(
    tamaño_muestra = n,
    estimador = "t3",
    media = media_t3,
    varianza = varianza_t3
  ))
  
  resultados <- rbind(resultados, data.frame(
    tamaño_muestra = n,
    estimador = "t4",
    media = media_t4,
    varianza = varianza_t4
  ))
}

resultados %>%
  kbl(caption = "Resultados de la media y varianza de los estimadores") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"), full_width = FALSE) %>%
  column_spec(3:4, bold = TRUE, color = "black")
Resultados de la media y varianza de los estimadores
tamaño_muestra estimador media varianza
20 t1 5.177122 6.803333
20 t2 10.219794 21.921925
20 t3 5.085644 4.964954
20 t4 6.003939 13.018168
50 t1 5.156130 5.079508
50 t2 10.323881 21.182705
50 t3 5.107464 4.394524
50 t4 5.685169 6.360973
100 t1 4.989776 6.791158
100 t2 10.109399 27.559371
100 t3 4.982349 6.004551
100 t4 5.844113 8.874438
1000 t1 5.019668 7.352848
1000 t2 10.029079 31.802506
1000 t3 5.025265 6.877106
1000 t4 5.874587 10.572377

Por lo tanto, los estimadores \(\hat{\theta}_1\) y \(\hat{\theta}_3\) son insesgados, ya que sus valores se aproximan al valor de \(\theta = 5\). Para los tamaños de muestra \(n=20\) y \(n=50\) el estimador \(\hat{\theta}_3\) muestra mejor eficiencia que \(\hat{\theta}_1\), dado que presenta una menor varianza. No obstante, a medida que aumenta el tamaño de muestra \(n=100\) y \(n=1000\), ambos estimadores \(\hat{\theta}_1\) y \(\hat{\theta}_3\) se vuelven más consistentes, aunque su efiencia disminuye debido al incremento de la varianza.