Para calcular las características para cada uno de los siguientes estimadores:
\[ \hat{\theta}_1 = \frac{X_1 + X_2}{6} + \frac{X_3 + X_4}{3} \]
\[ \hat{\theta}_2 = \frac{X_1 + 2X_2 + 3X_3 + 4X_4}{5} \]
\[ \hat{\theta}_3 = \frac{X_1 + X_2 + X_3 + X_4}{4} \]
\[ \hat{\theta}_4 = \frac{\min(X_1, X_2, X_3, X_4) + \max(X_1, X_2, X_3, X_4)}{2} \] Supondremos un valor esperado de \(\theta = 5\), por lo tanto \(\lambda = 1/\theta\). Así mismo, utilizaremos las siguientes funciones:
rexp(): genera números aleatorios con distribución
exponencial data.frame(): genere un dataframe de
datos boxplot(): genera un digrama de cajas y
bigotes set.seed(123)
muestra <- c(20, 50, 100, 1000)
resultados <- data.frame(
tamano_muestra = integer(),
estimador = character(),
media = numeric(),
varianza = numeric(),
stringsAsFactors = FALSE
)
for(n in muestra) {
theta <- 5
lamda <- 1/theta
x1 <- rexp(n,lamda)
x2 <- rexp(n,lamda)
x3 <- rexp(n,lamda)
x4 <- rexp(n,lamda)
x1234 = data.frame(x1,x2,x3,x4)
minx = apply(x1234,1,min)
maxx = apply(x1234,1,max)
data <- data.frame(
t1 <-(x1+x2)/6 + (x3+x4)/3,
t2 <- (x1+2*x2+3*x3+4*x4)/5,
t3 <- (x1+x2+x3+x4)/4,
t4 <- (minx+maxx)/2
)
names(data) <- c("t1","t2","t3","t4")
boxplot(data, main = paste("boxplot con tamano de muestra = ",n))
abline(h=theta, col='red')
media_t1 <- mean(t1)
media_t2 <- mean(t2)
media_t3 <- mean(t3)
media_t4 <- mean(t4)
varianza_t1 <- var(t1)
varianza_t2 <- var(t2)
varianza_t3 <- var(t3)
varianza_t4 <- var(t4)
# Agregar los resultados al dataframe usando rbind()
resultados <- rbind(resultados, data.frame(
tamaño_muestra = n,
estimador = "t1",
media = media_t1,
varianza = varianza_t1
))
resultados <- rbind(resultados, data.frame(
tamaño_muestra = n,
estimador = "t2",
media = media_t2,
varianza = varianza_t2
))
resultados <- rbind(resultados, data.frame(
tamaño_muestra = n,
estimador = "t3",
media = media_t3,
varianza = varianza_t3
))
resultados <- rbind(resultados, data.frame(
tamaño_muestra = n,
estimador = "t4",
media = media_t4,
varianza = varianza_t4
))
}
resultados %>%
kbl(caption = "Resultados de la media y varianza de los estimadores") %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"), full_width = FALSE) %>%
column_spec(3:4, bold = TRUE, color = "black")
| tamaño_muestra | estimador | media | varianza |
|---|---|---|---|
| 20 | t1 | 5.177122 | 6.803333 |
| 20 | t2 | 10.219794 | 21.921925 |
| 20 | t3 | 5.085644 | 4.964954 |
| 20 | t4 | 6.003939 | 13.018168 |
| 50 | t1 | 5.156130 | 5.079508 |
| 50 | t2 | 10.323881 | 21.182705 |
| 50 | t3 | 5.107464 | 4.394524 |
| 50 | t4 | 5.685169 | 6.360973 |
| 100 | t1 | 4.989776 | 6.791158 |
| 100 | t2 | 10.109399 | 27.559371 |
| 100 | t3 | 4.982349 | 6.004551 |
| 100 | t4 | 5.844113 | 8.874438 |
| 1000 | t1 | 5.019668 | 7.352848 |
| 1000 | t2 | 10.029079 | 31.802506 |
| 1000 | t3 | 5.025265 | 6.877106 |
| 1000 | t4 | 5.874587 | 10.572377 |
Por lo tanto, los estimadores \(\hat{\theta}_1\) y \(\hat{\theta}_3\) son insesgados, ya que sus valores se aproximan al valor de \(\theta = 5\). Para los tamaños de muestra \(n=20\) y \(n=50\) el estimador \(\hat{\theta}_3\) muestra mejor eficiencia que \(\hat{\theta}_1\), dado que presenta una menor varianza. No obstante, a medida que aumenta el tamaño de muestra \(n=100\) y \(n=1000\), ambos estimadores \(\hat{\theta}_1\) y \(\hat{\theta}_3\) se vuelven más consistentes, aunque su efiencia disminuye debido al incremento de la varianza.