La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean \(X_{1}\), \(X_{2}\), \(X_{3}\) y \(X_{4}\) una muestra aleatoria de tamaño \(n = 4\) cuya población la conforma una distribución exponencial con parámetro \(θ\) desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
\(\widehat{θ_{1}}= \frac{X_{1}+X_{2}}{6} + \frac{X_{3}+X_{4}}{3}\)
\(\widehat{θ_{2}}= \frac{(X_{1} + 2X_{2} + 3X_{3} + 4X_{4})}{5}\)
\(\widehat{θ_{3}}= \frac{(X_{1} + X_{2} + X_{3} + X_{4})}{4}\)
\(\widehat{θ_{4}}= \frac{min(X_{1} , X_{2} , X_{3} , X_{4}) + max(X_{1} , X_{2} , X_{3} , X_{4})}{2}\)
Se ha creado una función que permite realizar un número variable de simulaciones, de acuerdo a las necesidades.
Los parámetros de esta función son los siguientes:
N_Simul: Número de simulaciones a realizar. Parametro_Exp: Parámetro de la distribución exponencial que se emplea en las simulaciones.
# Establecer una semilla
set.seed(4812)
Muestra_Aleatoria <- function(N_Simul, Parametro_Exp)
{
#Se crea una lista vacia
Datos_Acum <- list()
#Inicia el ciclo
for (i in 1:N_Simul)
{
Xi <- rexp(4,Parametro_Exp)
theta1 = (Xi[1] + Xi[2]) / 6 + (Xi[3] + Xi[4]) / 3
theta2 = (Xi[1] + 2 * Xi[2] + 3 * Xi[3] + 4 * Xi[4]) / 5
theta3 = (Xi[1]+Xi[2]+Xi[3]+Xi[4]) / 4
theta4 = (min(Xi[1],Xi[2],Xi[3],Xi[4]) + max(Xi[1],Xi[2],Xi[3],Xi[4])) / 2
Datos <- data.frame(theta1, theta2, theta3 , theta4)
# Acumular resultados
if (i == 1)
{Datos_Acum <- Datos}
else
{Datos_Acum <- rbind(Datos_Acum, Datos)}
}
return(Datos_Acum)
}Se ha desarrollado una función que permite llevar a cabo simulaciones con los siguientes parámetros:
Sm: Número de simulaciones.
Ra: Parámetro de la distribución exponencial.
Esta función realiza la simulación y presenta los resultados de manera visual mediante un Boxplot, así como una tabla que resume las propiedades de los estimadores utilizados en la simulación.
Graficos_Propiedades <- function(Sm, Ra)
{
Simulación <- Muestra_Aleatoria(N_Simul = Sm, Parametro_Exp = Ra)
#Mostrar las primeras simulaciones
cat("\nPrimeras filas de simulación:\n")
print(head(Simulación))
#Crear un boxplot
boxplot(Simulación,
col= c("#FFFFE0", "#E6E6FA", "#87CEEB","#98FB98", "#FFB6C1"),
main= paste("Boxplot - Muestra:", Sm))
#Línea punteada
segments(0, 1/Ra , 5, 1/Ra , col = "darkgreen", lty = 2)
Valor_Del_Parametro <- 1/Ra
SesgoTheta1 <- mean(Simulación$theta1) - Valor_Del_Parametro
SesgoTheta2 <- mean(Simulación$theta2) - Valor_Del_Parametro
SesgoTheta3 <- mean(Simulación$theta3) - Valor_Del_Parametro
SesgoTheta4 <- mean(Simulación$theta4) - Valor_Del_Parametro
#Crear la tabla para las propiedades
tabla_Prop <- data.frame(
Estimador = c("Theta1", "Theta2", "Theta3", "Theta4"),
Valor_Parametro= c(Valor_Del_Parametro,Valor_Del_Parametro,Valor_Del_Parametro,Valor_Del_Parametro),
Media = c(mean(Simulación$theta1),mean(Simulación$theta2),mean(Simulación$theta3),mean(Simulación$theta4)),
Sesgo = c(SesgoTheta1, SesgoTheta2, SesgoTheta3, SesgoTheta4),
Varianza = c(var(Simulación$theta1),var(Simulación$theta2),var(Simulación$theta3),var(Simulación$theta4) )
)
return(tabla_Prop)
}Graficos_Propiedades(Sm= 20, Ra= 0.1)##
## Primeras filas de simulación:
## theta1 theta2 theta3 theta4
## 1 7.686540 14.05629 8.177644 6.892725
## 2 12.952227 29.30038 11.805015 14.818655
## 3 10.384925 19.43822 10.923835 10.738455
## 4 12.808774 27.62911 10.932461 14.085050
## 5 6.924143 15.34932 8.400607 12.829999
## 6 19.107783 35.55082 16.287593 22.814982
| Estimador | Valor_Parametro | Media | Sesgo | Varianza |
|---|---|---|---|---|
| Theta1 | 10 | 9.971388 | -0.0286124 | 21.38500 |
| Theta2 | 10 | 19.889789 | 9.8897891 | 88.79377 |
| Theta3 | 10 | 10.230795 | 0.2307947 | 17.93064 |
| Theta4 | 10 | 11.939128 | 1.9391278 | 32.98881 |
Graficos_Propiedades(Sm= 50, Ra= 0.1)##
## Primeras filas de simulación:
## theta1 theta2 theta3 theta4
## 1 3.690835 7.577692 4.195573 5.190368
## 2 4.008498 8.360610 3.804430 4.416636
## 3 9.858530 23.294449 8.393362 12.788866
## 4 18.577672 38.390866 17.014037 15.488869
## 5 12.971105 23.074844 13.638386 15.640227
## 6 10.206980 22.191813 12.066179 17.643776
| Estimador | Valor_Parametro | Media | Sesgo | Varianza |
|---|---|---|---|---|
| Theta1 | 10 | 9.257032 | -0.7429678 | 20.12111 |
| Theta2 | 10 | 18.616856 | 8.6168563 | 83.71130 |
| Theta3 | 10 | 9.415964 | -0.5840363 | 18.10427 |
| Theta4 | 10 | 11.210872 | 1.2108719 | 28.51771 |
Graficos_Propiedades(Sm= 100, Ra= 0.1)##
## Primeras filas de simulación:
## theta1 theta2 theta3 theta4
## 1 10.876098 16.27891 12.958967 19.032890
## 2 10.707835 23.11661 12.147618 16.466967
## 3 7.641596 14.56538 8.414311 9.436116
## 4 10.376808 21.07180 8.023179 8.983667
## 5 6.412889 13.20746 6.445938 6.545086
## 6 7.447004 15.33238 6.945686 6.351079
| Estimador | Valor_Parametro | Media | Sesgo | Varianza |
|---|---|---|---|---|
| Theta1 | 10 | 10.11531 | 0.1153075 | 24.64950 |
| Theta2 | 10 | 20.43623 | 10.4362296 | 102.76938 |
| Theta3 | 10 | 10.03299 | 0.0329929 | 22.53336 |
| Theta4 | 10 | 11.55327 | 1.5532686 | 35.64411 |
Graficos_Propiedades(Sm= 1000, Ra= 0.1)##
## Primeras filas de simulación:
## theta1 theta2 theta3 theta4
## 1 2.880410 5.567768 2.587444 2.362937
## 2 14.354529 29.397485 12.823288 12.941209
## 3 7.663774 14.458939 9.512474 9.835298
## 4 11.140718 21.338342 9.790537 13.498450
## 5 7.087895 12.042101 8.510343 12.422119
## 6 11.635716 25.018602 12.497499 15.082848
| Estimador | Valor_Parametro | Media | Sesgo | Varianza |
|---|---|---|---|---|
| Theta1 | 10 | 9.992229 | -0.0077707 | 28.06292 |
| Theta2 | 10 | 19.973710 | 9.9737100 | 123.44975 |
| Theta3 | 10 | 9.868477 | -0.1315231 | 24.49784 |
| Theta4 | 10 | 11.490063 | 1.4900628 | 38.79046 |
Al comparar los estimadores \(\widehat{θ_{1}}\), \(\widehat{θ_{2}}\), \(\widehat{θ_{3}}\) y \(\widehat{θ_{4}}\) en función de sus propiedades de insesgadez, eficiencia y consistencia, observamos patrones que revelan similitudes y diferencias entre ellos a medida que se aumenta el número de simulaciones.
\(\widehat{θ_{1}}\) y \(\widehat{θ_{3}}\) son similares en términos de insesgadez, eficiencia y consistencia. Ambos estimadores muestran una mejora constante a medida que se acumulan más datos, disminuyendo su sesgo y varianza. Esto sugiere que estos estimadores tienden a aproximarse al valor real del parámetro (10) y a mejorar su precisión a medida que se obtiene más información.
\(\widehat{θ_{4}}\) también muestra características positivas, mostrando menos sesgo, mayor eficiencia y mejor consistencia a medida que se aumenta el número de simulaciones. Aunque sus mejoras son evidentes, puede no ser tan eficiente como Theta1 y Theta3 en términos de varianza.
Por otro lado, \(\widehat{θ_{2}}\) destaca como el estimador con un sesgo más alto en comparación con los demás. A pesar de que su sesgo disminuye a medida que se acumulan más datos, sigue siendo menos deseable en términos de insesgadez. Sin embargo, su eficiencia y consistencia mejoran con más iteraciones, lo que indica que se vuelve más preciso con una mayor cantidad de información.