La simulación ayuda a entender y validar las propiedades de los estimadores estadísticos como son insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
θ1ˆ=(X1+X2)/6+(X3+X4)/3
θ2ˆ=(X1+2X2+3X3+4X4)/5
θ3ˆ=(X1+X2+X3+X4)/4
θ4ˆ=(min{X1,X2,X3,X4}+max{X1,X2,X3,X4})/2
Nota:
-Genere una muestras de n=20, 50, 100 y 1000 para cada uno de los estimadores planteados.
-En cada caso evalue las propiedades de insesgadez, eficiencia y consistencia
-Suponga un valor para el parámetro θ
-funciones recomendadas : function(){}, rexp() , data.frame(), apply(), boxplot()
-Entregable : enlace en RPubs con informe 2
x <- c(20, 50, 100, 1000)
for (n in x) {
lambda <- 8
set.seed (123)
x1 = rexp(n, lambda)
x2 = rexp(n, lambda)
x3 = rexp(n, lambda)
x4 = rexp(n, lambda)
datos = data.frame(x1, x2, x3, x4)
dato_min = apply(datos, 1, min)
dato_max = apply(datos, 1, max)
estimadores = data.frame(
t1 = (x1 + x2)/6 + (x3 + x4)/3,
t2 = (x1 +2*x2 + 3*x3 + 4*x4)/5,
t3 = (x1 + x2 + x3 + x4)/4,
t4 = (dato_min + dato_max)/2
)
# Media
medias <- colMeans(estimadores)
sesgo <- medias - 0.125
#Varianza
varianza <- apply(estimadores, 2, var)
print(varianza)
#Calculo MSE
verdadero_valor <- 1/lambda
mse_t1 = mean((estimadores$t1 - verdadero_valor)^2)
mse_t2 = mean((estimadores$t2 - verdadero_valor)^2)
mse_t3 = mean((estimadores$t3 - verdadero_valor)^2)
mse_t4 = mean((estimadores$t4 - verdadero_valor)^2)
mse = c(mse_t1, mse_t2, mse_t3, mse_t4)
#Desviación estándar
desv_est1 = sd(estimadores$t1)
desv_est2 = sd(estimadores$t2)
desv_est3 = sd(estimadores$t3)
desv_est4 = sd(estimadores$t4)
desv_est = c(desv_est1, desv_est2, desv_est3, desv_est4)
boxplot(estimadores, main = paste("Estimadores n =", n), xlab = "Estimadores", ylab = "Valor", col = terrain.colors(4))
abline(h=0.125, col = "Red")
resultados <- data.frame(Insesgadez = sesgo, Eficiencia = varianza,
consistencia = mse, Media = medias, desviacion_estandar = desv_est)
print(paste("Resultados para n = ", n))
print(resultados)
}
## t1 t2 t3 t4
## 0.004252083 0.013701203 0.003103096 0.008136355
## [1] "Resultados para n = 20"
## Insesgadez Eficiencia consistencia Media desviacion_estandar
## t1 0.004428048 0.004252083 0.004059086 0.1294280 0.06520800
## t2 0.130494848 0.013701203 0.030045048 0.2554948 0.11705214
## t3 0.002141112 0.003103096 0.002952526 0.1271411 0.05570544
## t4 0.025098480 0.008136355 0.008359471 0.1500985 0.09020175
## t1 t2 t3 t4
## 0.004185770 0.016747256 0.004202688 0.007704705
## [1] "Resultados para n = 50"
## Insesgadez Eficiencia consistencia Media desviacion_estandar
## t1 -0.0006994143 0.004185770 0.004102544 0.1243006 0.06469753
## t2 0.1223774163 0.016747256 0.031388543 0.2473774 0.12941119
## t3 0.0009041490 0.004202688 0.004119452 0.1259041 0.06482814
## t4 0.0197030131 0.007704705 0.007938820 0.1447030 0.08777645
## t1 t2 t3 t4
## 0.003237885 0.014675232 0.003091019 0.005142787
## [1] "Resultados para n = 100"
## Insesgadez Eficiencia consistencia Media desviacion_estandar
## t1 -0.0014561182 0.003237885 0.003207626 0.1235439 0.05690241
## t2 0.1195810557 0.014675232 0.028828109 0.2445811 0.12114137
## t3 -0.0008660514 0.003091019 0.003060859 0.1241339 0.05559693
## t4 0.0183479971 0.005142787 0.005428008 0.1433480 0.07171323
## t1 t2 t3 t4
## 0.004472038 0.018385208 0.004060076 0.006307498
## [1] "Resultados para n = 1000"
## Insesgadez Eficiencia consistencia Media desviacion_estandar
## t1 -4.948764e-04 0.004472038 0.004467811 0.1245051 0.06687330
## t2 1.224627e-01 0.018385208 0.033363945 0.2474627 0.13559207
## t3 -3.106624e-06 0.004060076 0.004056016 0.1249969 0.06371872
## t4 2.025507e-02 0.006307498 0.006711458 0.1452551 0.07941976
Se evaluaron los 4 estimadores escogiendo un lambda de 8, con lo que la media debe aproximarse a 0.125, revisando los diagramas de cajas y bigotes pareciera que el estimador t4 se aproxima más a la media, sin embargo,observando las tablas generadas con los valores para Insesgadez, Eficiencia, Consistencia, media y desviación estándar, se puede deetrminar que lo mejores estimadores son t1 y t3, ya que se aproximas más a la media y finalmente escogemos t3 como el mejor estimador que aunque la media está un poco más alejada que t1, presenta valores más pequeños en desviación estandar, consistencia, eficiencia e insesgadez.
A medida que n crece el valor de la media se va aproximando cada vez más al valor esperado de 0.125.