Las propiedades de los estimadores que se analizan en esta actividad son: insesgadez, eficiencia y consistencia. Para esto, a través de una simulación, se estudian las características de cuatro estimadores para la estimación de un parámetro asociado a un modelo de probabilidad exponencial.
Se asume una población con distribución de probabilidad exponancial con rate 0.5 de la cual se obtienen muestras aleatorias de tamaño n=4, para estudiar las propiedades de los estimadores se generan simulaciones con diferentes tamaños de corridas k=(20, 50, 100 y 1000), para cada simulación se calculan la media,la desviación y se gráfican los resultados con boxplot.
set.seed(2)
n=4 # n es el tamaño de la muestra
m=1000*4 # m/n es el número de corridas máximo de cada simulación
Y=matrix(rexp(m, 0.5), ncol=n) # matriz de datos de tamaño m/n x n
head(Y)
## [,1] [,2] [,3] [,4]
## [1,] 3.7307049 0.4446521 1.8122106 3.2686674
## [2,] 0.8094961 2.0922084 1.3669475 8.8304441
## [3,] 0.2933053 2.6150193 3.5699179 0.4847102
## [4,] 3.4614194 0.4457254 3.8655113 1.1954981
## [5,] 0.1790524 4.9790354 0.1382139 1.3731644
## [6,] 1.3337953 0.2525849 2.1875142 2.1043135
Y20=Y[1:20,]
Y50=Y[1:50,]
Y100=Y[1:100,]
estA1=numeric()
estA2=numeric()
estA3=numeric()
estA4=numeric()
for(ai in 1:20)
{
TA1=((Y20[ai,1]+Y20[ai,2])/6)+((Y20[ai,3]+Y20[ai,4])/3)
estA1=c(estA1, TA1)
TA2=(Y20[ai,1]+2*Y20[ai,2]+3*Y20[ai,3]+4*Y20[ai,4])/5
estA2=c(estA2, TA2)
TA3=(Y20[ai,1]+Y20[ai,2]+Y20[ai,3]+Y20[ai,4])/4
estA3=c(estA3, TA3)
TA4=(min(Y20[ai,1], Y20[ai,2], Y20[ai,3], Y20[ai,4])+max(Y20[ai,1], Y20[ai,2], Y20[ai,3], Y20[ai,4]))/2
estA4=c(estA4, TA4)
}
TA1234=data.frame(estA1, estA2, estA3, estA4)
boxplot(TA1234, ylim=c(0, 10), las=1, main="Gráfico A. Comparación estimadores con 20 corridas")
abline(h=2, col="blue")
MediasA=apply(TA1234, 2, mean)
MediasA
## estA1 estA2 estA3 estA4
## 2.122372 4.199895 2.115504 2.342655
DesviacionA=apply(TA1234, 2, sd)
DesviacionA
## estA1 estA2 estA3 estA4
## 0.7160366 1.5672324 0.6143964 0.9984591
Teniendo en cuenta el escenario A, un tamaño de muestra n=4 y una simulación de 20 corridas, se observa que los mejores resultados se obtienen con el estimador estA3, el cual se puede considerar insesgado y eficiente porque además de que su promedio es el más cercano a 2 (1/rate o sea 1/0.5=2), su desviación es la menor de los cuatro estimadores analizados.
Para analizar el impacto generado en las propiedades de los estimadores al aumentar el tamaño de las corridas, a continuación se repiten las simulaciones para diferentes escenarios B=50, C=100 y D=1000 corridas, al finalizar se presenta un resumen comprativo con los resultados de los cuatro estimadores en cada escenario inclyendo las medias, las deviaciones y los gráficos boxplot en cada caso.
rbind(MediasA, MediasB, MediasC, MediasD)
## estA1 estA2 estA3 estA4
## MediasA 2.122372 4.199895 2.115504 2.342655
## MediasB 2.052926 4.096743 2.045744 2.419190
## MediasC 2.046388 4.100352 2.036289 2.353380
## MediasD 2.004970 4.009308 2.001265 2.342929
rbind(DesviacionA, DesviacionB, DesviacionC, DesviacionD)
## estA1 estA2 estA3 estA4
## DesviacionA 0.7160366 1.567232 0.6143964 0.9984591
## DesviacionB 1.0383367 2.170159 0.9086286 1.4106861
## DesviacionC 1.0775697 2.257150 0.9788027 1.3216504
## DesviacionD 1.0814175 2.263672 0.9989084 1.2583063
Un estimador se considera: insesgado si su media se acerca notoriamente al valor del paramétro, eficiente si al compararlo con otros estimadores insesgados presenta la menor varianza y consistente si al aumentar el tamaño de la muestra se acerca más al valor del parámetro, es decir, si el tamaño de la muestra tiende a infinito el sesgo tiende a cero.
Los resultados indican que, de los cuatro analizados, el mejor estimador de rate es el estA3 porque: es insesgado al estar su valor muy cercano a 2 (1/rate o sea 1/0.5=2), es eficiente al ser el de menor desviación y es consistente al disminuir el sesgo a medida que se incrementa el tamaño de las corridas de la simulación.
También es un buen estimador de rate el estA1 pero tiene un sesgo y una desviación un poco más altos que el estA3. El estA4 es un estimador aceptable pero tiene un sesgo mucho más alto que los estimadores estA1 y estA3 y, definitivamente el estA2 es sesgado y no es un buen estimador de rate.