Introducción

Las propiedades de los estimadores que se analizan en esta actividad son: insesgadez, eficiencia y consistencia. Para esto, a través de una simulación, se estudian las características de cuatro estimadores para la estimación de un parámetro asociado a un modelo de probabilidad exponencial.

Se asume una población con distribución de probabilidad exponancial con rate 0.5 de la cual se obtienen muestras aleatorias de tamaño n=4, para estudiar las propiedades de los estimadores se generan simulaciones con diferentes tamaños de corridas k=(20, 50, 100 y 1000), para cada simulación se calculan la media,la desviación y se gráfican los resultados con boxplot.

a. Se simula una matriz de datos de tamaño 1000 x 4 poveniente de una población con distribución exponencial con rate 0.5.

set.seed(2)
n=4   # n es el tamaño de la muestra
m=1000*4   # m/n es el número de corridas máximo de cada simulación
Y=matrix(rexp(m, 0.5), ncol=n) # matriz de datos de tamaño m/n x n

head(Y)
##           [,1]      [,2]      [,3]      [,4]
## [1,] 3.7307049 0.4446521 1.8122106 3.2686674
## [2,] 0.8094961 2.0922084 1.3669475 8.8304441
## [3,] 0.2933053 2.6150193 3.5699179 0.4847102
## [4,] 3.4614194 0.4457254 3.8655113 1.1954981
## [5,] 0.1790524 4.9790354 0.1382139 1.3731644
## [6,] 1.3337953 0.2525849 2.1875142 2.1043135

b. Se obtiene las submatrices de Y para los tamaños de las corridas k(A=20, B=50, C=100 y D=1000) creando los escenarios A, B, C y D para cada tamaño k.

Y20=Y[1:20,]
Y50=Y[1:50,]
Y100=Y[1:100,]

c1. Se calculan los cuatro estimadores para una simulación con 20 corridas (Escenario A)

estA1=numeric()
estA2=numeric()
estA3=numeric()
estA4=numeric()

for(ai in 1:20)
{
TA1=((Y20[ai,1]+Y20[ai,2])/6)+((Y20[ai,3]+Y20[ai,4])/3)
estA1=c(estA1, TA1)

TA2=(Y20[ai,1]+2*Y20[ai,2]+3*Y20[ai,3]+4*Y20[ai,4])/5
estA2=c(estA2, TA2)

TA3=(Y20[ai,1]+Y20[ai,2]+Y20[ai,3]+Y20[ai,4])/4
estA3=c(estA3, TA3)

TA4=(min(Y20[ai,1], Y20[ai,2], Y20[ai,3], Y20[ai,4])+max(Y20[ai,1], Y20[ai,2], Y20[ai,3], Y20[ai,4]))/2
estA4=c(estA4, TA4)
}

c2.Se gráfica con boxplot los estimadores obtenidos con la simulación de 20 corridas.

TA1234=data.frame(estA1, estA2, estA3, estA4)

boxplot(TA1234, ylim=c(0, 10), las=1, main="Gráfico A. Comparación estimadores con 20 corridas")
abline(h=2, col="blue")

c3. Se calculan las medias y desviaciones de cada estimador obtenido con 20 corridas.

MediasA=apply(TA1234, 2, mean)
MediasA
##    estA1    estA2    estA3    estA4 
## 2.122372 4.199895 2.115504 2.342655
DesviacionA=apply(TA1234, 2, sd)
DesviacionA
##     estA1     estA2     estA3     estA4 
## 0.7160366 1.5672324 0.6143964 0.9984591

Teniendo en cuenta el escenario A, un tamaño de muestra n=4 y una simulación de 20 corridas, se observa que los mejores resultados se obtienen con el estimador estA3, el cual se puede considerar insesgado y eficiente porque además de que su promedio es el más cercano a 2 (1/rate o sea 1/0.5=2), su desviación es la menor de los cuatro estimadores analizados.

Para analizar el impacto generado en las propiedades de los estimadores al aumentar el tamaño de las corridas, a continuación se repiten las simulaciones para diferentes escenarios B=50, C=100 y D=1000 corridas, al finalizar se presenta un resumen comprativo con los resultados de los cuatro estimadores en cada escenario inclyendo las medias, las deviaciones y los gráficos boxplot en cada caso.

d1. Se calculan los cuatro estimadores para una simulación con 50 corridas (Escenario B)

d2.Se gráfica con boxplot los estimadores obtenidos con la simulación de 50 corridas.

d3. Se calculan las medias y desviaciones de cada estimador obtenido con 50 corridas.

e1. Se calculan los cuatro estimadores para una simulación con 100 corridas (Escenario C)

e2.Se gráfica con boxplot los estimadores obtenidos con la simulación de 100 corridas.

e3. Se calculan las medias y desviaciones de cada estimador obtenido con 100 corridas.

f1. Se calculan los cuatro estimadores para una simulación con 1000 corridas (Escenario D)

f2.Se gráfica con boxplot los estimadores obtenidos con la simulación de 1000 corridas.

f3. Se calculan las medias y desviaciones de cada estimador obtenido con 1000 corridas.

g. Tablas resumidas de medias y desviaciones para cada escenario de simulación

rbind(MediasA, MediasB, MediasC, MediasD)
##            estA1    estA2    estA3    estA4
## MediasA 2.122372 4.199895 2.115504 2.342655
## MediasB 2.052926 4.096743 2.045744 2.419190
## MediasC 2.046388 4.100352 2.036289 2.353380
## MediasD 2.004970 4.009308 2.001265 2.342929
rbind(DesviacionA, DesviacionB, DesviacionC, DesviacionD)
##                 estA1    estA2     estA3     estA4
## DesviacionA 0.7160366 1.567232 0.6143964 0.9984591
## DesviacionB 1.0383367 2.170159 0.9086286 1.4106861
## DesviacionC 1.0775697 2.257150 0.9788027 1.3216504
## DesviacionD 1.0814175 2.263672 0.9989084 1.2583063

h. Comparativo gráficos boxplot para los estimadores en los cuatros escenarios.

i. Análisis de los resultados.

Un estimador se considera: insesgado si su media se acerca notoriamente al valor del paramétro, eficiente si al compararlo con otros estimadores insesgados presenta la menor varianza y consistente si al aumentar el tamaño de la muestra se acerca más al valor del parámetro, es decir, si el tamaño de la muestra tiende a infinito el sesgo tiende a cero.

Los resultados indican que, de los cuatro analizados, el mejor estimador de rate es el estA3 porque: es insesgado al estar su valor muy cercano a 2 (1/rate o sea 1/0.5=2), es eficiente al ser el de menor desviación y es consistente al disminuir el sesgo a medida que se incrementa el tamaño de las corridas de la simulación.

También es un buen estimador de rate el estA1 pero tiene un sesgo y una desviación un poco más altos que el estA3. El estA4 es un estimador aceptable pero tiene un sesgo mucho más alto que los estimadores estA1 y estA3 y, definitivamente el estA2 es sesgado y no es un buen estimador de rate.