La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
set.seed(1)
n=4
t = 10
x=rexp(n, rate = 1/t)
ord=sort.list(x,decreasing = FALSE)
x=x[ord]
plot(x)
x
## [1] 1.397953 1.457067 7.551818 11.816428
Theta_1 = function(n){
x1 = n[1]
x2 = n[2]
x3 = n[3]
x4 = n[4]
t1 =(((x1+x2)/6)+((x3+x4)/3))
return(t1)
}
Est1 =Theta_1(x)
Theta_2 = function(n){
x1 = n[1]
x2 = n[2]
x3 = n[3]
x4 = n[4]
t2 = (x1+(2*x2)+(3*x3)+(4*x4))/5
return(t2)
}
Est2 =Theta_2(x)
Theta_3 = function(n){
x1 = n[1]
x2 = n[2]
x3 = n[3]
x4 = n[4]
t3 = (x1+x2+x3+x4)/4
return(t3)
}
Est3 =Theta_3(x)
Theta_4 = function(n){
x1 = n[1]
x2 = n[2]
x3 = n[3]
x4 = n[4]
t4 = (min(x1,x2,x3,x4)+max(x1,x2,x3,x4))/2
return(t4)
}
Est4 =Theta_4(x)
set.seed(20)
n_20= 20
D=n*n_20
Mat_1= matrix(rexp(D, rate = 1/t), ncol =4)
#Estimadores
T_1 = apply(Mat_1,1,Theta_1)
T_2 = apply(Mat_1,1,Theta_2)
T_3 = apply(Mat_1,1,Theta_3)
T_4 = apply(Mat_1,1,Theta_4)
M_20 = data.frame(T_1,T_2,T_3,T_4)
Mx= apply(M_20,2,mean)
Sd= apply(M_20,2,sd)
boxplot(M_20, las=1, main="Comparación estimadores con n=20",col=c("#ee964b", "royalblue", "seagreen", "purple"),xlab = "Estimadores")
abline(h=10, col="red")
Mx
## T_1 T_2 T_3 T_4
## 11.41276 23.30822 11.69811 14.19328
Sd
## T_1 T_2 T_3 T_4
## 6.466106 13.254570 6.844957 9.226788
Para un tamaño de muestra n=20 se observa que los mejores resultados se obtienen con T_1. Este estimador se puede clasificar como INSESGADO y EFICIENTE, pues ademas que su promedio está muy cerca del parametro 10, tiene la menor varianza
set.seed(50)
n_50= 50
D=n*n_50
Mat_1= matrix(rexp(D, rate = 1/t), ncol =4)
#Estimadores
T_1 = apply(Mat_1,1,Theta_1)
T_2 = apply(Mat_1,1,Theta_2)
T_3 = apply(Mat_1,1,Theta_3)
T_4 = apply(Mat_1,1,Theta_4)
M_50 = data.frame(T_1,T_2,T_3,T_4)
Mx= apply(M_50,2,mean)
Sd= apply(M_50,2,sd)
boxplot(M_50, las=1, main="Comparación estimadores con n=50",col=c("#ee964b", "royalblue", "seagreen", "purple"),xlab = "Estimadores")
abline(h=10, col="red")
Mx
## T_1 T_2 T_3 T_4
## 10.71923 21.56429 10.90375 12.39878
Sd
## T_1 T_2 T_3 T_4
## 6.042836 12.730616 6.245631 6.835372
Para un tamaño de muestra n=50 seguimos observando que los mejores resultados se obtienen con T_1. pues ademas el mas cercano al parametro, tiene la menor varianza
set.seed(100)
n_100= 100
D=n*n_100
Mat_1= matrix(rexp(D, rate = 1/t), ncol =4)
#Estimadores
T_1 = apply(Mat_1,1,Theta_1)
T_2 = apply(Mat_1,1,Theta_2)
T_3 = apply(Mat_1,1,Theta_3)
T_4 = apply(Mat_1,1,Theta_4)
M_100 = data.frame(T_1,T_2,T_3,T_4)
Mx= apply(M_100,2,mean)
Sd= apply(M_100,2,sd)
boxplot(M_100, las=1, main="Comparación estimadores con n=100",col=c("#ee964b", "royalblue", "seagreen", "purple"),xlab = "Estimadores")
abline(h=10, col="red")
Mx
## T_1 T_2 T_3 T_4
## 10.100748 20.185749 9.797572 11.611612
Sd
## T_1 T_2 T_3 T_4
## 5.309737 11.358404 4.454574 6.566401
Al aumentar la muestra a n=100 vemos como T_3 es el estimador que mas se acerca al parametro y tiene la menor varianza y en este caso se pordria clasificara como INSESGADO y EFICIENTE.
set.seed(1000)
n_1000= 1000
D=n*n_1000
Mat_1= matrix(rexp(D, rate = 1/t), ncol =4)
#Estimadores
T_1 = apply(Mat_1,1,Theta_1)
T_2 = apply(Mat_1,1,Theta_2)
T_3 = apply(Mat_1,1,Theta_3)
T_4 = apply(Mat_1,1,Theta_4)
M_1000 = data.frame(T_1,T_2,T_3,T_4)
Mx= apply(M_1000,2,mean)
Sd= apply(M_1000,2,sd)
boxplot(M_1000, las=1, main="Comparación estimadores con n=1000",col=c("#ee964b", "royalblue", "seagreen", "purple"),xlab = "Estimadores")
abline(h=10, col="red")
Mx
## T_1 T_2 T_3 T_4
## 9.843408 19.738458 9.893069 11.604508
Sd
## T_1 T_2 T_3 T_4
## 5.215179 10.882935 5.022255 6.327142
Para una muestra de n=1000 el estimador T_3 sigue siendo el estimador que mas se acerca al promedio = 10, asimismo es el que presenta menos varianza.
Por otra parte el estimador T_2 con una muestra n=20 , 50 , 100, y 1000 se comporta de la misma manera y es el que mas se aleja del parametro y presenta la varianza mas alta.