Unidad 2 - Problema No. 2 Propiedades de los estimadores

Propiedades de los estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

set.seed(1)
n=4
t = 10
x=rexp(n, rate = 1/t)

ord=sort.list(x,decreasing = FALSE)
x=x[ord]

plot(x)

## [1]  1.397953  1.457067  7.551818 11.816428

Estimadores

Estimador No. 1

Theta_1 = function(n){
  x1 = n[1]
  x2 = n[2]
  x3 = n[3]
  x4 = n[4]
  t1 =(((x1+x2)/6)+((x3+x4)/3))
  return(t1)
}

Est1 =Theta_1(x)

Estimador No. 2

Theta_2 = function(n){
  x1 = n[1]
  x2 = n[2]
  x3 = n[3]
  x4 = n[4]
  t2 = (x1+(2*x2)+(3*x3)+(4*x4))/5
  return(t2)
}

Est2 =Theta_2(x)

Estimador No. 3

Theta_3 = function(n){
  x1 = n[1]
  x2 = n[2]
  x3 = n[3]
  x4 = n[4]
  t3 = (x1+x2+x3+x4)/4
  return(t3)
}

Est3 =Theta_3(x)

Estimador No. 4

Theta_4 = function(n){
  x1 = n[1]
  x2 = n[2]
  x3 = n[3]
  x4 = n[4]
  t4 = (min(x1,x2,x3,x4)+max(x1,x2,x3,x4))/2
  return(t4)
}

Est4 =Theta_4(x)

Simulaciones

simulación n=20

set.seed(20)
n_20= 20

D=n*n_20
Mat_1= matrix(rexp(D, rate = 1/t), ncol =4)

#Estimadores

T_1 = apply(Mat_1,1,Theta_1)
T_2 = apply(Mat_1,1,Theta_2)
T_3 = apply(Mat_1,1,Theta_3)
T_4 = apply(Mat_1,1,Theta_4)

M_20 = data.frame(T_1,T_2,T_3,T_4)

Mx= apply(M_20,2,mean)    
Sd= apply(M_20,2,sd)

boxplot(M_20, las=1, main="Comparación estimadores con n=20",col=c("#ee964b", "royalblue", "seagreen", "purple"),xlab = "Estimadores")  
abline(h=10,  col="red")

Mx

##      T_1      T_2      T_3      T_4 
## 11.41276 23.30822 11.69811 14.19328

Sd

##       T_1       T_2       T_3       T_4 
##  6.466106 13.254570  6.844957  9.226788

Para un tamaño de muestra n=20 se observa que los mejores resultados se obtienen con T_1. Este estimador se puede clasificar como INSESGADO y EFICIENTE, pues ademas que su promedio está muy cerca del parametro 10, tiene la menor varianza

simulación n=50

set.seed(50)
n_50= 50

D=n*n_50
Mat_1= matrix(rexp(D, rate = 1/t), ncol =4)

#Estimadores

T_1 = apply(Mat_1,1,Theta_1)
T_2 = apply(Mat_1,1,Theta_2)
T_3 = apply(Mat_1,1,Theta_3)
T_4 = apply(Mat_1,1,Theta_4)

M_50 = data.frame(T_1,T_2,T_3,T_4)

Mx= apply(M_50,2,mean)    
Sd= apply(M_50,2,sd)

boxplot(M_50, las=1, main="Comparación estimadores con n=50",col=c("#ee964b", "royalblue", "seagreen", "purple"),xlab = "Estimadores")  
abline(h=10,  col="red")

Mx

##      T_1      T_2      T_3      T_4 
## 10.71923 21.56429 10.90375 12.39878

Sd

##       T_1       T_2       T_3       T_4 
##  6.042836 12.730616  6.245631  6.835372

Para un tamaño de muestra n=50 seguimos observando que los mejores resultados se obtienen con T_1. pues ademas el mas cercano al parametro, tiene la menor varianza

simulación n=100

set.seed(100)
n_100= 100

D=n*n_100
Mat_1= matrix(rexp(D, rate = 1/t), ncol =4)

#Estimadores

T_1 = apply(Mat_1,1,Theta_1)
T_2 = apply(Mat_1,1,Theta_2)
T_3 = apply(Mat_1,1,Theta_3)
T_4 = apply(Mat_1,1,Theta_4)

M_100 = data.frame(T_1,T_2,T_3,T_4)

Mx= apply(M_100,2,mean)    
Sd= apply(M_100,2,sd)

boxplot(M_100, las=1, main="Comparación estimadores con n=100",col=c("#ee964b", "royalblue", "seagreen", "purple"),xlab = "Estimadores")  
abline(h=10,  col="red")

Mx

##       T_1       T_2       T_3       T_4 
## 10.100748 20.185749  9.797572 11.611612

Sd

##       T_1       T_2       T_3       T_4 
##  5.309737 11.358404  4.454574  6.566401

Al aumentar la muestra a n=100 vemos como T_3 es el estimador que mas se acerca al parametro y tiene la menor varianza y en este caso se pordria clasificara como INSESGADO y EFICIENTE.

simulación n=1000

set.seed(1000)
n_1000= 1000

D=n*n_1000
Mat_1= matrix(rexp(D, rate = 1/t), ncol =4)

#Estimadores

T_1 = apply(Mat_1,1,Theta_1)
T_2 = apply(Mat_1,1,Theta_2)
T_3 = apply(Mat_1,1,Theta_3)
T_4 = apply(Mat_1,1,Theta_4)

M_1000 = data.frame(T_1,T_2,T_3,T_4)

Mx= apply(M_1000,2,mean)    
Sd= apply(M_1000,2,sd)

boxplot(M_1000, las=1, main="Comparación estimadores con n=1000",col=c("#ee964b", "royalblue", "seagreen", "purple"),xlab = "Estimadores")  
abline(h=10,  col="red")

Mx

##       T_1       T_2       T_3       T_4 
##  9.843408 19.738458  9.893069 11.604508

Sd

##       T_1       T_2       T_3       T_4 
##  5.215179 10.882935  5.022255  6.327142

Para una muestra de n=1000 el estimador T_3 sigue siendo el estimador que mas se acerca al promedio = 10, asimismo es el que presenta menos varianza.

Por otra parte el estimador T_2 con una muestra n=20 , 50 , 100, y 1000 se comporta de la misma manera y es el que mas se aleja del parametro y presenta la varianza mas alta.