Actividad 2 - Propiedades de los estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

θ_1 = ((X1+X2)/6) + ((X3+X4)/3)

θ_2ˆ=(X1+2X2+3X3+4X4)/5


θ_3ˆ=(X1+X2+X3+X4)/4


θ_4ˆ=(min{X1,X2,X3,X4}+max{X1,X2,X3,X4})/2

Funciones

library(ggplot2)
estim_1 = function(X) {                 #Funcion para Estimador 1
  (X[1] + X[2]) / 6 + (X[3] + X[4]) / 3
}

estim_2 = function(X) {                 #Funcion para Estimador 2
  (X[1]+2*X[2]+3*X[3]+4*X[4])/5
}

estim_3 = function(X) {                 #Funcion para Estimador 3
  (X[1]+X[2]+X[3]+X[4])/4
}

estim_4 = function(X) {                 #Funcion para Estimador 4
  (min(X[1],X[2],X[3],X[4])+max(X[1],X[2],X[3],X[4]))/2
}


simulator = function(n=4, m, lambda=2){        #Funcion para simular muestras
Y=matrix(rexp(20, rate = 1/lambda), nrow = m, ncol=n, byrow = TRUE) # matriz m x n  
return(Y)
}

Simulacion con n_muestras=20

T1_20 = apply(simulator(m=20),2, estim_1)
T2_20 = apply(simulator(m=20),2, estim_2)
T3_20 = apply(simulator(m=20),2, estim_3)
T4_20 = apply(simulator(m=20),2, estim_3)

T1234_20 =data.frame(T1_20, T2_20, T3_20, T4_20)

boxplot(T1234_20, las=1, main = "Comparacion de estimadores con 20 muestras")
abline(h=2, col="red")

apply(T1234_20, 2, mean)                           #Calcualar medias
##    T1_20    T2_20    T3_20    T4_20 
## 1.290515 4.574274 2.833604 1.690756
apply(T1234_20, 2, sd)                             #Calcular Desviacion Estandar
##     T1_20     T2_20     T3_20     T4_20 
## 0.7464532 2.3093823 1.8783288 0.5413109

Para n=20, se observan los mejores resultados con el estimador 4. Se puede considerar INSESGADO ya que su promedio se encuentra mas cerca de 2 y tambien EFICIENTE ya que tiene la menor variacion

Simulacion con n_muestras=50

T1_50 = apply(simulator(m=50),2, estim_1)
T2_50 = apply(simulator(m=50),2, estim_2)
T3_50 = apply(simulator(m=50),2, estim_3)
T4_50 = apply(simulator(m=50),2, estim_4)

T1234_50 =data.frame(T1_50, T2_50, T3_50, T4_50)

boxplot(T1234_50, las=1, main = "Comparacion de estimadores con 50 muestras")
abline(h=2, col="red")

apply(T1234_50, 2, mean)                           #Calcualar medias
##    T1_50    T2_50    T3_50    T4_50 
## 2.151825 2.794647 2.315282 1.657727
apply(T1234_50, 2, sd)                             #Calcular Desviacion Estandar
##     T1_50     T2_50     T3_50     T4_50 
## 0.5538568 1.6239651 1.5395994 0.6791985

Para n=50,el estimador 1 presenta los mejores resultados, es INSESGADO, puesto que su promedio se encuentra bastante cerca el parametro, y mas eficiente puesto que tiene una varianza inferior a los otros estimadores

Simulacion con n_muestras=100

T1_100 = apply(simulator(m=100),2, estim_1)
T2_100 = apply(simulator(m=100),2, estim_2)
T3_100 = apply(simulator(m=100),2, estim_3)
T4_100 = apply(simulator(m=100),2, estim_4)

T1234_100 =data.frame(T1_100, T2_100, T3_100, T4_100)

boxplot(T1234_100, las=1, main = "Comparacion de estimadores con 100 muestras")
abline(h=2, col="red")

apply(T1234_100, 2, mean)                           #Calcualar medias
##   T1_100   T2_100   T3_100   T4_100 
## 2.246504 4.773101 2.192771 2.754010
apply(T1234_100, 2, sd)                             #Calcular Desviacion Estandar
##    T1_100    T2_100    T3_100    T4_100 
## 0.9486193 2.4200789 0.9082049 0.8179879

Para n=100, el estimador 3 tiene los mejores resultados siendo INSESGADO y EFICIENTE ya que tiene el promedio mas cetcano al parametro y la varianza mas baja del grupo, aunque el estimador 1 tiene resultados muy similares

Simulacion con n_muestras=1000

T1_1000 = apply(simulator(m=1000),2, estim_1)
T2_1000 = apply(simulator(m=1000),2, estim_2)
T3_1000 = apply(simulator(m=1000),2, estim_3)
T4_1000 = apply(simulator(m=1000),2, estim_4)

T1234_1000 =data.frame(T1_1000, T2_1000, T3_1000, T4_1000)

boxplot(T1234_1000, las=1, main = "Comparacion de estimadores con 1000 muestras")
abline(h=2, col="red")

apply(T1234_1000, 2, mean)                           #Calcualar medias
##  T1_1000  T2_1000  T3_1000  T4_1000 
## 2.075879 4.113065 1.910201 2.632542
apply(T1234_1000, 2, sd)                             #Calcular Desviacion Estandar
##   T1_1000   T2_1000   T3_1000   T4_1000 
## 0.7457668 1.7355060 1.0475445 1.0303231

Para n=1000, el estimador 1 tiene los mejores resultados al tener un sesgo minimo con respecto al parametro y la variacion mas baja del grupo