La simulación ayuda a entender y validad las propiedades de los estimadores estadÃsticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales caracterÃsticas de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las caracterÃsticas de cada uno de los siguientes estimadores propuestos:
θ_1 = ((X1+X2)/6) + ((X3+X4)/3)
θ_2ˆ=(X1+2X2+3X3+4X4)/5
θ_3ˆ=(X1+X2+X3+X4)/4
θ_4ˆ=(min{X1,X2,X3,X4}+max{X1,X2,X3,X4})/2
library(ggplot2)
estim_1 = function(X) { #Funcion para Estimador 1
(X[1] + X[2]) / 6 + (X[3] + X[4]) / 3
}
estim_2 = function(X) { #Funcion para Estimador 2
(X[1]+2*X[2]+3*X[3]+4*X[4])/5
}
estim_3 = function(X) { #Funcion para Estimador 3
(X[1]+X[2]+X[3]+X[4])/4
}
estim_4 = function(X) { #Funcion para Estimador 4
(min(X[1],X[2],X[3],X[4])+max(X[1],X[2],X[3],X[4]))/2
}
simulator = function(n=4, m, lambda=2){ #Funcion para simular muestras
Y=matrix(rexp(20, rate = 1/lambda), nrow = m, ncol=n, byrow = TRUE) # matriz m x n
return(Y)
}
T1_20 = apply(simulator(m=20),2, estim_1)
T2_20 = apply(simulator(m=20),2, estim_2)
T3_20 = apply(simulator(m=20),2, estim_3)
T4_20 = apply(simulator(m=20),2, estim_3)
T1234_20 =data.frame(T1_20, T2_20, T3_20, T4_20)
boxplot(T1234_20, las=1, main = "Comparacion de estimadores con 20 muestras")
abline(h=2, col="red")
apply(T1234_20, 2, mean) #Calcualar medias
## T1_20 T2_20 T3_20 T4_20
## 1.290515 4.574274 2.833604 1.690756
apply(T1234_20, 2, sd) #Calcular Desviacion Estandar
## T1_20 T2_20 T3_20 T4_20
## 0.7464532 2.3093823 1.8783288 0.5413109
Para n=20, se observan los mejores resultados con el estimador 4. Se puede considerar INSESGADO ya que su promedio se encuentra mas cerca de 2 y tambien EFICIENTE ya que tiene la menor variacion
T1_50 = apply(simulator(m=50),2, estim_1)
T2_50 = apply(simulator(m=50),2, estim_2)
T3_50 = apply(simulator(m=50),2, estim_3)
T4_50 = apply(simulator(m=50),2, estim_4)
T1234_50 =data.frame(T1_50, T2_50, T3_50, T4_50)
boxplot(T1234_50, las=1, main = "Comparacion de estimadores con 50 muestras")
abline(h=2, col="red")
apply(T1234_50, 2, mean) #Calcualar medias
## T1_50 T2_50 T3_50 T4_50
## 2.151825 2.794647 2.315282 1.657727
apply(T1234_50, 2, sd) #Calcular Desviacion Estandar
## T1_50 T2_50 T3_50 T4_50
## 0.5538568 1.6239651 1.5395994 0.6791985
Para n=50,el estimador 1 presenta los mejores resultados, es INSESGADO, puesto que su promedio se encuentra bastante cerca el parametro, y mas eficiente puesto que tiene una varianza inferior a los otros estimadores
T1_100 = apply(simulator(m=100),2, estim_1)
T2_100 = apply(simulator(m=100),2, estim_2)
T3_100 = apply(simulator(m=100),2, estim_3)
T4_100 = apply(simulator(m=100),2, estim_4)
T1234_100 =data.frame(T1_100, T2_100, T3_100, T4_100)
boxplot(T1234_100, las=1, main = "Comparacion de estimadores con 100 muestras")
abline(h=2, col="red")
apply(T1234_100, 2, mean) #Calcualar medias
## T1_100 T2_100 T3_100 T4_100
## 2.246504 4.773101 2.192771 2.754010
apply(T1234_100, 2, sd) #Calcular Desviacion Estandar
## T1_100 T2_100 T3_100 T4_100
## 0.9486193 2.4200789 0.9082049 0.8179879
Para n=100, el estimador 3 tiene los mejores resultados siendo INSESGADO y EFICIENTE ya que tiene el promedio mas cetcano al parametro y la varianza mas baja del grupo, aunque el estimador 1 tiene resultados muy similares
T1_1000 = apply(simulator(m=1000),2, estim_1)
T2_1000 = apply(simulator(m=1000),2, estim_2)
T3_1000 = apply(simulator(m=1000),2, estim_3)
T4_1000 = apply(simulator(m=1000),2, estim_4)
T1234_1000 =data.frame(T1_1000, T2_1000, T3_1000, T4_1000)
boxplot(T1234_1000, las=1, main = "Comparacion de estimadores con 1000 muestras")
abline(h=2, col="red")
apply(T1234_1000, 2, mean) #Calcualar medias
## T1_1000 T2_1000 T3_1000 T4_1000
## 2.075879 4.113065 1.910201 2.632542
apply(T1234_1000, 2, sd) #Calcular Desviacion Estandar
## T1_1000 T2_1000 T3_1000 T4_1000
## 0.7457668 1.7355060 1.0475445 1.0303231
Para n=1000, el estimador 1 tiene los mejores resultados al tener un sesgo minimo con respecto al parametro y la variacion mas baja del grupo