Problema 2 - Propiedades de los estimadores


La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son: insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

\[ \hat{\theta}_1=[\frac{(X_1+X_2)}{6}+\frac{(X_3+X_4)}{3}] \]

\[ \hat{\theta}_2=[\frac{(X_1+2X_2+3X_3+4X_4)}{5}] \]

\[\hat{\theta}_3=[\frac{(X_1+X_2+X_3+X_4)}{4}]\] \[ \hat{\theta}_4=[\frac{\min(X_1+X_2+X_3+X_4)+\max(X_1+X_2+X_3+X_4)}{2}] \]

  • Genere una muestras de n = 20, 50, 100 y 1000 para cada uno de los estimadores planteados.

  • En cada caso evalue las propiedades de insesgadez, eficiencia y consistencia

  • Suponga un valor para el parámetro θ


Resultado


Genero una muestra de n=20 para cada uno de los estimadores.Presento el sesgo, varianza y gráfico boxplot con la comparación de los estiamdores:

## [1] -0.7237420  1.5287549 -0.3899028 -1.0546582
## [1] 0.5739868 3.9649782 0.6894771 0.1098417

Genero una muestra de n=50 para cada uno de los estimadores.Presento el sesgo, varianza y gráfico boxplot con la comparación de los estiamdores:

## [1] -0.7297860  1.3136783 -0.3912028 -0.8740601
## [1] 0.5225037 3.5999041 0.7791690 0.1040561

Genero una muestra de n=100 para cada uno de los estimadores.Presento el sesgo, varianza y gráfico boxplot con la comparación de los estiamdores:

## [1] -0.7500381  1.2846360 -0.4032421 -0.7064916
## [1] 0.5261362 3.2600849 0.7360324 0.1017584

Genero una muestra de n=1000 para cada uno de los estimadores.Presento el sesgo, varianza y gráfico boxplot con la comparación de los estiamdores:

## [1] -0.7698063  1.3283487 -0.3932957 -0.1512081
## [1] 0.46460223 3.53383111 0.76468838 0.09337634


Conclusiones


Para un tamaño de muestra n=1000 se observa que los mejores resultados se obtienen con el estimador 4. Este estimador se puede clasificar como INSESGADO y EFICIENTE, pues ademas tiene la menor varianza.


Código


lambda=2
numerosimulaciones <- 1000
estimador20 <- numeric(numerosimulaciones)

set.seed(123)

#primer estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(20, rate = lambda)
  theta1  <- (theta[1] + theta[2] / 6) + (theta[3] + theta[4] / 3)
  estimador20[i] <- theta1
}

sesgo1 <- mean(estimador20) - lambda
varianza1 <- var(estimador20)
estimador1<-estimador20

#segundo estimador


for (i in 1:numerosimulaciones) {
  theta<- rexp(20, rate = lambda)
  theta2  <- theta[1] + 2*theta[2] + 3*theta[3] + 4*theta[4] / 5
  estimador20[i] <- theta2
}

sesgo2 <- mean(estimador20) - lambda
varianza2 <- var(estimador20)
estimador2<-estimador20

#tercer estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(20, rate = lambda)
  theta3  <- theta[1] + theta[2] + theta[3] + theta[4] / 4
 estimador20[i] <- theta3
}

sesgo3 <- mean(estimador20) - lambda
varianza3 <- var(estimador20)
estimador3<-estimador20

#cuarto estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(20, rate = lambda)
  theta4  <- min(theta) + max(theta) / 2
  estimador20[i] <- theta4
}

sesgo4 <- mean(estimador20) - lambda
varianza4 <- var(estimador20)
estimador4<-estimador20


sesgo20<-c(sesgo1,sesgo2,sesgo3,sesgo4)
sesgo20
varianza20<-c(varianza1,varianza2,varianza3,varianza4)
varianza20
estimadores20<-data.frame(estimador1,estimador2,estimador3,estimador4)
boxplot(estimadores20, main='Comparacion de estimadores con muestra n=20')
abline(h=1/2,col='purple')
lambda=2
numerosimulaciones <- 1000
estimador50 <- numeric(numerosimulaciones)

set.seed(123)

#primer estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(50, rate = lambda)
  theta5  <- (theta[1] + theta[2] / 6) + (theta[3] + theta[4] / 3)
  estimador50[i] <- theta5
}

sesgo5 <- mean(estimador50) - lambda
varianza5 <- var(estimador50)
estimador5<-estimador50

#segundo estimador


for (i in 1:numerosimulaciones) {
  theta<- rexp(50, rate = lambda)
  theta6  <- theta[1] + 2*theta[2] + 3*theta[3] + 4*theta[4] / 5
  estimador50[i] <- theta6
}

sesgo6 <- mean(estimador50) - lambda
varianza6 <- var(estimador50)
estimador6<-estimador50

#tercer estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(50, rate = lambda)
  theta7  <- theta[1] + theta[2] + theta[3] + theta[4] / 4
 estimador50[i] <- theta7
}

sesgo7 <- mean(estimador50) - lambda
varianza7 <- var(estimador50)
estimador7<-estimador50

#cuarto estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(50, rate = lambda)
  theta8  <- min(theta) + max(theta) / 2
  estimador50[i] <- theta8
}

sesgo8 <- mean(estimador50) - lambda
varianza8 <- var(estimador50)
estimador8<-estimador50


sesgo50<-c(sesgo5,sesgo6,sesgo7,sesgo8)
sesgo50
varianza50<-c(varianza5,varianza6,varianza7,varianza8)
varianza50
estimadores50<-data.frame(estimador5,estimador6,estimador7,estimador8)
boxplot(estimadores50, main='Comparacion de estimadores con muestra n=50')
abline(h=1/2,col='purple')
lambda=2
numerosimulaciones <- 1000
estimador100 <- numeric(numerosimulaciones)

set.seed(123)

#primer estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(100, rate = lambda)
  theta9  <- (theta[1] + theta[2] / 6) + (theta[3] + theta[4] / 3)
  estimador100[i] <- theta9
}

sesgo9 <- mean(estimador100) - lambda
varianza9 <- var(estimador100)
estimador9<-estimador100

#segundo estimador


for (i in 1:numerosimulaciones) {
  theta<- rexp(100, rate = lambda)
  theta10  <- theta[1] + 2*theta[2] + 3*theta[3] + 4*theta[4] / 5
  estimador100[i] <- theta10
}

sesgo10 <- mean(estimador100) - lambda
varianza10 <- var(estimador100)
estimador10<-estimador100

#tercer estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(100, rate = lambda)
  theta11 <- theta[1] + theta[2] + theta[3] + theta[4] / 4
 estimador100[i] <- theta11
}

sesgo11 <- mean(estimador100) - lambda
varianza11 <- var(estimador100)
estimador11<-estimador100

#cuarto estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(100, rate = lambda)
  theta12  <- min(theta) + max(theta) / 2
  estimador100[i] <- theta12
}

sesgo12 <- mean(estimador100) - lambda
varianza12 <- var(estimador100)
estimador12<-estimador100


sesgo100<-c(sesgo9,sesgo10,sesgo11,sesgo12)
sesgo100
varianza100<-c(varianza9,varianza10,varianza11,varianza12)
varianza100
estimadores100<-data.frame(estimador9,estimador10,estimador11,estimador12)
boxplot(estimadores100, main='Comparacion de estimadores con muestra n=100')
abline(h=1/2,col='purple')
lambda=2
numerosimulaciones <- 1000
estimador1000 <- numeric(numerosimulaciones)

set.seed(123)

#primer estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(1000, rate = lambda)
  theta13  <- (theta[1] + theta[2] / 6) + (theta[3] + theta[4] / 3)
  estimador1000[i] <- theta13
}

sesgo13 <- mean(estimador1000) - lambda
varianza13 <- var(estimador1000)
estimador13<-estimador1000

#segundo estimador


for (i in 1:numerosimulaciones) {
  theta<- rexp(1000, rate = lambda)
  theta14  <- theta[1] + 2*theta[2] + 3*theta[3] + 4*theta[4] / 5
  estimador1000[i] <- theta14
}

sesgo14 <- mean(estimador1000) - lambda
varianza14 <- var(estimador1000)
estimador14 <-estimador1000

#tercer estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(1000, rate = lambda)
  theta15 <- theta[1] + theta[2] + theta[3] + theta[4] / 4
 estimador1000[i] <- theta15
}

sesgo15 <- mean(estimador1000) - lambda
varianza15 <- var(estimador1000)
estimador15 <-estimador1000

#cuarto estimador

for (i in 1:numerosimulaciones) {
  theta<- rexp(1000, rate = lambda)
  theta16 <- min(theta) + max(theta) / 2
  estimador1000[i] <- theta16
}

sesgo16 <- mean(estimador1000) - lambda
varianza16 <- var(estimador1000)
estimador16<-estimador1000


sesgo1000<-c(sesgo13,sesgo14,sesgo15,sesgo16)
sesgo1000
varianza1000<-c(varianza13,varianza14,varianza15,varianza16)
varianza1000
estimadores1000<-data.frame(estimador13,estimador14,estimador15,estimador16)
boxplot(estimadores1000, main='Comparacion de estimadores con muestra n=1000')
abline(h=1/2,col='purple')