La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son: insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
\[ \hat{\theta}_1=[\frac{(X_1+X_2)}{6}+\frac{(X_3+X_4)}{3}] \]
\[ \hat{\theta}_2=[\frac{(X_1+2X_2+3X_3+4X_4)}{5}] \]
\[\hat{\theta}_3=[\frac{(X_1+X_2+X_3+X_4)}{4}]\] \[ \hat{\theta}_4=[\frac{\min(X_1+X_2+X_3+X_4)+\max(X_1+X_2+X_3+X_4)}{2}] \]
Genere una muestras de n = 20, 50, 100 y 1000 para cada uno de los estimadores planteados.
En cada caso evalue las propiedades de insesgadez, eficiencia y consistencia
Suponga un valor para el parámetro θ
Genero una muestra de n=20 para cada uno de los estimadores.Presento el sesgo, varianza y gráfico boxplot con la comparación de los estiamdores:
## [1] -0.7237420 1.5287549 -0.3899028 -1.0546582
## [1] 0.5739868 3.9649782 0.6894771 0.1098417
Genero una muestra de n=50 para cada uno de los estimadores.Presento el sesgo, varianza y gráfico boxplot con la comparación de los estiamdores:
## [1] -0.7297860 1.3136783 -0.3912028 -0.8740601
## [1] 0.5225037 3.5999041 0.7791690 0.1040561
Genero una muestra de n=100 para cada uno de los estimadores.Presento el sesgo, varianza y gráfico boxplot con la comparación de los estiamdores:
## [1] -0.7500381 1.2846360 -0.4032421 -0.7064916
## [1] 0.5261362 3.2600849 0.7360324 0.1017584
Genero una muestra de n=1000 para cada uno de los estimadores.Presento el sesgo, varianza y gráfico boxplot con la comparación de los estiamdores:
## [1] -0.7698063 1.3283487 -0.3932957 -0.1512081
## [1] 0.46460223 3.53383111 0.76468838 0.09337634
Para un tamaño de muestra n=1000 se observa que los mejores resultados se obtienen con el estimador 4. Este estimador se puede clasificar como INSESGADO y EFICIENTE, pues ademas tiene la menor varianza.
lambda=2
numerosimulaciones <- 1000
estimador20 <- numeric(numerosimulaciones)
set.seed(123)
#primer estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(20, rate = lambda)
theta1 <- (theta[1] + theta[2] / 6) + (theta[3] + theta[4] / 3)
estimador20[i] <- theta1
}
sesgo1 <- mean(estimador20) - lambda
varianza1 <- var(estimador20)
estimador1<-estimador20
#segundo estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(20, rate = lambda)
theta2 <- theta[1] + 2*theta[2] + 3*theta[3] + 4*theta[4] / 5
estimador20[i] <- theta2
}
sesgo2 <- mean(estimador20) - lambda
varianza2 <- var(estimador20)
estimador2<-estimador20
#tercer estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(20, rate = lambda)
theta3 <- theta[1] + theta[2] + theta[3] + theta[4] / 4
estimador20[i] <- theta3
}
sesgo3 <- mean(estimador20) - lambda
varianza3 <- var(estimador20)
estimador3<-estimador20
#cuarto estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(20, rate = lambda)
theta4 <- min(theta) + max(theta) / 2
estimador20[i] <- theta4
}
sesgo4 <- mean(estimador20) - lambda
varianza4 <- var(estimador20)
estimador4<-estimador20
sesgo20<-c(sesgo1,sesgo2,sesgo3,sesgo4)
sesgo20estimadores20<-data.frame(estimador1,estimador2,estimador3,estimador4)
boxplot(estimadores20, main='Comparacion de estimadores con muestra n=20')
abline(h=1/2,col='purple')lambda=2
numerosimulaciones <- 1000
estimador50 <- numeric(numerosimulaciones)
set.seed(123)
#primer estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(50, rate = lambda)
theta5 <- (theta[1] + theta[2] / 6) + (theta[3] + theta[4] / 3)
estimador50[i] <- theta5
}
sesgo5 <- mean(estimador50) - lambda
varianza5 <- var(estimador50)
estimador5<-estimador50
#segundo estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(50, rate = lambda)
theta6 <- theta[1] + 2*theta[2] + 3*theta[3] + 4*theta[4] / 5
estimador50[i] <- theta6
}
sesgo6 <- mean(estimador50) - lambda
varianza6 <- var(estimador50)
estimador6<-estimador50
#tercer estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(50, rate = lambda)
theta7 <- theta[1] + theta[2] + theta[3] + theta[4] / 4
estimador50[i] <- theta7
}
sesgo7 <- mean(estimador50) - lambda
varianza7 <- var(estimador50)
estimador7<-estimador50
#cuarto estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(50, rate = lambda)
theta8 <- min(theta) + max(theta) / 2
estimador50[i] <- theta8
}
sesgo8 <- mean(estimador50) - lambda
varianza8 <- var(estimador50)
estimador8<-estimador50
sesgo50<-c(sesgo5,sesgo6,sesgo7,sesgo8)
sesgo50estimadores50<-data.frame(estimador5,estimador6,estimador7,estimador8)
boxplot(estimadores50, main='Comparacion de estimadores con muestra n=50')
abline(h=1/2,col='purple')lambda=2
numerosimulaciones <- 1000
estimador100 <- numeric(numerosimulaciones)
set.seed(123)
#primer estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(100, rate = lambda)
theta9 <- (theta[1] + theta[2] / 6) + (theta[3] + theta[4] / 3)
estimador100[i] <- theta9
}
sesgo9 <- mean(estimador100) - lambda
varianza9 <- var(estimador100)
estimador9<-estimador100
#segundo estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(100, rate = lambda)
theta10 <- theta[1] + 2*theta[2] + 3*theta[3] + 4*theta[4] / 5
estimador100[i] <- theta10
}
sesgo10 <- mean(estimador100) - lambda
varianza10 <- var(estimador100)
estimador10<-estimador100
#tercer estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(100, rate = lambda)
theta11 <- theta[1] + theta[2] + theta[3] + theta[4] / 4
estimador100[i] <- theta11
}
sesgo11 <- mean(estimador100) - lambda
varianza11 <- var(estimador100)
estimador11<-estimador100
#cuarto estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(100, rate = lambda)
theta12 <- min(theta) + max(theta) / 2
estimador100[i] <- theta12
}
sesgo12 <- mean(estimador100) - lambda
varianza12 <- var(estimador100)
estimador12<-estimador100
sesgo100<-c(sesgo9,sesgo10,sesgo11,sesgo12)
sesgo100estimadores100<-data.frame(estimador9,estimador10,estimador11,estimador12)
boxplot(estimadores100, main='Comparacion de estimadores con muestra n=100')
abline(h=1/2,col='purple')lambda=2
numerosimulaciones <- 1000
estimador1000 <- numeric(numerosimulaciones)
set.seed(123)
#primer estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(1000, rate = lambda)
theta13 <- (theta[1] + theta[2] / 6) + (theta[3] + theta[4] / 3)
estimador1000[i] <- theta13
}
sesgo13 <- mean(estimador1000) - lambda
varianza13 <- var(estimador1000)
estimador13<-estimador1000
#segundo estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(1000, rate = lambda)
theta14 <- theta[1] + 2*theta[2] + 3*theta[3] + 4*theta[4] / 5
estimador1000[i] <- theta14
}
sesgo14 <- mean(estimador1000) - lambda
varianza14 <- var(estimador1000)
estimador14 <-estimador1000
#tercer estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(1000, rate = lambda)
theta15 <- theta[1] + theta[2] + theta[3] + theta[4] / 4
estimador1000[i] <- theta15
}
sesgo15 <- mean(estimador1000) - lambda
varianza15 <- var(estimador1000)
estimador15 <-estimador1000
#cuarto estimador
for (i in 1:numerosimulaciones) {
theta<- rexp(1000, rate = lambda)
theta16 <- min(theta) + max(theta) / 2
estimador1000[i] <- theta16
}
sesgo16 <- mean(estimador1000) - lambda
varianza16 <- var(estimador1000)
estimador16<-estimador1000
sesgo1000<-c(sesgo13,sesgo14,sesgo15,sesgo16)
sesgo1000