Planteamiento

Propiedades de los estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son, insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1 , X2 , X3 y X4 , una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

θ^1=(X1+X2)6+(X3+X4)3

θ^2=(X1+2X2+3X3+4X4)5

θ^3=X1+X2+X3+X44

θ^4=min(X1+X2+X3+X4)+max(X1+X2+X3+X4)2

Metodologia

Se establece el numero de muestra a generar para n=20, 50, 100 y 1000 para cada uno de los estimadores planteados y el valor para θ

Se crea la funcion g_estimadores que permite realizar las estimaciones

# Establecemos una semilla para reproducibilidad
set.seed(123)
n <- 20
t = 1/5

# Se genera funcion que permite generar eol calculo para n muestra y el valor de theta
g_estimadores <- function(n,t)
{
datax <- data.frame(
x1 <- rexp(n,t),
x2 <- rexp(n,t),
x3 <- rexp(n,t),
x4 <- rexp(n,t)

)
names(datax)<-c("x1","x2","x3","x4")

head(datax)

data <- data.frame(

t1 <- (x1 + x2)/6 + (x3 + x4)/3,
t2 <- (x1 + 2*x2 + 3*x3 + 4*x4) / 5,
t3 <- (x1 + x2 + x3 + x4) / 4,

#sustituimos el estimador 
#θ4ˆ=(min{X1,X2,X3,X4}+max{X1,X2,X3,X4})/2

t4 <- (apply(datax, 1, min) + apply(datax, 1, max))/2
)

names(data)<-c("t1","t2","t3","t4")

head(data)


return(data)
}

n=20

n=20
t=1/5
data20<-g_estimadores(n,t)
head(data20)
##          t1        t2        t3        t4
## 1  3.819230  7.902330  3.918552  3.620586
## 2 13.778195 25.280049 11.297697 18.739190
## 3  6.359899 13.088980  6.528881  6.021935
## 4  1.595735  3.572646  2.059065  3.449055
## 5  3.018899  6.088809  3.029637  3.061850
## 6  5.513420 10.667400  5.336536  5.867188
boxplot(data20,las=1,
        main = "Simulación para los estimadores planteados n=20", 
        xlab = "Estimadores", 
        ylab = "Valor θ")

abline(h=5,col="red")

print("Resumen Media")
## [1] "Resumen Media"
apply(data20,2,mean,caption= "Media")
##        t1        t2        t3        t4 
##  5.177122 10.219794  5.085644  6.003939
print("Resumen Desviación Estandar")
## [1] "Resumen Desviación Estandar"
apply(data20,2,sd)
##       t1       t2       t3       t4 
## 2.608320 4.682086 2.228218 3.608070
print("Sesgo")
## [1] "Sesgo"
ins20 <- (colMeans(data20)- t)
print(ins20)
##        t1        t2        t3        t4 
##  4.977122 10.019794  4.885644  5.803939

Evaluación de la Muestra

Insesgadez:

Para t1, la media muestral de 5.17 sigue estando muy cerca del valor verdadero asumido de 5, sugiriendo insesgadez.

Para t2, la media de 10.21 se aleja bastante de 5, presentando sesgo.

Para t3, la media muestral de 5.08 es aproximadamente el valor verdadero, indicando insesgadez.

Para t4, con media de 6.00, hay un pequeño sesgo alejándose ligeramente de 5.

Eficiencia:

Para t1, la desviación estándar aumentó ligeramente de 2.22 a 2.60, sugiriendo una leve disminución en eficiencia.

Para t2, la desviación estándar de 4.68 es alta, indicando baja eficiencia.

Para t3, la desviación estándar disminuyó de 2.60 a 2.22, mejorando la eficiencia del estimador.

Para t4, la desviación estándar de 3.60 es similar a la muestra previa, manteniendo una eficiencia intermedia.

n=50

n=50
t=1/5
data50<-g_estimadores(n,t)
boxplot(data50,las=1)
abline(h=5,col="red")

print("Resumen Media")
## [1] "Resumen Media"
apply(data50,2,mean)
##        t1        t2        t3        t4 
##  5.156130 10.323881  5.107465  5.685169
print("Resumen Desviación Estandar")
## [1] "Resumen Desviación Estandar"
apply(data50,2,sd)
##       t1       t2       t3       t4 
## 2.253776 4.602467 2.096312 2.522097
print("Sesgo")
## [1] "Sesgo"
ins50 <- (colMeans(data50)- t)
print(ins50)
##        t1        t2        t3        t4 
##  4.956130 10.123881  4.907465  5.485169

Evaluación de la Muestra

Insesgadez:

Para t1, la media muestral de 5.15 sigue estando muy cerca del valor verdadero asumido de 5, sugiriendo insesgadez.

Para t2, la media de 10.32 se aleja bastante de 5, presentando sesgo.

Para t3, la media muestral de 5.10 sigue estando muy cerca del valor verdadero asumido de 5, sugiriendo insesgadez.

Para t4, con media de 5.68, hay un pequeño sesgo alejándose ligeramente de 5.

Eficiencia:

Para t1, la desviación estándar aumentó ligeramente de 2.09 a 2.55, sugiriendo una leve disminución en eficiencia.

Para t2, la desviación estándar de 4.60 es alta, indicando baja eficiencia.

Para t3, la desviación estándar disminuyó de 2.25 a 2.09, mejorando la eficiencia del estimador.

Para t4, la desviación estándar de 2.52 es similar a la muestra previa, manteniendo una eficiencia intermedia.

Consistencia:

Se realiza proceso de comparación com muestras tamaño n=20 y n=50:

Para t1 y t3, las medias casi no cambiaron, manteniéndose cercanas al valor verdadero. Esto sugiere consistencia tentativa.

Para t2, la media aumentó aún más al pasar de 10.21 a 10.32, alejándose más del valor verdadero conforme n crece, lo que indica falta de consistencia.

Para t4, la media disminuyó levemente de 6.00 a 5.68, acercándose un poco más al valor verdadero, leve indicio de consistencia a medida que aumenta la muestra.

n=100

n=100
t=1/5
data100<-g_estimadores(n,t)
boxplot(data100,las=1)
abline(h=5,col="red")

print("Resumen Media")
## [1] "Resumen Media"
apply(data100,2,mean)
##        t1        t2        t3        t4 
##  4.989776 10.109399  4.982349  5.844113
print("Resumen Desviación Estandar")
## [1] "Resumen Desviación Estandar"
apply(data100,2,sd)
##       t1       t2       t3       t4 
## 2.605985 5.249702 2.450418 2.979000
print("Sesgo")
## [1] "Sesgo"
ins100 <- (colMeans(data100)- t)
print(ins100)
##       t1       t2       t3       t4 
## 4.789776 9.909399 4.782349 5.644113

Evaluación de la Muestra

Insesgadez:

Para t1, la media muestral de 4.98 sigue estando muy cerca del valor verdadero asumido de 5, sugiriendo insesgadez.

Para t2, la media de 10.10 se aleja bastante de 5, presentando sesgo.

Para t3, la media muestral de 4.98 sigue estando muy cerca del valor verdadero asumido de 5, sugiriendo insesgadez.

Para t4, con media de 5.84, hay un pequeño sesgo alejándose ligeramente de 5.

Eficiencia:

Para t1, la desviación estándar aumentó ligeramente de 2.45 a 2.60, sugiriendo una leve disminución en eficiencia.

Para t2, la desviación estándar de 5.24 es alta, indicando baja eficiencia.

Para t3, la desviación estándar disminuyó de 2.60 a 2.45, mejorando la eficiencia del estimador.

Para t4, la desviación estándar de 2.97 es similar a la muestra previa, manteniendo una eficiencia intermedia.

Consistencia:

Para t1, las medias se mantienen muy cercanas a 5 en las tres muestras, reforzando su consistencia.

Para t2, las medias (10.21, 1.32, 10.10) fluctua sin una trayectoria claro, sin embargo se alejan aún más del valor verdadero conforme n aumenta, evidenciando falta de consistencia.

Para t3, el mismo patrón de medias próximas a 0.5 avala su consistencia.

Para t4, las medias (6.00, 5.68, 5.84) fluctúan sin una trayectoria clara hacia 0.5, por lo que es difícil concluir sobre su consistencia.

n=1000

n=1000
t=1/5
data1000<-g_estimadores(n,t)
boxplot(data1000,las=1)
abline(h=5,col="red")

print("Resumen Media")
## [1] "Resumen Media"
apply(data1000,2,mean)
##        t1        t2        t3        t4 
##  5.019668 10.029079  5.025265  5.874587
print("Resumen Desviación Estandar")
## [1] "Resumen Desviación Estandar"
apply(data1000,2,sd)
##       t1       t2       t3       t4 
## 2.711614 5.639371 2.622424 3.251519
print("Sesgo")
## [1] "Sesgo"
ins1000 <- (colMeans(data1000)- t)
print(ins1000)
##       t1       t2       t3       t4 
## 4.819668 9.829079 4.825265 5.674587

Evaluación de la Muestra

Insesgadez:

Para t1, la media muestral de 5.01 valor cerca del valor verdadero asumido de 5, sugiriendo insesgadez.

Para t2, la media de 10.02 se aleja bastante de 5, presentando sesgo.

Para t3, la media muestral de 5.02 valor relativamente igual al verdadero asumido de 5, sugiriendo insesgadez.

Para t4, con media de 5.87, hay un pequeño sesgo alejándose poco de 5.

Eficiencia:

Para t1, la desviación estándar aumentó ligeramente de 2.62 a 2.71, sugiriendo una leve disminución en eficiencia.

Para t2, la desviación estándar de 5.63 es alta, indicando baja eficiencia.

Para t3, la desviación estándar disminuyó de 2.71 a 2.62, mejorando la eficiencia del estimador.

Para t4, la desviación estándar de 3.25 es similar a la muestra previa, manteniendo una eficiencia intermedia.

Consistencia:

Una vez se auumenta la muestra con una muestra n= 1000 indiacamos:

Para t1, 5.17, 5.15, 4.98, 5.01 las medias se mantienen muy cercanas a 5 en las tres muestras, mostrando una clara convergencia hacia 0.5, evidenciando consistencia.

Para t2, 10.21, 10.32, 10.10, 10.02 las medias fluctúan sin converger a 0.5, exhibiendo falta de consistencia.

Para t3, 5.08, 5.10, 4.98, 5.02 también convergen claramente al valor verdadero, confirmando consistencia.

Para t4, 6.00, 5.68, 5.84, 5.87 las medias parecen acercarse un poco más a 0.5, leve indicio de posible consistencia.

Conclusiones

Estas conlcusiones estan dadas de acuerdo al aumenta la muestra:

Para t1 y t3: (Media) Insesgados Eficientes, (Desviación Estandar) especialmente t3 Consistentes, convergiendo claramente al valor verdadero a medida que n aumenta.

Para t2: (Media) Sesgado de forma importante Baja eficiencia relativa Falta de consistencia, no converge al valor verdadero.

Para t4: Sesgo moderado Eficiencia intermedia Posible consistencia, pero con fluctuaciones en su trayectoria

En general, t1 y t3 exhiben las propiedades deseables de insesgadez, eficiencia y consistencia como estimadores. Por otro lado, t2 no cumple con estas propiedades. El caso de t4 es intermedio, con una leve tendencia hacia la consistencia pero con sesgos que fluctuan y eficiencia moderados.