PONTIFICIA UNIVERSIDAD JAVERIANA DE CALI

Propiedades de los estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son, insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

\[ \hat{\theta}_1 = \frac{X_1 + X_2}{6} + \frac{X_3 + X_4}{3} \].

\[ \hat{\theta}_2 = \frac{X_1 + 2X_2 + 3X_3 + 4X_4}{5} \].

\[ \hat{\theta}_3 = \frac{X_1 + X_2 + X_3 + X_4}{4} \].

\[ \hat{\theta}_4 = \frac{min(X_1, X_2, X_3, X_4)+max(X_1, X_2, X_3, X_4)}{2} \].

Nota:



Para el ejercicio se supone un valor del parámetro igual a 60.

Para \(n=20\)

n=20
x1=rexp(n, 1/60)
x2=rexp(n, 1/60)
x3=rexp(n, 1/60)
x4=rexp(n,1/60)

datos=data.frame(x1,x2,x3,x4)
E1=(x1+x2)/6 + (x3+x4)/3
E2=(x1+2*x2+3*x3+4*x4)/5
E3=(x1+x2+x3+x4)/4
minx=apply(datos,1, min)
maxx=apply(datos, 1, max)
E4=(minx+maxx)/2

datat=data.frame(E1,E2,E3,E4)

#gráfica
library (ggplot2)
library(tidyr)
# Crear un dataframe largo para la gráfica
  data_es <- datat %>% 
    pivot_longer(cols = c(E1, E2, E3, E4), names_to = "Estimadores", values_to = "Valores")

grafica <- ggplot(data_es, aes(x =Estimadores , y = Valores, fill =Estimadores )) +
    geom_boxplot() +
    geom_jitter(alpha = 0.1)+
  geom_hline(yintercept = 60, linetype = "solid", color = "red")

print(grafica)

medias=round(apply(datat, 2, mean),2)
varianzas=round(apply(datat,2,var),2)

cat(" Tabla 1. Valor de medias y varianzas n=20")
 Tabla 1. Valor de medias y varianzas n=20
rbind(medias, varianzas)
              E1      E2     E3      E4
medias     62.13  122.64  61.03   72.05
varianzas 979.68 3156.76 714.95 1874.62

Conclusión: Los estimadores que más se acercan al parámetro son el E1 con un media aritmética de 62.13 y varianza de 979.69 y el E3 con una media aritmética de 61.03 y varianza de 714.95, pero el de mejor comportamiento es el E3.

Para \(n=50\)

n=50

x1=rexp(n, 1/60)
x2=rexp(n, 1/60)
x3=rexp(n, 1/60)
x4=rexp(n,1/60)

datos=data.frame(x1,x2,x3,x4)
E1=(x1+x2)/6 + (x3+x4)/3
E2=(x1+2*x2+3*x3+4*x4)/5
E3=(x1+x2+x3+x4)/4
minx=apply(datos,1, min)
maxx=apply(datos, 1, max)
E4=(minx+maxx)/2

datat=data.frame(E1,E2,E3,E4)
# Crear un dataframe largo para la gráfica
  data_es <- datat %>% 
    pivot_longer(cols = c(E1, E2, E3, E4), names_to = "Estimadores", values_to = "Valores")

grafica <- ggplot(data_es, aes(x =Estimadores , y = Valores, fill =Estimadores )) +
    geom_boxplot() +
    geom_jitter(alpha = 0.1)+
  geom_hline(yintercept = 60, linetype = "solid", color = "red")

print(grafica)

medias=apply(datat, 2, mean)
varianzas=apply(datat,2,var)
cat("Tabla 2. Valor de medias y varianzas n= 50")
Tabla 2. Valor de medias y varianzas n= 50
rbind(medias, varianzas)
                 E1        E2        E3        E4
medias     62.08521  124.3894  61.55177  68.47497
varianzas 740.44175 3031.3488 641.82964 927.98670

Conclusión: Los estimadores que más se acercan al parámetro son el E1 con un media aritmética de 62.08 y varianza de 740.44 y el E3 con una media aritmética de 61.55 y varianza de 641.82, pero el de mejor comportamiento sigue siendo el E3.

Para \(n=100\)

n=100

x1=rexp(n, 1/60)
x2=rexp(n, 1/60)
x3=rexp(n, 1/60)
x4=rexp(n,1/60)

datos=data.frame(x1,x2,x3,x4)
E1=(x1+x2)/6 + (x3+x4)/3
E2=(x1+2*x2+3*x3+4*x4)/5
E3=(x1+x2+x3+x4)/4
minx=apply(datos,1, min)
maxx=apply(datos, 1, max)
E4=(minx+maxx)/2

datat=data.frame(E1,E2,E3,E4)

#gráfica
library (ggplot2)
library(tidyr)
# Crear un dataframe largo para la gráfica
  data_es <- datat %>% 
    pivot_longer(cols = c(E1, E2, E3, E4), names_to = "Estimadores", values_to = "Valores")

grafica <- ggplot(data_es, aes(x =Estimadores , y = Valores, fill =Estimadores )) +
    geom_boxplot() +
    geom_jitter(alpha = 0.1)+
  geom_hline(yintercept = 60, linetype = "solid", color = "red")

print(grafica)

medias=round(apply(datat, 2, mean),2)
varianzas=round(apply(datat,2,var),2)

cat("Tabla 3. Valor de medias y varianza n=100")
Tabla 3. Valor de medias y varianza n=100
rbind(medias, varianzas)
              E1      E2     E3      E4
medias     60.17  121.67  60.23   70.90
varianzas 980.81 3967.82 871.64 1300.38

Conclusión: Los estimadores que más se acercan al parámetro son el E1 con un media aritmética de 60.17 y varianza de 980.81 y el E3 con una media aritmética de 60.23 y varianza de 871.64, pero el de mejor comportamiento sigue siendo el E3 con una mimima varienza.

Para \(n=1000\)

n=1000

x1=rexp(n, 1/60)
x2=rexp(n, 1/60)
x3=rexp(n, 1/60)
x4=rexp(n,1/60)

datos=data.frame(x1,x2,x3,x4)
E1=(x1+x2)/6 + (x3+x4)/3
E2=(x1+2*x2+3*x3+4*x4)/5
E3=(x1+x2+x3+x4)/4
minx=apply(datos,1, min)
maxx=apply(datos, 1, max)
E4=(minx+maxx)/2

datat=data.frame(E1,E2,E3,E4)

#gráfica
library (ggplot2)
library(tidyr)
# Crear un dataframe largo para la gráfica
  data_es <- datat %>% 
    pivot_longer(cols = c(E1, E2, E3, E4), names_to = "Estimadores", values_to = "Valores")

grafica <- ggplot(data_es, aes(x =Estimadores , y = Valores, fill =Estimadores )) +
    geom_boxplot() +
    geom_jitter(alpha = 0.1)+
  geom_hline(yintercept = 60, linetype = "solid", color = "red")

print(grafica)

medias=round(apply(datat, 2, mean),2)
varianzas=round(apply(datat,2,var),2)

cat("Tabla 4. Valor de medias y varianzas n=1000")
Tabla 4. Valor de medias y varianzas n=1000
rbind(medias, varianzas)
               E1      E2     E3      E4
medias      60.21  120.32  60.27   70.46
varianzas 1059.70 4582.17 991.05 1523.47

Los estimadores que más se acercan al parámetro son el E1 y E3, pero el de mejor comportamiento sigue siendo el E3 con una mimima varienza.

Conclusión

Se puede concluir que el mejor estimador para calcular el valor del parámetro es \(\hat{\theta}_3\), donde se acerca al parámetro con minima varianza, cumpliendo con la propiedad de insesgado, eficiente y consistente a medida que se aumenta el tamaño de la muestra.