Ejercicio 2: Propiedades de los estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son, insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad. Sean 𝑋1 , 𝑋2 , 𝑋3 y 𝑋4 , una muestra aleatoria de tamaño 𝑛=4 cuya población la conforma una distribución exponencial con parámetro 𝜃 desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

\[ 𝜃1 = \frac{X1 + X2}{6} + \frac{X3 + X4}{3} \] \[ 𝜃2 = \frac{X1 + 2X2 + 3X3 + 4X4 }{5} \] \[ 𝜃3 = \frac{X1 + X2 + X3 + X4 }{4} \]

\[ 𝜃4 = \frac{min(X1 + X2 + X3 + X4) + max(X1 + X2 + X3 + X4) }{4} \]

Desarrollo

Se generaron muestras con una distribución exponencial para cada uno de los diferentes tamaños planteados en el ejercicio (n=20, n=50, n=100 y n=1000) adicional se supuso un valor de 2 para el parámetro 𝜃. Las siguientes tablas muestran algunos ejemplos de los valores de los 10 primeros datos obtenidos en la generación de cada una de las muestras para cada tamaño:

  • Muestra de tamaño 20:
    x
    0.479
    0.123
    0.706
    0.300
    0.014
    0.280
    0.224
    0.269
    0.125
    0.749
  • Muestra de tamaño 50:
    x
    0.545
    0.127
    0.292
    1.796
    0.289
    0.769
    0.532
    0.164
    0.276
    0.577
  • Muestra de tamaño 100:
    x
    1.800
    0.934
    0.224
    0.198
    0.389
    0.164
    0.476
    1.223
    0.036
    0.468
  • Muestra de tamaño 1000:
    x
    0.447
    0.803
    0.764
    0.096
    0.641
    0.234
    1.455
    0.752
    0.590
    0.543

Resultados

Despúes de generar las diferentes muestras para cada uno de los tamaños, se calculó cada uno de los estimadores obteniendo los siguientes resultados:
nombre_columna Tamaño de muestra Estimador 𝜃1 Estimador 𝜃2 Estimador 𝜃3 Estimador 𝜃4
muestra20 Tamaño 20 0.304495358721692 3.35180361818197 0.311554962614451 0.537776761931629
muestra50 Tamaño 50 0.452374067331848 10.3274588517414 0.460413973453922 0.483840180944913
muestra100 Tamaño 100 0.446893078205892 22.5618804864662 0.448738182198912 1.01433534158265
muestra1000 Tamaño 1000 0.506069196248694 251.583469161808 0.506328017188627 1.93960059549651
Conociendo que el valor 𝜃 es el inverson del valor del estimador calculado (1/𝜃) obtenemos los siguientes resultados:
nombre_columna2 Tamaño de muestra Parametro 1/𝜃1 Parametro 1/𝜃2 Parametro 1/𝜃3 Parametro 1/𝜃4
parametro20 Tamaño 20 3.28412230714491 0.298346834693855 3.2097065365558 1.85950764478577
parametro50 Tamaño 50 2.21055995958856 0.0968292407992871 2.17195840625389 2.06679816886447
parametro100 Tamaño 100 2.23767171336514 0.0443225466334622 2.22847094289991 0.985867256128253
parametro1000 Tamaño 1000 1.97601436209245 0.0039748239553722 1.97500427796288 0.515570062373597

Resultados

  • Se evidencia que las ecuaciones de el estimador 1 y el estimador 3 están relacionadas con el cálculo del promedio de las muestras.
  • Los estimadores 1 y 3 son los eficientes para realizar estimar el valor del parámetro 𝜃.
  • De la bibliografia se tiene que el promedio de las muestras es el valor del inverso del parámetro 𝜃 (promedio = 1/𝜃) (linea punteada roja horizontal gráficas BoxPlots) donde el valor real es 0.5
  • Se evidencia que los etimadores 2 y 4 no son buenos para estimar el parámetro 𝜃, es decir estos estimadores no son eficientes ni consistentes.
  • Como se evidencia en la tabla de resultados que la esperanza del estimador θ1 y θ3 es igual al parámetro λ^−1 (1/2) quiere decir que estos 2 estimadores son INSESGADOS por otro lado los estimadores θ2 y θ4 NO SON INSESGADOS.
  • Sabiendo que la varianza de cada estimador se calcula como 1/λ^2 y comparando los resultados para cada uno de los estimadores se evidencia que el estimador 𝜃3 es el más eficiente porque es el que tiene la varianza más baja .
  • Los estimadores θ1, θ2 y θ3 son consistentes, ya que son funciones lineales de variables aleatorias exponenciales independientes, y por la Ley de los Grandes Números, se aproximarán al valor verdadero 1/λ a medida que el tamaño de la muestra crece mientras el estimador θ4 puede no ser consistente debido a la presencia de los términos min y max ⁡, que introducen sesgo y alta varianza en el estimador, afectando su convergencia.