Propiedades de los estimadores

Objetivo:

Entender y validar las propiedades de los estimadores estadísticos como: insesgadez, eficiencia y la consistencia.

Actividad: Sean X1, X2, X3 y X4 una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

\[\begin{align*} \hat{\theta}_1 &= \frac{X_1 + X_2^6 + X_3 + X_4^3}{4} \\ \hat{\theta}_2 &= \frac{X_1 + 2X_2 + 3X_3 + 4X_4}{5} \\ \hat{\theta}_3 &= \frac{X_1 + X_2 + X_3}{4} \\ \hat{\theta}_4 &= \frac{\min\{X_1, X_2, X_3, X_4\} + \max\{X_1, X_2, X_3, X_4\}}{2} \end{align*}\]

Muestras de n=20, para cada uno de los estimadores para el parámetro θ = 5, utilizamos las funciones:

rexp() - Generar números aleatorios de una distribución exponencial.
data.frame() - Crear una estructura de datos similar a una tabla con los valores de los estimadores
apply() - Aplicar una función a las filas o columnas de una matriz o un marco de datos.
boxplot() -  Crear un gráfico de caja, que visualiza la distribución de datos a través de sus cuartiles y muestre posibles valores atípicos.

Evaluación de propiedades

Insesgadez: Un estimador es insesgado si su valor esperado es igual al valor verdadero del parámetro que está estimando. Si la insesgadez se acerca a 0, el estimador es más insesgado.

\[ \begin{align*} \mathcal{B}_{t1} &= \bar{t_1} - \theta \\ \mathcal{B}_{t2} &= \bar{t_2} - \theta \\ \mathcal{B}_{t3} &= \bar{t_3} - \theta \\ \mathcal{B}_{t4} &= \bar{t_4} - \theta \end{align*} \]

Eficiencia: Se mide por su varianza. Un estimador es más eficiente si tiene una varianza menor.

Consistencia: Un estimador es consistente si se acerca al valor verdadero del parámetro conforme el tamaño de la muestra aumenta.

muestras de n=20 para cada uno de los estimadores planteados

Resultados Observados:

\[ \text{insesgadez} = \left[ \begin{array}{cccc} \mathcal{B}_{t1} & \mathcal{B}_{t2} & \mathcal{B}_{t3} & \mathcal{B}_{t4} \end{array} \right] = \left[ \begin{array}{cccc} 0.1771219 & 5.2197939 & 0.0856445 & 1.0039392 \end{array} \right] \]

\[ \text{Eficiencia} = \left[ \begin{array}{cccc} \text{Var}(t1) & \text{Var}(t2) & \text{Var}(t3) & \text{Var}(t4) \end{array} \right] = \left[ \begin{array}{cccc} 6.8033328 & 21.9219248 & 4.9649541 & 13.0181683 \end{array} \right] \]

Graficos de las muestras por estimador

Conclusión para \(n = 20\)

  • \(t1\): Es un estimador casi insesgado con una varianza moderada, lo que lo convierte en un buen estimador en términos de balance entre insesgadez y eficiencia.
  • \(t2\): Es un estimador sesgado con la varianza alta, lo que lo hace poco confiable y menos eficiente. No es recomendable en este contexto.
  • \(t3\): Es el mejor estimador en este conjunto, ya que es casi insesgado y tiene la varianza más baja, lo que lo hace preciso y confiable.
  • \(t4\): Aunque es menos sesgado que \(t2\), sigue siendo moderadamente sesgado y tiene una varianza intermedia, lo que lo coloca como una opción aceptable, pero no ideal.

En resumen, \(t3\) es el estimador de mejor comportamiento con n= 20 debido a su baja insesgadez y alta eficiencia, seguido de \(t1\).

muestras de n=50 para cada uno de los estimadores planteados

Resultados Observados:

\[ \text{insesgadez} = \left[ \begin{array}{cccc} \mathcal{B}_{t1} & \mathcal{B}_{t2} & \mathcal{B}_{t3} & \mathcal{B}_{t4} \end{array} \right] = \left[ \begin{array}{cccc} -0.0279766 & 4.8950967 & 0.036166 & 0.7881205 \end{array} \right] \]

\[ \text{Eficiencia} = \left[ \begin{array}{cccc} \text{Var}(t1) & \text{Var}(t2) & \text{Var}(t3) & \text{Var}(t4) \end{array} \right] = \left[ \begin{array}{cccc} 6.6972321 & 26.7956097 & 6.7243011 & 12.3275283 \end{array} \right] \]

Graficos de las muestras por estimador

Conclusión para \(n = 50\)

  • \(t1\): Es casi insesgado con un pequeño sesgo negativo y una varianza moderada, lo que lo convierte en un buen estimador en términos de insesgadez y eficiencia. .
  • \(t2\): Sigue siendo un estimador sesgado y con la varianza alta, lo que lo convierte en el estimador menos confiable y menos eficiente en este contexto.
  • \(t3\): Es casi insesgado y tiene una varianza similar a la de \(t1\), lo que lo convierte en un estimador muy eficiente y confiable.
  • \(t4\): Aunque tiene un sesgo moderado, su varianza intermedia sugiere que es un estimador aceptable, aunque menos eficiente que \(t1\) y \(t3\). A medida que el tamaño de la muestra aumenta a \(n = 50\), la insesgadez de los estimadores \(t1\), \(t3\), y \(t4\) se reduce, lo que indica que estos estimadores se vuelven más precisos. En comparación con la primera muestra el estimador \(t2\) sigue siendo consistentemente sesgado y poco eficiente, lo que sugiere que su rendimiento no mejora con un aumento en el tamaño de la muestra.

muestras de n=100 para cada uno de los estimadores planteados

Resultados Observados:

\[ \text{insesgadez} = \left[ \begin{array}{cccc} \mathcal{B}_{t1} & \mathcal{B}_{t2} & \mathcal{B}_{t3} & \mathcal{B}_{t4} \end{array} \right] = \left[ \begin{array}{cccc} 0.1771219 & 5.2197939 & 0.0856445 & 1.0039392 \end{array} \right] \]

\[ \text{Eficiencia} = \left[ \begin{array}{cccc} \text{Var}(t1) & \text{Var}(t2) & \text{Var}(t3) & \text{Var}(t4) \end{array} \right] = \left[ \begin{array}{cccc} 6.8033328 & 21.9219248 & 4.9649541 & 13.0181683 \end{array} \right] \]

Graficos de las muestras por estimador

Conclusión para \(n = 100\)

  • \(t1\): Es un estimador casi insesgado con una varianza moderada, lo que lo convierte en un buen estimador tanto en términos de insesgadez como de eficiencia.
  • \(t2\): Es un estimador sesgado con la varianza alta, lo que lo hace el menos eficiente y menos confiable entre los cuatro estimadores.
  • \(t3\): Es el mejor estimador en este conjunto, ya que es casi insesgado y tiene la varianza más baja, lo que lo convierte en el estimador más preciso y eficiente.
  • \(t4\): Aunque tiene un sesgo mayor que \(t1\) y \(t3\), sigue siendo un estimador aceptable, con una eficiencia intermedia.

Con \(n = 100\), los estimadores \(t1\) y \(t3\) se destacan como los más confiables y eficientes, con bajo sesgo y varianza. \(t2\) continúa siendo el estimador menos favorable debido a su alto sesgo y varianza, mientras que \(t4\) mejora en precisión y eficiencia, pero aún no alcanza la efectividad de \(t1\) y \(t3\).

En resumen, \(t3\) sigue siendo el mejor estimador, seguido por \(t1\).

muestras de n=1000 para cada uno de los estimadores planteados

Resultados Observados:

\[ \text{insesgadez} = \left[ \begin{array}{cccc} \mathcal{B}_{t1} & \mathcal{B}_{t2} & \mathcal{B}_{t3} & \mathcal{B}_{t4} \end{array} \right] = \left[ \begin{array}{cccc} -0.0197951 & 4.8985094 & -1.2426497\times 10^{-4} & 0.8102026 \end{array} \right] \]

\[ \text{Eficiencia} = \left[ \begin{array}{cccc} \text{Var}(t1) & \text{Var}(t2) & \text{Var}(t3) & \text{Var}(t4) \end{array} \right] = \left[ \begin{array}{cccc} 7.1552603 & 29.4163335 & 6.4961213 & 10.0919968 \end{array} \right] \]

Graficos de las muestras por estimador

Conclusión para \(n = 1000\)

  • \(t1\): Es un estimador casi insesgado con una varianza moderada, lo que lo convierte en un buen estimador en términos de insesgadez y eficiencia. El pequeño sesgo negativo es despreciable, y su precisión sigue siendo alta.
  • \(t2\): Es un estimador consistentemente sesgado y con la varianza más alta, lo que lo hace el menos eficiente y menos confiable entre los cuatro estimadores.
  • \(t3\): Es el mejor estimador en este conjunto, ya que es casi perfectamente insesgado y tiene la varianza más baja, lo que lo convierte en el estimador más preciso y eficiente.
  • \(t4\): Aunque tiene un sesgo mayor que \(t1\) y \(t3\), su eficiencia ha mejorado considerablemente con el tamaño de la muestra, aunque sigue sin alcanzar la eficiencia de \(t1\) y \(t3\).

Con \(n = 1000\), la precisión y eficiencia de los estimadores \(t1\) y \(t3\) se mantienen sólidas, con muy baja insesgadez y varianza. \(t2\), por otro lado, sigue mostrando un sesgo considerable y una alta varianza, lo que lo convierte en un estimador no confiable. \(t4\) mejora tanto en insesgadez como en varianza con un tamaño de muestra grande, pero aún no es tan eficiente como \(t1\) y \(t3\).

Conclusiones generales

  • \(t3\) es el mejor estimador en términos de insesgadez, eficiencia y consistencia, y es recomendable para su uso en estimaciones cuando se busca un equilibrio óptimo entre precisión y estabilidad.

  • \(t1\) también es un estimador muy confiable, casi insesgado y eficiente, y sigue siendo una opción sólida, especialmente cuando la precisión absoluta no es crítica.

  • \(t4\) puede ser una opción aceptable en escenarios donde se dispone de tamaños de muestra grandes, ya que mejora su precisión y eficiencia.

  • \(t2\) es el menos recomendable debido a su sesgo positivo y alta varianza, lo que lo convierte en un estimador ineficiente y poco confiable.

El estimador \(t2\) podría mejorar significativamente con ajustes en los pesos, el uso de métodos de remuestreo como bootstrap, esta estrategia podría pueden reducir tanto el sesgo como la varianza, convirtiendo a \(t2\) en un estimador más insesgado y eficiente.