Entender y validar las propiedades de los estimadores estadísticos como: insesgadez, eficiencia y la consistencia.
Actividad: Sean X1, X2, X3 y X4 una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
\[\begin{align*} \hat{\theta}_1 &= \frac{X_1 + X_2^6 + X_3 + X_4^3}{4} \\ \hat{\theta}_2 &= \frac{X_1 + 2X_2 + 3X_3 + 4X_4}{5} \\ \hat{\theta}_3 &= \frac{X_1 + X_2 + X_3}{4} \\ \hat{\theta}_4 &= \frac{\min\{X_1, X_2, X_3, X_4\} + \max\{X_1, X_2, X_3, X_4\}}{2} \end{align*}\]
Muestras de n=20, para cada uno de los estimadores para el parámetro θ = 5, utilizamos las funciones:
rexp() - Generar números aleatorios de una distribución exponencial.
data.frame() - Crear una estructura de datos similar a una tabla con los valores de los estimadores
apply() - Aplicar una función a las filas o columnas de una matriz o un marco de datos.
boxplot() - Crear un gráfico de caja, que visualiza la distribución de datos a través de sus cuartiles y muestre posibles valores atípicos.
Insesgadez: Un estimador es insesgado si su valor esperado es igual al valor verdadero del parámetro que está estimando. Si la insesgadez se acerca a 0, el estimador es más insesgado.
\[ \begin{align*} \mathcal{B}_{t1} &= \bar{t_1} - \theta \\ \mathcal{B}_{t2} &= \bar{t_2} - \theta \\ \mathcal{B}_{t3} &= \bar{t_3} - \theta \\ \mathcal{B}_{t4} &= \bar{t_4} - \theta \end{align*} \]
Eficiencia: Se mide por su varianza. Un estimador es más eficiente si tiene una varianza menor.
Consistencia: Un estimador es consistente si se acerca al valor verdadero del parámetro conforme el tamaño de la muestra aumenta.
\[ \text{insesgadez} = \left[ \begin{array}{cccc} \mathcal{B}_{t1} & \mathcal{B}_{t2} & \mathcal{B}_{t3} & \mathcal{B}_{t4} \end{array} \right] = \left[ \begin{array}{cccc} 0.1771219 & 5.2197939 & 0.0856445 & 1.0039392 \end{array} \right] \]
\[ \text{Eficiencia} = \left[ \begin{array}{cccc} \text{Var}(t1) & \text{Var}(t2) & \text{Var}(t3) & \text{Var}(t4) \end{array} \right] = \left[ \begin{array}{cccc} 6.8033328 & 21.9219248 & 4.9649541 & 13.0181683 \end{array} \right] \]
En resumen, \(t3\) es el estimador de mejor comportamiento con n= 20 debido a su baja insesgadez y alta eficiencia, seguido de \(t1\).
\[ \text{insesgadez} = \left[ \begin{array}{cccc} \mathcal{B}_{t1} & \mathcal{B}_{t2} & \mathcal{B}_{t3} & \mathcal{B}_{t4} \end{array} \right] = \left[ \begin{array}{cccc} -0.0279766 & 4.8950967 & 0.036166 & 0.7881205 \end{array} \right] \]
\[ \text{Eficiencia} = \left[ \begin{array}{cccc} \text{Var}(t1) & \text{Var}(t2) & \text{Var}(t3) & \text{Var}(t4) \end{array} \right] = \left[ \begin{array}{cccc} 6.6972321 & 26.7956097 & 6.7243011 & 12.3275283 \end{array} \right] \]
\[ \text{insesgadez} = \left[ \begin{array}{cccc} \mathcal{B}_{t1} & \mathcal{B}_{t2} & \mathcal{B}_{t3} & \mathcal{B}_{t4} \end{array} \right] = \left[ \begin{array}{cccc} 0.1771219 & 5.2197939 & 0.0856445 & 1.0039392 \end{array} \right] \]
\[ \text{Eficiencia} = \left[ \begin{array}{cccc} \text{Var}(t1) & \text{Var}(t2) & \text{Var}(t3) & \text{Var}(t4) \end{array} \right] = \left[ \begin{array}{cccc} 6.8033328 & 21.9219248 & 4.9649541 & 13.0181683 \end{array} \right] \]
Con \(n = 100\), los estimadores \(t1\) y \(t3\) se destacan como los más confiables y eficientes, con bajo sesgo y varianza. \(t2\) continúa siendo el estimador menos favorable debido a su alto sesgo y varianza, mientras que \(t4\) mejora en precisión y eficiencia, pero aún no alcanza la efectividad de \(t1\) y \(t3\).
En resumen, \(t3\) sigue siendo el mejor estimador, seguido por \(t1\).
\[ \text{insesgadez} = \left[ \begin{array}{cccc} \mathcal{B}_{t1} & \mathcal{B}_{t2} & \mathcal{B}_{t3} & \mathcal{B}_{t4} \end{array} \right] = \left[ \begin{array}{cccc} -0.0197951 & 4.8985094 & -1.2426497\times 10^{-4} & 0.8102026 \end{array} \right] \]
\[ \text{Eficiencia} = \left[ \begin{array}{cccc} \text{Var}(t1) & \text{Var}(t2) & \text{Var}(t3) & \text{Var}(t4) \end{array} \right] = \left[ \begin{array}{cccc} 7.1552603 & 29.4163335 & 6.4961213 & 10.0919968 \end{array} \right] \]
Con \(n = 1000\), la precisión y eficiencia de los estimadores \(t1\) y \(t3\) se mantienen sólidas, con muy baja insesgadez y varianza. \(t2\), por otro lado, sigue mostrando un sesgo considerable y una alta varianza, lo que lo convierte en un estimador no confiable. \(t4\) mejora tanto en insesgadez como en varianza con un tamaño de muestra grande, pero aún no es tan eficiente como \(t1\) y \(t3\).
\(t3\) es el mejor estimador en términos de insesgadez, eficiencia y consistencia, y es recomendable para su uso en estimaciones cuando se busca un equilibrio óptimo entre precisión y estabilidad.
\(t1\) también es un estimador muy confiable, casi insesgado y eficiente, y sigue siendo una opción sólida, especialmente cuando la precisión absoluta no es crítica.
\(t4\) puede ser una opción aceptable en escenarios donde se dispone de tamaños de muestra grandes, ya que mejora su precisión y eficiencia.
\(t2\) es el menos recomendable debido a su sesgo positivo y alta varianza, lo que lo convierte en un estimador ineficiente y poco confiable.
El estimador \(t2\) podría mejorar significativamente con ajustes en los pesos, el uso de métodos de remuestreo como bootstrap, esta estrategia podría pueden reducir tanto el sesgo como la varianza, convirtiendo a \(t2\) en un estimador más insesgado y eficiente.