Problema2

1 Problema 2: Propiedades de los estimadores

Un centro de atención médica registra el tiempo de espera (en minutos) de los pacientes antes de ser atendidos. Se sabe que estos tiempos siguen una distribución Gamma con parámetros conocidos α=3 (forma) y σ=2 (escala). El parámetro que se supone desconocido en este problema es la media poblacional μ=ασ.

Sea X1,X2,…,Xn una muestra aleatoria de tamaño n independiente e identicamente distribuida extraída de esta población. Se proponen los siguientes estimadores para μ:

Estimador 1: \(μ1 = \frac{1}{n}\sum_{i=1}^n Xi\)

Estimador 2: \(μ2 = \frac{min(X1,...,Xn)+(max(X1,...,Xn))}{2}\)

Estimador 3: \(μ3 = X(1)\)

Estimador 4: \(μ4 = \frac{1}{n + 1}\sum_{i=1}^n Xi\)

1.1 a. Simulación de estimadores:

Se generan 100 muestras de tamaño \(n=10\) de una distribucaion Gamma con parámetros \(α=3\) y \(σ=2\):

Por cada muestra se calculan los estimadores anteriores.

Se realizan las graficas de los resultados en curvas de densidad.

Figure 1: Figura curvas de densidad de los estimadores

1.2 b. Insesgadez:

Se realiza la estimacion de la media de cada estimador y se compara con las medias de la poblacion.

## Valor teorico de la media μ=ασ, μ=3*2=6:

## Media del Estimador1: 5.812104

## Media del Estimador2: 6.799617

## Media del Estimador3: 1.878252

## Media del Estimador4: 5.283731

## Media del la poblacion: 5.812104

Teniendo en cuenta los calculos apreciados en los resultados anteriores y conociendo que la formula de la media es el que esta en el Estimador 1 se evidencia que la media de la poblacion de la muestra realizada da el mismo valor del estimador 1, donde se evidencia que:

Con base en los resultados obtenidos, se compara el valor teórico de la media, 𝜇=ασ; α=3 y σ=2 donde 𝜇=3×2=6, con la media estimada por cada uno de los estimadores evaluados. A partir de esta comparación, se puede analizar el sesgo de cada estimador según su cercanía al valor teórico poblacional.

Estimador 1: la media de este es muy cercana al valor teorico por lo cual es un estimador insesgado.

El Estimador 1 presenta una media de 5.812104, valor muy cercano al parámetro teórico y además coincide con la media observada en la población generada. Esto indica que es un estimador con bajo sesgo y, en términos prácticos, puede considerarse aproximadamente insesgado.

Estimador 2: La media si bien es cercana se puede considerar tambien como un estimador insesgado.

El Estimador 2 arroja una media de 6.799617, la cual se encuentra por encima del valor teórico de 6. Por tanto, aunque su valor no es excesivamente distante, presenta una sobreestimación del parámetro, lo que indica que se trata de un estimador sesgado.

Estimador 3: La media esta muy alejada del valor teorico por lo cual es un estimador sesgado y subestima el parametro.

El Estimador 3 presenta una media de 1.878252, claramente alejada del valor teórico. En consecuencia, es un estimador sesgado que subestima considerablemente el parámetro poblacional.

Estimador 4: La media es cercana sin embargo sigue estado alejado del valor real, por lo tanto es un estimador sesgado que subestima el parametro.

Por su parte, el Estimador 4 tiene una media de 5.283731, que aunque es relativamente cercana a 6, continúa mostrando una diferencia apreciable respecto al valor teórico. Por ello, también se clasifica como un estimador sesgado, en este caso con subestimación del parámetro.

En síntesis, de los cuatro estimadores analizados, el Estimador 1 es el que ofrece la mejor aproximación al valor teórico de la media, por lo que resulta ser el más adecuado en términos de insesgadez. Los demás estimadores presentan distintos niveles de sesgo, ya sea por sobreestimación o subestimación del parámetro.

1.3 c. Consistencia:

Mediante una simulación computacional, se incrementa el tamaño muestral desde \(n=10\) hasta \(n=1,000\), utilizando un conjunto de valores representativos como 5, 10, 20, 30, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, entre otros. Grafica cómo cambia la variabilidad relativa de los estimadores a medida que aumenta el tamaño muestral.

Realiza un análisis utilizando gráficos y las estadísticas necesarias para evaluar la consistencia de los estimadores.

Como se logra observar en el calculo que tenemos, a medida que el tamaño muestral \(n\) aumenta segun se aprecia que se aproxima mas y mas al valor real.

##       n   Estimador         CV
## 1     5 Estimador 1 0.24673223
## 2     5 Estimador 2 0.29951896
## 3     5 Estimador 3 0.41859583
## 4     5 Estimador 4 0.24673223
## 5    10 Estimador 1 0.18924495
## 6    10 Estimador 2 0.26596565
## 7    10 Estimador 3 0.50146654
## 8    10 Estimador 4 0.18924495
## 9    20 Estimador 1 0.13193262
## 10   20 Estimador 2 0.23558074
## 11   20 Estimador 3 0.41110065
## 12   20 Estimador 4 0.13193262
## 13   30 Estimador 1 0.11000560
## 14   30 Estimador 2 0.16423764
## 15   30 Estimador 3 0.44426797
## 16   30 Estimador 4 0.11000560
## 17   50 Estimador 1 0.08495684
## 18   50 Estimador 2 0.17357708
## 19   50 Estimador 3 0.36674864
## 20   50 Estimador 4 0.08495684
## 21   60 Estimador 1 0.07807791
## 22   60 Estimador 2 0.16499722
## 23   60 Estimador 3 0.43771900
## 24   60 Estimador 4 0.07807791
## 25   70 Estimador 1 0.06742030
## 26   70 Estimador 2 0.17536537
## 27   70 Estimador 3 0.35939826
## 28   70 Estimador 4 0.06742030
## 29   80 Estimador 1 0.06477112
## 30   80 Estimador 2 0.14764257
## 31   80 Estimador 3 0.40744883
## 32   80 Estimador 4 0.06477112
## 33   90 Estimador 1 0.06321651
## 34   90 Estimador 2 0.16030032
## 35   90 Estimador 3 0.43106049
## 36   90 Estimador 4 0.06321651
## 37  100 Estimador 1 0.05846604
## 38  100 Estimador 2 0.18651832
## 39  100 Estimador 3 0.35959028
## 40  100 Estimador 4 0.05846604
## 41  200 Estimador 1 0.04287409
## 42  200 Estimador 2 0.15188726
## 43  200 Estimador 3 0.33665457
## 44  200 Estimador 4 0.04287409
## 45  300 Estimador 1 0.03172082
## 46  300 Estimador 2 0.12256425
## 47  300 Estimador 3 0.39884461
## 48  300 Estimador 4 0.03172082
## 49  400 Estimador 1 0.02727834
## 50  400 Estimador 2 0.12889690
## 51  400 Estimador 3 0.36475731
## 52  400 Estimador 4 0.02727834
## 53  500 Estimador 1 0.02570595
## 54  500 Estimador 2 0.12877825
## 55  500 Estimador 3 0.38652706
## 56  500 Estimador 4 0.02570595
## 57  600 Estimador 1 0.02789908
## 58  600 Estimador 2 0.12050963
## 59  600 Estimador 3 0.37860614
## 60  600 Estimador 4 0.02789908
## 61 1000 Estimador 1 0.01921149
## 62 1000 Estimador 2 0.14927432
## 63 1000 Estimador 3 0.32958970
## 64 1000 Estimador 4 0.01921149

Para este ejercicio se logra observar en la figura numero 2 El CV (Coheficiente de variacion) disminuye conforme aumenta el tamaño muestral, a excepcion del estimador 3 donde se aprecia que aumenta un leve pico en la muestra de tamaño \(n = 300\) el resto de estimadores si convervan un comportamiento descreciente al aumentar \(n\). Otra observacion importante es que el estimador 4 se comporta muy similar al estimador 1 por eso se sobre ponen uno al otro. esto nos indica que estos dos son los mas consistentes.

Figure 2: Figura Evaluacion de consistencia: coeficiente de Variacion

1.4 d. Eficiencia:

Mediante una simulación computacional, calcula la varianza muestral y el coeficiente de variación de cada estimador, y compáralos.

Realiza un análisis utilizando gráficos y las estadísticas pertinentes para determinar cuál de los estimadores es el más eficiente.

A partir de los resultados obtenidos mediante simulación, se observa que el Estimador 4 presenta la menor varianza es 0.5851148, seguido por el Estimador 3 es 0.6251546, el Estimador 1 es 0.7079889 y, finalmente, el Estimador 2, que registra la mayor varianza es 2.022028. Esto indica que el Estimador 4 es el más preciso en términos de dispersión absoluta, mientras que el Estimador 2 es el menos estable.

Se Observa que los calculos relacionados a continuacion, que el estimador numero 3 presenta la menor varianza de todos los estimadores, y el estimador 2 la mayor de todos.El menor coheficiente de variacion se distribuye igual valor entre entimador 1 y 4.

En cuanto al coeficiente de variación, los valores más bajos corresponden a los Estimadores 1 y 4 es 0.1447704, lo que sugiere una menor dispersión relativa respecto a sus medias. El Estimador 2 presenta un coeficiente de variación intermedio es 0.2091265, mientras que el Estimador 3 muestra el valor más alto es 0.420959, reflejando una mayor variabilidad relativa.

No obstante, la eficiencia de un estimador no debe evaluarse únicamente por su varianza, sino también por su cercanía al valor verdadero del parámetro. En ese sentido, aunque el Estimador 4 presenta la menor varianza, su sesgo impide considerarlo como la mejor opción de forma aislada. De manera similar, el Estimador 2 combina alta varianza con sobreestimación, lo que lo convierte en el menos eficiente del grupo.

## Varianza del Estimador 1: 0.7079889

## Varianza del Estimador 2: 2.022028

## Varianza del Estimador 3: 0.6251546

## Varianza del Estimador 4: 0.5851148

## Coeficiente de variacion del Estimador 1: 0.1447704

## Coeficiente de variacion del Estimador 2: 0.2091265

## Coeficiente de variacion del Estimador 3: 0.420959

## Coeficiente de variacion del Estimador 4: 0.1447704

Como se observa en la figura 3 Los estimadores 1 y 4 presentan sesgos, lo cual está en concordancia con su elevado coeficiente de variación. Al analizar los resultados, se observa que, aunque los estimadores 3 y 4 poseen la menor varianza —tal como se confirma en los cálculos—, el estimador 4 muestra una distribución más sesgada en comparación con el estimador 3. Por otro lado, el estimador 2 evidencia una distribución mucho más dispersa alrededor de su valor real, lo que confirma su alta variabilidad. En síntesis, el estimador más equilibrado, con baja varianza y un centrado cercano al valor verdadero, es el estimador 3.

La Figura 3 permite comparar simultáneamente el centro, la dispersión y la simetría de los cuatro estimadores respecto al valor teórico de la media poblacional. En primer lugar, se observa que el Estimador 1 presenta una mediana muy cercana a su línea de referencia y una dispersión moderada, lo que sugiere un comportamiento relativamente estable y una buena aproximación al parámetro.

El Estimador 2 muestra la mayor dispersión, evidenciada por una caja más amplia y bigotes más extensos, además de la presencia de valores atípicos. Esto indica que sus estimaciones varían considerablemente de una simulación a otra, por lo que resulta menos preciso que los demás.

Por su parte, el Estimador 3 exhibe una caja más compacta, lo que sugiere menor variabilidad, pero su centro se encuentra claramente alejado del valor teórico. Esto significa que, aunque es más estable, produce estimaciones sistemáticamente desplazadas, es decir, presenta sesgo.

En el caso del Estimador 4, se aprecia también una dispersión relativamente baja y una distribución más concentrada que la del Estimador 2. Sin embargo, su centro no coincide plenamente con el valor verdadero, por lo que, aunque es más preciso que otros en términos de variabilidad, sigue presentando sesgo.

En conjunto, la gráfica muestra que la evaluación de los estimadores no debe hacerse únicamente con base en la varianza. Un estimador puede ser muy estable, pero estar alejado del valor real. Por ello, el mejor estimador será aquel que combine baja dispersión y centrado cercano al parámetro poblacional.

Aspectos puntuales que también puede mencionar

La mediana de cada boxplot permite ver qué tan centrado está cada estimador.
El ancho de la caja refleja la variabilidad del 50% central de las estimaciones.
Los bigotes largos sugieren mayor dispersión.
Los puntos atípicos muestran simulaciones extremas.
La asimetría de la caja o de los bigotes puede indicar sesgo en la distribución del estimador.

Figure 3: Figura comparativa de los estimadores