Suponga que para un problema de respuesta binaria se planea usar una previa uniforme para la proporción de la población \(\theta\), con el fin de no favorecer ningún valor de \(\theta\) a priori. Sin embargo, algunas personas prefieren estudiar las proporciones en escala logit, es decir, están interesados en \(\gamma = \log\frac{\theta}{1-\theta}\). Vía simulación de Monte Carlo, encuentre la distribución previa de \(\gamma\) inducida por la distribución uniforme para \(\theta\). ¿Esta distribución es Uniforme para \(\gamma\)?
Se quiere comparar dos ciudades cuyos sistemas de opinión se pueden considerar como independientes, en términos de las tasas de apoyo \(\theta_1\) y \(\theta_2\) que los ciudadanos otorgan a una medida económica gubernamental. Por tal motivo, se realiza un estudio de carácter observacional en el que, entre otras variables, se recopilan datos sobre la variable binaria \(y_{i,j}\) que asume el valor 1 si la persona \(i\) de la ciudad \(j\) apoya la medida, y asume el valor 0 en caso contrario, para \(i=1,\ldots,n_j\) y \(j=1,2\). Teniendo en cuenta que, \[ s_1=\sum_{i=1}^{85} y_{i,1} = 57 \qquad\text{y}\qquad s_2=\sum_{i=1}^{90} y_{i,2} = 36\,, \] y asumiendo distribuciones previas no informativas para \(\theta_1\) y \(\theta_2\) en modelos Beta-Binomial independientes, calcule: i. la media de \(\theta_1-\theta_2\), ii. un intervalo de credibilidad al 95% para \(\theta_1-\theta_2\), y iii. la probabilidad de que \(\theta_1 > \theta_2\), con base en \(B=10,000\) muestras independientes de la distribución posterior de \((\theta_1,\theta_2)\). ¿Es posible argumentar diferencias significativas entre las tasas de opinión de las dos ciudades?
Considere el contexto del ejercicio 2 del Taller 3 acerca de las tasas tumorigenesis en dos cepas de ratones.
Considere el modelo \(y_i\mid\theta \stackrel{\text{iid}}{\sim} \textsf{N}(\theta,\sigma^2_0)\), para \(i = 1,\ldots,n\), con varianza \(\sigma^2_0\) conocida, y \(\theta \sim \textsf{N}(\mu_0,\tau^2_0)\), donde \(\mu_0\) y \(\tau^2_0\) son hiperparámetros (conocidos). Muestre que \(\theta\mid\boldsymbol{y}\sim\textsf{N}(\mu_n,\tau^2_n)\), donde \[ \tau^2_n = \frac{1}{\frac{1}{\tau^2_0} + \frac{n}{\sigma^2_0}}\qquad\text{y}\qquad\mu_n = \frac{\frac{1}{\tau^2_0}\,\mu_0 + \frac{n}{\sigma^2_0}\,\bar{y}}{\frac{1}{\tau^2_0} + \frac{n}{\sigma^2_0}}\,, \] donde \(\boldsymbol{y}=(y_1,\ldots,y_n)\) y \(\bar{y} = \frac1n\sum_{i=1}^n y_i\). Por lo tanto, la media posterior de \(\theta\) es un promedio ponderado entre la media a priori \(\mu_0\) y la media muestral \(\bar{y}\).
Considere una única observación de la distribución muestral \(x\mid\theta\sim\textsf{N}(\theta,\theta)\), con \(\theta > 0\). Muestre que la previa de Jeffreys de para \(\theta\) es tal que: \[ p_J(\theta)\propto\frac{(2\theta + 1)^{1/2}}{\theta}\,. \]