TAREA 5 - MODELO MULTINOMIAL
CASO - MODELO MULTINOMIAL
Se realizó una encuesta para analizar la preferencia de marca de celular entre Samsung y Apple. De las 1600 personas encuestadas y1 = 600 prefirieron Samsung, y2 = 800 prefirieron Apple y y3 = 200 no tienen preferencia por ninguno de las marcas.
Se asume que \(y|θ \sim M(n=1600,\theta_{1},\theta _{2},\theta _{3})\) y que a priori \(θ \sim D(\alpha _{1} =4,\alpha _{2} = 3,\alpha _{3} = 2)\)
Resolución:
a) Calcular los parámetros de la distribución posterior.
y1 <- 600
y2 <- 800
y3 <- 200
alpha.1 <- 4
alpha.2 <- 3
alpha.3 <- 2
alpha.post.1 <- alpha.1 + y1
alpha.post.2 <- alpha.2 + y2
alpha.post.3 <- alpha.3 + y3
alpha.post.1
## [1] 604
## [1] 803
## [1] 202
Entonces, la distribución posterior será:
\[θ|y \sim D(\alpha_{1}^{1600} =604,\alpha _{2}^{1600} = 803,\alpha _{3}^{1600} = 202)\]
b) Usar el proceso de simulación para estimar la diferencia entre las proporciones de los que prefieren Samsung y Apple θ1- θ2 considerando 1500 números pseudoaleatorios y set.seed(2024).
library(mixAK)
set.seed(2024)
theta <- rDirichlet(1500, alpha = c(alpha.post.1, alpha.post.2, alpha.post.3))
head(theta)
## [,1] [,2] [,3]
## 1 0.3819899 0.4963491 0.1216610
## 2 0.3603992 0.5120326 0.1275683
## 3 0.3687540 0.5121278 0.1191181
## 4 0.3734507 0.5016674 0.1248819
## 5 0.3457322 0.5174862 0.1367816
## 6 0.3531595 0.5086112 0.1382293
## [1] 0.3750016 0.4994016 0.1255967
Observando la diferencia entre las proporciones:
De acuerdo a la respuesta de los encuestados, se podría afirmar que la marca Apple (𝜃2) tiene ventaja sobre la marca Samsung (𝜃1).
## [1] -0.1244
# Intervalo de credibilidad para la diferencia al 95%
alfa = 1 - 95/100
quantile(theta[, 1] - theta[, 2], c(alfa/2, 1 - alfa/2))
## 2.5% 97.5%
## -0.17139453 -0.07836468
Universidad Nacional Agraria La Molina, 20200339@lamolina.edu.pe↩︎