Apresentação
Bugs
Bayesian inference Using Gibbs Sampler ou ‘Inferência Bayesina utilizando o amostrador de Gibbs’, dorovante BUGS, é um projeto concebido na criação de um software flexível para análise de modelos estatísticos de alta complexidade, utilizando Markov Chain Monte Carlo como método. O projeto começou em 1989 sob a tutela de Spiegelhalter et al, na MCR Biostatistics Unit, em Camdribge, resultando o programa inicial denominado de BUGS. Furthermore, em um projeto conjunto com a Imperial College, Londres, foi desenvolvido o WinBugs, uma versão compatível com o R.
Posteriormente, foi apresentado ao público o OpenBUgs, uma versão acessível ao público geral e igualmente compatível com o R, assim como a versão anterior. Howerver, a produção de seu conteúdo foi encerrada em 2011, embora haja versões disponíveis até o presente dia. Atualmente, conta com mais de 30 mil downloas de usuários e uma interface gráfica única.
Em 2018, Goudie el at desenvolveram o projeto MultiBugs, que oferece um algoritmo em computação parelala, objetivando a compilação rápida de modelos mais robustos.
Jags
Just Another Gibbs Sampler (JAGS), ou Apenas Outro amostra de Gibbs, é um software ao moldes do GIBS, apresentado anteriormente, criado sob as mesmas premissas e com o mesmo objetivo, Inferência Bayesiana via MCMC. Para além das similaridades mencionadas, o JAGS é mais flexível, se comparado com o GIBS, no que tange a interconectividade com outros softwares estatísticos, em especial, o R.
Desenvolvido por Martyn Plummer, é consideravelmente mais recente que o projeto anterior e sua última atualização data de 2017. Embora, assim como o BUGS, é necessário que o compilador esteja atuando em concomitância com o R, ou seja, não há independência. O JAGS é de uso livre e licensiado sob a GNU General Public License.
Stan
Stan é pacote estatístico com o objetivo de realizar inferência bayesiana sob a ótica do MCMC. Desenvolvido por Gelman, Carpenter e um time de 34 pesquisados, o programa é uma homenagem ao pinoeiro do método de Monte Carlo e físico responsável pela descoberta da fissão atômica, Stanislaw Ulam, um dos membros do projeto Manhattam. É licensiado pela New BDS License, sendo de origem recente, produzido em 2012, conta com atualização e feedback de sua equipe até o presente dia.
Em suma, as diferenças para o JAGS e o BUGS consta na compilação do modelo, os primeiros, mais simples, seguem o mesmo padrão. O Stan, por sua vez, adotou uma linguagem C++ para a escrita da modelagem. O seu diferencial está em seus algoritmos, sendo o Hamiltonian Monte Carlo (HMC) (default) e o No U turner sampler (NUTS), alternativo ao primeiro.
Nimble
O nimble é sistema integrado ao R, em formato de pacote, desenvolvido por uma pesquisa colaborativa entre P de Valpine, C Paciorek e D Temple Lang. Tem como objetivo principal a difusão da análise e cômputo de modelos de alta dimensionalidade, ou computacionalmente intensivos, em especial os modelos hierárquicos. O compilador utiliza-se da linguagem do BUGS, já bem definida pela comunidade, ademias, seus rotinas internas são integradas em C++ para ganhos de velocidade.
Embora seja considerado um compilador User Friendly para MCMC, o Nimble possui outras ferramentas. Há a possiblidade também de escrever modelos Bayesianos Não Paramétricos (BNP) de modelos de mistura e estimação de densidade não paramétrica via processo de mistura Dirichlet.
Dados
######################################################################################
# SIMULAÇÃO DOS DADOS #
######################################################################################
set.seed(123)
#Parâmetros verdadeiros
beta0=-2
beta1=2
beta2=10
sigma2=5
n=100
tau=1/sigma2
#Geração
x1=rnorm(n,0,1)
x2=rnorm(n,2,10)
e=rnorm(n,0, sd = sqrt(sigma2))
y=beta0+beta1*x1+beta2*x2+e
BUGS
Código
######################################################################################
# BUGS #
######################################################################################
#Modelo do tipo BUGS
sink("mod1.txt")
cat("
MODEL LR1 {
#Verossimilhança
for(i in 1:N) {
y[i] ~ dnorm(mu[i], tau)
mu[i] <- beta0 + beta1*x1[i] + beta2*x2[i]
}
#Proris
beta0 ~ dnorm(0,0.1)
beta1 ~ dnorm(0,0.1)
beta2 ~ dnorm(0,0.1)
tau ~ dgamma(1,0.1)
#Transformação para variância
sigma2 <- 1/tau
} ", fill = TRUE)
sink()
#Obeservação: A dist normal no bugs está definido para a precisão.
#Tamanho amostral
N = length(y)
#Conjunto de dados observados
data = list("N","y","x1","x2")
#Parâmetros estudados
params = c("beta0", "beta1","beta2","tau","sigma2")
#Valores iniciais
inits <- function () {list(beta0 = rnorm(1),
beta1 = rnorm(1),
beta2 = rnorm(1),
tau = 1)
sigma2 = 1}
#Modelo final
tic()
result <- bugs(data = data, inits = inits, parameters.to.save = params,
model.file = "mod1.txt", n.chains = 3, n.iter = 10000,
n.burnin = 1000, n.thin=9, bugs.directory = "C:\\Program Files\\WinBUGS14",
debug = TRUE, save.history = TRUE, DIC = FALSE)
toc()
Resultados
| |
mean |
sd |
2.5% |
25% |
50% |
75% |
97.5% |
Rhat |
n.eff |
| beta0 |
-1.7017525 |
0.2174842 |
-2.1550000 |
-1.84525 |
-1.70400 |
-1.554000 |
-1.279975 |
1.002923 |
830 |
| beta1 |
1.6939550 |
0.2304004 |
1.2440000 |
1.53975 |
1.69900 |
1.845000 |
2.144000 |
1.001317 |
2400 |
| beta2 |
10.0042037 |
0.0220753 |
9.9620000 |
9.98900 |
10.00000 |
10.020000 |
10.050000 |
1.000688 |
3000 |
| tau |
0.2250701 |
0.0327324 |
0.1658975 |
0.20160 |
0.22385 |
0.246025 |
0.293710 |
1.000817 |
3000 |
| sigma2 |
4.5387863 |
0.6724222 |
3.4048749 |
4.06400 |
4.46750 |
4.959250 |
6.026150 |
1.000817 |
3000 |


JAGS
Código
######################################################################################
# JAGS #
######################################################################################
model_code = 'model{
#Verossimilhança
for(i in 1:N) {
y[i] ~ dnorm(mu[i], tau)
mu[i] <- beta0 + beta1*x1[i] + beta2*x2[i]
}
#Proris
beta0 ~ dnorm(0,0.1)
beta1 ~ dnorm(0,0.1)
beta2 ~ dnorm(0,0.1)
tau ~ dgamma(1,0.1)
#Transformação para variância
sigma2 <- 1/tau}'
N = length(y)
model_data = list(N = N, y = y, x1 = x1, x2 = x2)
model_parameters = c("beta0", "beta1","beta2", "sigma2","tau")
tic()
model_run = jags(data = model_data,
parameters.to.save = model_parameters,
model.file=textConnection(model_code),
n.chains=3, # Number of different starting positions
n.iter=10000, # Number of iterations
n.burnin=1000, # Number of iterations to remove at start
n.thin=9,# Amount of thinning
DIC=FALSE)
toc()
Resultados
| |
mean |
sd |
2.5% |
25% |
50% |
75% |
97.5% |
Rhat |
n.eff |
| beta0 |
-1.6860944 |
0.2105909 |
-2.0879681 |
-1.8296104 |
-1.687723 |
-1.5483238 |
-1.266608 |
1.000977 |
3000 |
| beta1 |
1.6909286 |
0.2311049 |
1.2313686 |
1.5387469 |
1.688274 |
1.8493560 |
2.144819 |
1.000647 |
3000 |
| beta2 |
10.0052898 |
0.0219353 |
9.9620366 |
9.9905397 |
10.005205 |
10.0198417 |
10.048766 |
1.001766 |
1600 |
| sigma2 |
4.5186170 |
0.6587993 |
3.4324159 |
4.0422921 |
4.452478 |
4.9056101 |
5.975496 |
1.000686 |
3000 |
| tau |
0.2258834 |
0.0320833 |
0.1673501 |
0.2038482 |
0.224594 |
0.2473844 |
0.291340 |
1.000686 |
3000 |


STAN
Código
######################################################################################
# STAN #
######################################################################################
model = "data {
int<lower=1> N;
vector[N] y;
vector[N] x1;
vector[N] x2;
}
parameters {
real alpha;
real beta1;
real beta2;
real<lower=0> sigma2;
}
model {
alpha ~ normal(0, 10);
beta1 ~ normal(0, 10);
beta2 ~ normal(0, 10);
sigma2 ~ inv_gamma(3,20);
y ~ normal(alpha + beta1 * x1 + beta2*x2, sqrt(sigma2));
}
generated quantities {
vector[N] y_rep;
for(n in 1:N) {
y_rep[n] = normal_rng(alpha + beta1 * x1[n] + beta2*x2[n], sqrt(sigma2));
}
}"
data <- list(y = y, x1 = x1, x2 = x2 , N = 100)
tic()
fit <- stan(model_code = model,
data = data, iter = 10000, warmup = 1000, chains = 3)
stan = extract(fit)
toc()
Resultados
| |
mean |
se_mean |
sd |
2.5% |
25% |
50% |
75% |
97.5% |
n_eff |
Rhat |
| alpha |
-1.705771 |
0.0013234 |
0.2187635 |
-2.138415 |
-1.851237 |
-1.704914 |
-1.559763 |
-1.276514 |
27325.03 |
0.9999686 |
| beta1 |
1.699761 |
0.0014114 |
0.2395953 |
1.228784 |
1.540529 |
1.698885 |
1.861845 |
2.168289 |
28818.32 |
0.9999350 |
| beta2 |
10.005224 |
0.0001332 |
0.0225257 |
9.961374 |
9.990201 |
10.005070 |
10.020402 |
10.049088 |
28582.34 |
0.9999602 |
| sigma2 |
4.745150 |
0.0041508 |
0.6696007 |
3.614317 |
4.275004 |
4.679747 |
5.153950 |
6.223051 |
26024.15 |
1.0000428 |
|
| |
mean.chain:1 |
sd.chain:1 |
2.5%.chain:1 |
25%.chain:1 |
50%.chain:1 |
75%.chain:1 |
97.5%.chain:1 |
mean.chain:2 |
sd.chain:2 |
2.5%.chain:2 |
25%.chain:2 |
50%.chain:2 |
75%.chain:2 |
97.5%.chain:2 |
mean.chain:3 |
sd.chain:3 |
2.5%.chain:3 |
25%.chain:3 |
50%.chain:3 |
75%.chain:3 |
97.5%.chain:3 |
| alpha |
-1.704459 |
0.2182247 |
-2.134405 |
-1.845417 |
-1.702805 |
-1.560221 |
-1.272177 |
-1.708991 |
0.2205426 |
-2.143654 |
-1.856214 |
-1.707929 |
-1.561689 |
-1.281975 |
-1.703863 |
0.2175001 |
-2.132866 |
-1.852140 |
-1.704202 |
-1.557887 |
-1.279405 |
| beta1 |
1.698571 |
0.2366761 |
1.234933 |
1.541722 |
1.696640 |
1.857513 |
2.164830 |
1.701441 |
0.2444538 |
1.217817 |
1.537478 |
1.701037 |
1.868434 |
2.175044 |
1.699270 |
0.2375979 |
1.229826 |
1.541493 |
1.699162 |
1.860382 |
2.159939 |
| beta2 |
10.005271 |
0.0223819 |
9.961223 |
9.990564 |
10.005212 |
10.020494 |
10.048512 |
10.005315 |
0.0224908 |
9.961959 |
9.990279 |
10.004997 |
10.020309 |
10.049125 |
10.005086 |
0.0227050 |
9.960872 |
9.989856 |
10.004952 |
10.020399 |
10.049404 |
| sigma2 |
4.739498 |
0.6709983 |
3.616892 |
4.267374 |
4.665881 |
5.148719 |
6.239155 |
4.746080 |
0.6703198 |
3.616933 |
4.276826 |
4.680797 |
5.153938 |
6.220253 |
4.749871 |
0.6675122 |
3.603574 |
4.279996 |
4.692062 |
5.159586 |
6.208506 |
|


NIMBLE
Código
######################################################################################
# NIMBLE #
######################################################################################
simpleCode1 <- nimbleCode({
beta0 ~ dnorm(0,0.1)
beta1 ~ dnorm(0,0.1)
beta2 ~ dnorm(0,0.1)
tau ~ dgamma(1, 0.1)
sigma2 <- 1/tau
for(i in 1:N) {
Ypred[i] <- beta0 + beta1 * x1[i] + beta2*x2[i]
Y[i] ~ dnorm(Ypred[i], tau)
}
})
simpleModel1 <- nimbleModel(simpleCode1,
data = list(Y = y, x1 = x1,x2=x2),
constants = list(N = N),
inits = list(beta0 = 0, beta1 = 0,beta2=0, tau = 2 ))
tic()
mcmc.out <- nimbleMCMC(code = simpleModel1,
data = list(Y = y, x1 = x1,x2=x2),
inits = list(beta0 = 0, beta1 = 0,beta2=0, tau = 2),
monitors=c("beta0","beta1","beta2","tau","sigma2"),
nchains = 3,
niter = 10000,
thin = 9,
nburnin = 1000,
summary = TRUE,
progressBar = TRUE)
toc()
Resultados
| |
Mean |
Median |
St.Dev. |
95%CI_low |
95%CI_upp |
| beta0 |
-1.7041573 |
-1.7083052 |
0.2091917 |
-2.1043706 |
-1.2794896 |
| beta1 |
1.6974375 |
1.7005161 |
0.2272487 |
1.2548992 |
2.1237661 |
| beta2 |
10.0050927 |
10.0049245 |
0.0223281 |
9.9638410 |
10.0516948 |
| sigma2 |
4.5113108 |
4.4523352 |
0.6241347 |
3.4605394 |
5.9630216 |
| tau |
0.2258069 |
0.2246013 |
0.0304566 |
0.1677002 |
0.2889724 |
|
| |
Mean |
Median |
St.Dev. |
95%CI_low |
95%CI_upp |
| beta0 |
-1.6968087 |
-1.6944266 |
0.2076834 |
-2.0947722 |
-1.2962685 |
| beta1 |
1.6877346 |
1.6932318 |
0.2321149 |
1.2386992 |
2.1394175 |
| beta2 |
10.0043223 |
10.0043528 |
0.0223773 |
9.9611573 |
10.0475828 |
| sigma2 |
4.4939257 |
4.4264768 |
0.6632215 |
3.4387254 |
5.9387300 |
| tau |
0.2272029 |
0.2259133 |
0.0323686 |
0.1683862 |
0.2908054 |
|
| |
Mean |
Median |
St.Dev. |
95%CI_low |
95%CI_upp |
| beta0 |
-1.6928879 |
-1.6885632 |
0.2167004 |
-2.102350 |
-1.270194 |
| beta1 |
1.6852116 |
1.6877019 |
0.2381134 |
1.216738 |
2.150423 |
| beta2 |
10.0055725 |
10.0063789 |
0.0221097 |
9.962371 |
10.049552 |
| sigma2 |
4.5020546 |
4.4327260 |
0.6709563 |
3.398402 |
6.061527 |
| tau |
0.2268949 |
0.2255948 |
0.0327657 |
0.164975 |
0.294256 |
|
| |
Mean |
Median |
St.Dev. |
95%CI_low |
95%CI_upp |
| beta0 |
-1.6979513 |
-1.6964828 |
0.2112099 |
-2.1021654 |
-1.2796220 |
| beta1 |
1.6901279 |
1.6935095 |
0.2325170 |
1.2372259 |
2.1414415 |
| beta2 |
10.0049958 |
10.0049545 |
0.0222705 |
9.9622690 |
10.0492859 |
| sigma2 |
4.5024303 |
4.4367283 |
0.6529133 |
3.4376043 |
5.9920623 |
| tau |
0.2266349 |
0.2253913 |
0.0318745 |
0.1668875 |
0.2909003 |
|


Comparativo entre os tempos
Pacote utilizado: tictoc
| |
Tempo em Segundos (Arredondado) |
| Bugs |
6 |
| Jags |
2 |
| Stan |
8 |
| Nimble |
30 |
