Foram gerados 100 modelos usando o algoritmo meta.Vote. As probabilidades de classificação (AGG, ALL) para cada instância foi determinada como a média dos 100 modelos.
O arquivo de probabilidade resultante tem o seguinte formato:
sendo que das probabilidade ALL foram tomadas 1-p.
Butland também fornece todos os dados experimentados. Contruí uma tabela contendo as probabilidade e o s-score para 95 mil pares. Nenhuma correlação foi observada.
scbut = read.csv("prob_but.csv")
plot(scbut$score ~ scbut$prob, ylab = "S-score", xlab = "Probability of being AGG")
Correlation coefficient
cor(scbut$score, scbut$prob)
## [1] 0.006242