Lista de priorização

Foram gerados 100 modelos usando o algoritmo meta.Vote. As probabilidades de classificação (AGG, ALL) para cada instância foi determinada como a média dos 100 modelos.

O arquivo de probabilidade resultante tem o seguinte formato:

sendo que das probabilidade ALL foram tomadas 1-p.

Butland também fornece todos os dados experimentados. Contruí uma tabela contendo as probabilidade e o s-score para 95 mil pares. Nenhuma correlação foi observada.

scbut = read.csv("prob_but.csv")
plot(scbut$score ~ scbut$prob, ylab = "S-score", xlab = "Probability of being AGG")

plot of chunk unnamed-chunk-1

Correlation coefficient

cor(scbut$score, scbut$prob)
## [1] 0.006242