公式
广义的 UniFrac 距离,定义如下
\[d^{(α)} = \frac{∑_{i=1}^m b_i (p^A_{i} + p^B_{i})^α |p^A_{i} - p^B_{i}|/(p^A_{i} + p^B_{i})}{ ∑_{i=1}^m b_i (p^A_{i} + p^B_{i})^α}\]
这里,
\(m\) 代表树枝的数量, \(b_i\) 代表第 \(i\) 树枝的长度 , \(p^A_{i}\), \(p^B_{i}\) 代表 \(i\) 枝上群落A及群落B的比例.
广义的 UniFrac 距离包含一个额外的参数 \(α\) 来控制权重以消除丰度过高的物种对于计算的影响
α=0.5 使用最为广泛.
R包
- Weighted UniFrac(定量)
- Unweighted UniFrac(定性)
- Variance adjusted weighted UniFrac(方差矫正)
Qiime
- unifrac_G:考虑独有的样本,非对称的
- unifrac_G_full_tree: 从整体考虑独有的样本,非对称的
- unweighted_unifrac:每条枝指向的叶节点中来自两个群落的比例,给每条枝加权重
- unweighted_unifrac_full_tree: 从整体考虑unweighted_unifrac
- weighted_normalized_unifrac:加权UniFrac标准化,对于不同的根到端的距离标准化
- weighted_unifrac:加权UniFrac