ps: Intepretações no final de cada análise
Contexto:
Uma ilha recém descoberta batizada de Atlântida, localizada no meio do Atlântico Norte, teve sua flora árborea amostrada por dois grupos diferentes de pesquisadores. Cada grupo amostrou a ilha a partir de um método distinto: O grupo do laboratório Quentin, utilizou um método de amostragem por quadrantes; O grupo do laboratório Tarantin utilizou transectos para amostrar a população de árvores da ilha.
Ao trocarem informações os grupos perceberam variações em seus dados e resolveram comparar qual seria o melhor método de amostragem com base em estimadores de diversidade biológica e índices de diversidade.
Abaixo estão as duas matrizes representando a amostragem feita pelas duas equipes:
Amostragem do grupo Quentin:
kable(base_q) %>%
kable_styling(full_width = FALSE, bootstrap_options = c("stripped", "hover", "responsive"), position = "center")
| q1 | q2 | q3 | q4 | q5 | q6 | q7 | q8 | q9 | q10 | |
|---|---|---|---|---|---|---|---|---|---|---|
| arroz_c | 0 | 1 | 7 | 6 | 1 | 4 | 4 | 1 | 1 | 5 |
| arroz_e | 1 | 0 | 0 | 1 | 0 | 0 | 8 | 4 | 0 | 3 |
| milho | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| ervilha | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
| feijao_preto | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| carioca_c | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
| carioca_e | 0 | 0 | 0 | 2 | 2 | 0 | 0 | 0 | 0 | 8 |
| mac_paraf | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| mac_tubo | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| mac_espag | 0 | 0 | 0 | 3 | 1 | 0 | 0 | 0 | 6 | 4 |
Amostragem do grupo Taratin:
kable(base_t) %>%
kable_styling(full_width = FALSE, bootstrap_options = c("stripped", "hover", "responsive"), position = "center")
| t1 | t2 | t3 | t4 | t5 | t6 | t7 | t8 | t9 | t10 | |
|---|---|---|---|---|---|---|---|---|---|---|
| arroz_c | 3 | 8 | 5 | 6 | 3 | 0 | 0 | 0 | 0 | 3 |
| arroz_e | 0 | 1 | 8 | 1 | 1 | 0 | 0 | 0 | 1 | 0 |
| milho | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| ervilha | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| feijao_preto | 0 | 0 | 6 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| carioca_c | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 1 |
| carioca_e | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| mac_paraf | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
| mac_tubo | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| mac_espag | 16 | 9 | 0 | 0 | 0 | 0 | 2 | 2 | 1 | 0 |
Para estimar a riqueza amostrada pelos dois métodos utilizou-se Chao1, com base na abundância de espécies -
Chao1 para o grupo Quentin:
est_chao1_q <- estaccumR(base_q, permutations = 100)
summary(est_chao1_q, display = "chao")
## $chao
## N Chao 2.5% 97.5% Std.Dev
## feijao_preto 1 3.940000 0.000 15.000 4.702933
## carioca_e 2 6.448333 0.000 15.000 5.082247
## arroz_e 3 8.133333 1.425 16.000 4.850978
## mac_espag 4 8.940000 3.000 16.000 4.303870
## arroz_c 5 9.656667 5.000 16.000 3.595875
## ervilha 6 9.743333 5.000 15.525 2.667026
## milho 7 10.275000 6.475 15.525 2.214934
## mac_paraf 8 10.615000 8.000 13.000 1.540456
## mac_tubo 9 10.610000 8.000 13.000 1.088461
## carioca_c 10 11.000000 11.000 11.000 0.000000
##
## attr(,"class")
## [1] "summary.poolaccum"
resultados <- summary(est_chao1_q, display = c("S", "chao"))
res_chao1_q <- cbind(resultados$chao[, 1:4], resultados$S[, 2:4])
res_chao1_q <- as.data.frame(res_chao1_q)
colnames(res_chao1_q) <- c("Amostras", "Chao", "C_inferior", "C_superior",
"Riqueza", "R_inferior", "R_superior")
ggplot(res_chao1_q, aes(y = Riqueza, x = Amostras)) +
geom_point(aes(y = Chao, x = Amostras + 0.1), size = 4,
color = "darkred", alpha = 0.7) +
geom_point(aes(y = Riqueza, x = Amostras), size = 4,
color = "lightgreen", alpha = 0.7) +
geom_point(y = 3.5, x = 7, size = 4, color = "darkred", alpha = 0.7) +
geom_point(y = 1.5, x = 7, size = 4, color = "lightgreen", alpha = 0.7) +
geom_label(y = 3.5, x = 10.7, label = "Riqueza estimada - Chao 1 - Quentin") +
geom_label(y = 1.5, x = 10, label = "Riqueza observada - Quentin") +
geom_line(aes(y = Chao, x = Amostras), color = "darkred") +
geom_line(aes(y = Riqueza, x = Amostras), color = "lightgreen") +
geom_linerange(aes(ymin = C_inferior, ymax = C_superior,
x = Amostras + 0.1), color = "darkred") +
geom_linerange(aes(ymin = R_inferior, ymax = R_superior,
x = Amostras), color = "lightgreen") +
scale_x_continuous(limits = c(1, 15), breaks = seq(1, 15, 1)) +
labs (x = "Número de amostras", y = "Riqueza estimada - Chao 1 - Quentin") +
tema_livro()
Chao1 para o grupo Tarantin:
est_chao1_t <- estaccumR(base_t, permutations = 100)
summary(est_chao1_t, display = "chao")
## $chao
## N Chao 2.5% 97.5% Std.Dev
## mac_paraf 1 2.710000 0.000000 11.0000 3.4239059
## arroz_c 2 4.238333 0.000000 13.6250 3.8113853
## ervilha 3 6.573333 1.000000 16.0000 3.8839846
## milho 4 7.727667 2.000000 16.0000 3.3824398
## carioca_e 5 8.755833 3.000000 16.0000 3.0439600
## arroz_e 6 9.374333 4.500000 15.7625 2.5713722
## feijao_preto 7 9.739500 6.475000 15.5000 1.8806022
## mac_tubo 8 9.820500 8.158333 10.7500 1.1068906
## mac_espag 9 9.937500 9.000000 10.7500 0.4269563
## carioca_c 10 10.000000 10.000000 10.0000 0.0000000
##
## attr(,"class")
## [1] "summary.poolaccum"
resultados <- summary(est_chao1_t, display = c("S", "chao"))
res_chao1_t <- cbind(resultados$chao[, 1:4], resultados$S[, 2:4])
res_chao1_t <- as.data.frame(res_chao1_t)
colnames(res_chao1_t) <- c("Amostras", "Chao", "C_inferior", "C_superior",
"Riqueza", "R_inferior", "R_superior")
ggplot(res_chao1_t, aes(y = Riqueza, x = Amostras)) +
geom_point(aes(y = Chao, x = Amostras + 0.1), size = 4,
color = "red", alpha = 0.7) +
geom_point(aes(y = Riqueza, x = Amostras), size = 4,
color = "blue", alpha = 0.7) +
geom_point(y = 3.5, x = 7, size = 4, color = "red", alpha = 0.7) +
geom_point(y = 1.5, x = 7, size = 4, color = "blue", alpha = 0.7) +
geom_label(y = 3.5, x = 10.7, label = "Riqueza estimada - Chao 1 - Tarantin") +
geom_label(y = 1.5, x = 10, label = "Riqueza observada - Tarantin") +
geom_line(aes(y = Chao, x = Amostras), color = "red") +
geom_line(aes(y = Riqueza, x = Amostras), color = "blue") +
geom_linerange(aes(ymin = C_inferior, ymax = C_superior,
x = Amostras + 0.1), color = "red") +
geom_linerange(aes(ymin = R_inferior, ymax = R_superior,
x = Amostras), color = "blue") +
scale_x_continuous(limits = c(1, 15), breaks = seq(1, 15, 1)) +
labs (x = "Número de amostras", y = "Riqueza estimada - Chao 1 - Tarantin") +
tema_livro()
Interpretação:
Com base nas curvas que representam a riqueza amostrada por cada
método, é
possível concluir que o método dos quadrantes, utilizado pelo grupo
Quentin,
foi mais eficiente com o esforço amostral implementado, de modo que a
sua
curva, ainda que levemente, ainda aponta para cima. Em contrapartida, a
curva
das espécies observadas pelo grupo Tarantin parece
ter atingido uma assíntota.
Além disso, as estimativas de riqueza, com base em Chao1, indicam que
o grupo
Quentin poderia amostrar mais de 10 espécies com apenas 6 amostras,
enquanto
que a estimativa para o grupo Tarantin, que usou o método de amostragem
por
transectos, não ultrapassa 10 espécies em momento algum.
Portanto, tanto a curva do coletor, quanto o estimador utilizado
indicam que o
grupo Quentin apresentou o melhor método de amostragem para as
espécies
vegetais árboreas da ilha de Atlântida.
Número de espécies por unidade amostral, grupo Quentin:
specnumber(t(base_q))
## q1 q2 q3 q4 q5 q6 q7 q8 q9 q10
## 1 1 3 5 3 1 3 2 2 4
Número de espécies por unidade amostral, grupo Tarantin:
specnumber(t(base_t))
## t1 t2 t3 t4 t5 t6 t7 t8 t9 t10
## 2 3 4 2 2 1 2 1 2 2
Número de indivíduos:
Total de indíviduos por espécie coletada pelo grupo Quentin:
rowSums(base_q)
## arroz_c arroz_e milho ervilha feijao_preto carioca_c
## 30 17 0 2 0 2
## carioca_e mac_paraf mac_tubo mac_espag
## 12 0 0 14
Total de indíviduos por espécie coletada pelo grupo Tarantin:
rowSums(base_t)
## arroz_c arroz_e milho ervilha feijao_preto carioca_c
## 28 12 0 1 6 3
## carioca_e mac_paraf mac_tubo mac_espag
## 0 1 0 30
Total de indivíduos coletados por unidade amostral:
Grupo Quentin:
colSums(base_q)
## q1 q2 q3 q4 q5 q6 q7 q8 q9 q10
## 1 1 9 13 4 4 13 5 7 20
Grupo Taratin:
colSums(base_t)
## t1 t2 t3 t4 t5 t6 t7 t8 t9 t10
## 19 18 20 7 4 2 3 2 2 4
Índices de Diversidade:
Shannon:
Grupo Quentin:
diversity(colSums(base_q), index = "shannon")
## [1] 2.017347
Grupo Taratin:
diversity(colSums(base_t), index = "shannon")
## [1] 1.92467
Simpson:
Grupo Quentin:
diversity(colSums(base_q), index = "simpson")
## [1] 0.8436499
Grupo Taratin:
diversity(colSums(base_t), index = "simpson")
## [1] 0.8190825
Interpretação:
O grupos Quentin e Tarantin amostraram 2,5 e 2,1 espécies por
unidade amostral em média, respectivamente.
O grupo Taratin amostrou mais indíviduos, 81 contra 77 e, além
disso, foi capaz de amostrar 7 espécies distintas, uma a mais
que o grupo Quentin.
Entretanto, os índices de diversidade mais tradicionais,
utilizados na comparação (e.g. Shannon e Simpson), indicaram
uma maior diversidade obtida pelo grupo Quentin, apesar
de seu número de espécies e indivíduos ter sido menor do que
aquele observado no grupo Tarantin.
datahillq <- t(base_q)
datahiilt <- t(base_t)
hill_res_q_0 <- hill_taxa(datahillq, q = 0)
hill_res_q_1 <- hill_taxa(datahillq, q = 1)
hill_res_q_2 <- hill_taxa(datahillq, q = 2)
hill_res_t_0 <- hill_taxa(datahiilt, q = 0)
hill_res_t_1 <- hill_taxa(datahiilt, q = 1)
hill_res_t_2 <- hill_taxa(datahiilt, q = 2)
Data frame contendo o resultado dos números de Hill nas ordens 0, 1 e 2, para ambos os grupos de pesquisadores.
qq=0 (diversidade na ordem 0 para o grupo Quentin);
qt=0 (diversidade na ordem 0 para o grupo Tarantin);
qq=1 (diversidade na ordem 1 para o grupo Quentin);
qt=1 (diversidade na ordem 1 para o grupo Tarantin);
qq=2 (diversidade na ordem 2 para o grupo Quentin);
qt=2 (diversidade na ordem 2 para o grupo Tarantin)
res_hill <- data.frame (hill_res_q_0, hill_res_t_0, hill_res_q_1, hill_res_t_1, hill_res_q_2, hill_res_t_2)
colnames(res_hill) <- c("qq=0", "tq=0", "qq=1", "tq=1", "qq=2","tq=2")
rownames(res_hill) <- c("1", "2", "3", "4", "5", "6", "7", "8", "9", "10")
res_hill <- round(res_hill,2)
kable(res_hill) %>%
kable_styling(full_width = FALSE, bootstrap_options = c("stripped", "hover", "responsive"), position = "center")
| qq=0 | tq=0 | qq=1 | tq=1 | qq=2 | tq=2 |
|---|---|---|---|---|---|
| 1 | 2 | 1.00 | 1.55 | 1.00 | 1.36 |
| 1 | 3 | 1.00 | 2.38 | 1.00 | 2.22 |
| 3 | 4 | 1.98 | 3.40 | 1.59 | 3.17 |
| 5 | 2 | 3.97 | 1.51 | 3.31 | 1.32 |
| 3 | 2 | 2.83 | 1.75 | 2.67 | 1.60 |
| 1 | 1 | 1.00 | 1.00 | 1.00 | 1.00 |
| 3 | 2 | 2.36 | 1.89 | 2.09 | 1.80 |
| 2 | 1 | 1.65 | 1.00 | 1.47 | 1.00 |
| 2 | 2 | 1.51 | 2.00 | 1.32 | 2.00 |
| 4 | 2 | 3.74 | 1.75 | 3.51 | 1.60 |
Média dos números de Hill nas ordens 0, 1 e 2 para cada um dos grupos:
hillq_0 <- mean(hill_res_q_0)
hillt_0 <- mean(hill_res_t_0)
hillq_1 <- mean(hill_res_q_1)
hillt_1 <- mean(hill_res_t_1)
hillq_2 <- mean(hill_res_q_2)
hillt_2 <- mean(hill_res_t_2)
Data frame com as médias dos números de Hill nas ordens o, 1 e 2 para cada um dos grupos:
res_hillm <- data.frame (hillq_0, hillt_0, hillq_1, hillt_1, hillq_2, hillt_2)
colnames(res_hillm) <- c("qq=0", "tq=0", "qq=1", "tq=1", "qq=2","tq=2")
kable(res_hillm) %>%
kable_styling(full_width = FALSE, bootstrap_options = c("stripped", "hover", "responsive"), position = "center")
| qq=0 | tq=0 | qq=1 | tq=1 | qq=2 | tq=2 |
|---|---|---|---|---|---|
| 2.5 | 2.1 | 2.103423 | 1.823526 | 1.895873 | 1.708037 |
Interpretação:
A diversidade verdadeira, obtida através dos números de Hill
vão na mesma linha dos índices de diversidade tradicional;
em todas as ordens a média da diversidade é maior na coleta
realizada pelo grupo Quentin, que utilizou o método dos quadrantes.
Isso significa que tanto o índice riqueza absoluta, quanto
aqueles que favorecem espécies comuns e espécies dominantes
apontam para uma maior diversidade amostrada pelo método dos
quadrantes.
Dessa forma, conclui-se que o método dos quadrantes, utilizado
pelo grupo de pesquisadores Quentin, de fato, parece ser o melhor
para a amostragem de plantas arbóreas na ilha de Atlântida.