# -----------------------------
# FASE 1. Generar dataset simulado (abundancias por parcela)
# -----------------------------

etapas <- c("Pionera", "Intermedia", "Tardia", "Madura")  # Define 4 etapas sucesionales (categorías)

parcelas <- expand.grid(Etapa = etapas, Parcela = 1:3) %>%   # Crea combinaciones: 4 etapas x 3 parcelas
  as_tibble() %>%                              # Convierte a tibble
  mutate(ID = paste0(Etapa, "_P", Parcela))   # Crea un ID único por parcela (ej. Pionera_P1)

especies <- paste0("Sp", sprintf("%02d", 1:15))   # Crea nombres Sp01...Sp15 (15 especies)

dirichlet_probs <- function(alpha){       # Define función para generar probabilidades tipo Dirichlet
  w <- rgamma(length(alpha), shape = alpha, rate = 1) # Genera pesos positivos con distribución gamma
  w / sum(w)                            # Normaliza para que sumen 1 (probabilidades)
}                                                        # Fin de función

alpha_por_etapa <- list(                                                       # Lista con "alpha" por etapa (controla dominancia)
  Pionera     = c(6,6,5, 2,2, 1,1,1,1,1, 0.5,0.5,0.5,0.5,0.5),                  # Pionera: pocas especies dominan mucho
  Intermedia  = c(3,3,3, 3,3, 2,2,2,1.5,1.5, 1,1,1,1,1),                        # Intermedia: dominancia más equilibrada
  Tardia      = c(1.5,1.5,1.5, 2,2, 2.5,2.5,2.5,2,2, 2,1.8,1.8,1.6,1.6),        # Tardía: muchas especies con peso medio
  Madura      = c(1.2,1.2,1.2, 1.5,1.5, 1.8,1.8,1.8,1.8,1.8, 2,2,2,2,2)          # Madura: más equidad, varias especies importantes
)

simular_parcela <- function(etapa, total_ind = sample(90:150, 1)){             # Función que simula una parcela (conteos por especie)
  alpha <- alpha_por_etapa[[etapa]]                                            # Selecciona el alpha que corresponde a la etapa
  p <- dirichlet_probs(alpha)                                                  # Genera probabilidades para las 15 especies (suman 1)
  as.integer(rmultinom(1, size = total_ind, prob = p))                         # Genera conteos multinomiales (enteros) según p
}                                                                              # Fin de función

abund <- parcelas %>%                                                          # Toma la tabla parcelas (Etapa, Parcela, ID)
  rowwise() %>%                                                                # Indica que operaciones se harán fila por fila
  mutate(conteos = list(simular_parcela(Etapa))) %>%                           # Para cada fila, simula conteos de 15 especies
  unnest_wider(conteos, names_sep = "_") %>%                                   # Expande la lista a 15 columnas (conteos_1...conteos_15)
  rename_with(~ especies, starts_with("conteos_")) %>%                         # Renombra esas columnas a Sp01...Sp15
  ungroup()                                                                    # Quita el modo fila-por-fila

mat <- abund %>% select(all_of(especies)) %>% as.matrix()                       # Extrae solo especies y las convierte a matriz
rownames(mat) <- abund$ID                                                      # Pone como nombres de fila los ID de parcelas
mat
##               Sp01 Sp02 Sp03 Sp04 Sp05 Sp06 Sp07 Sp08 Sp09 Sp10 Sp11 Sp12 Sp13
## Pionera_P1      22   20   16    5   11    0    9   15    3    5    3    0    1
## Intermedia_P1   17   10   12   13    3    8   16    5    3    9   18    1    1
## Tardia_P1        0   12    2   13   17   13    5   10    2   13   29    1    6
## Madura_P1        8    0    2   15    0   17    1    3    9   10   19   10   11
## Pionera_P2      15   36   34    0    4    5    2    3    1    0    0    7    0
## Intermedia_P2    7    8   10   12   11    2    5    3   12   18    4    2    0
## Tardia_P2        7   10    8    9    6   11    2    4    8   10    4    7    2
## Madura_P2        2    4    3   12    4   12    3   19    3   10   17    9    2
## Pionera_P3      14   60   16    8    1    2    3    4    2    5    7    3    0
## Intermedia_P3    9    6   19   10   17    1    3    1    8   11    7    0   12
## Tardia_P3        7   14    8    7    3    6    7   14   11   15    1   11    6
## Madura_P3       13    1   12    2    6    6    0   11   21    4   23   12   11
##               Sp14 Sp15
## Pionera_P1       2    0
## Intermedia_P1    1    4
## Tardia_P1        7   12
## Madura_P1        9    4
## Pionera_P2       3    0
## Intermedia_P2    3    0
## Tardia_P2        3   11
## Madura_P2        7    1
## Pionera_P3       2    0
## Intermedia_P3    9   10
## Tardia_P3       17    0
## Madura_P3        1    5
# -----------------------------
# FASE 2. Tema 2: Diversidad alfa (por parcela)
# -----------------------------

riqueza  <- vegan::specnumber(mat)                                             # Calcula riqueza S (número de especies con abundancia > 0)
shannon  <- vegan::diversity(mat, index = "shannon")                           # Calcula índice de Shannon H'
simpson  <- vegan::diversity(mat, index = "simpson")                           # Calcula índice de Simpson (diversidad)
pielou   <- shannon / log(pmax(riqueza, 1))                                    # Calcula equitatividad de Pielou (H'/ln(S))

res_alfa <- abund %>%                                                          # Parte del dataset con abundancias
  select(ID, Etapa, Parcela) %>%                                               # Se queda con variables de identificación
  mutate(Riqueza = riqueza,                                                    # Agrega riqueza por parcela
         Shannon = shannon,                                                    # Agrega Shannon por parcela
         Simpson = simpson,                                                    # Agrega Simpson por parcela
         Pielou  = pielou)                                                     # Agrega Pielou por parcela

print(res_alfa)                                                                # Imprime tabla de diversidad alfa por parcela
## # A tibble: 12 × 7
##    ID            Etapa      Parcela Riqueza Shannon Simpson Pielou
##    <chr>         <fct>        <int>   <int>   <dbl>   <dbl>  <dbl>
##  1 Pionera_P1    Pionera          1      12    2.19   0.869  0.882
##  2 Intermedia_P1 Intermedia       1      15    2.42   0.898  0.894
##  3 Tardia_P1     Tardia           1      14    2.39   0.894  0.907
##  4 Madura_P1     Madura           1      13    2.37   0.896  0.923
##  5 Pionera_P2    Pionera          2      10    1.75   0.769  0.759
##  6 Intermedia_P2 Intermedia       2      13    2.37   0.892  0.922
##  7 Tardia_P2     Tardia           2      15    2.60   0.920  0.958
##  8 Madura_P2     Madura           2      15    2.42   0.894  0.895
##  9 Pionera_P3    Pionera          3      13    1.84   0.737  0.717
## 10 Intermedia_P3 Intermedia       3      14    2.45   0.905  0.929
## 11 Tardia_P3     Tardia           3      14    2.50   0.911  0.947
## 12 Madura_P3     Madura           3      14    2.37   0.891  0.896
res_etapa <- res_alfa %>%                                                      # Usa resultados por parcela
  group_by(Etapa) %>%                                                          # Agrupa por etapa sucesional
  summarise(                                                                   # Resume con promedios y desviaciones estándar
    Riqueza_prom = mean(Riqueza), Riqueza_sd = sd(Riqueza),                    # Media y sd de riqueza
    Shannon_prom = mean(Shannon), Shannon_sd = sd(Shannon),                    # Media y sd de Shannon
    Simpson_prom = mean(Simpson), Simpson_sd = sd(Simpson),                    # Media y sd de Simpson
    Pielou_prom  = mean(Pielou),  Pielou_sd  = sd(Pielou),                     # Media y sd de Pielou
    .groups = "drop"                                                           # Quita agrupamiento para devolver tibble normal
  )

print(res_etapa)                                                               # Imprime tabla resumen por etapa
## # A tibble: 4 × 9
##   Etapa  Riqueza_prom Riqueza_sd Shannon_prom Shannon_sd Simpson_prom Simpson_sd
##   <fct>         <dbl>      <dbl>        <dbl>      <dbl>        <dbl>      <dbl>
## 1 Pione…         11.7      1.53          1.93     0.233         0.792    0.0688 
## 2 Inter…         14        1             2.41     0.0441        0.899    0.00634
## 3 Tardia         14.3      0.577         2.50     0.101         0.908    0.0133 
## 4 Madura         14        1             2.39     0.0330        0.894    0.00246
## # ℹ 2 more variables: Pielou_prom <dbl>, Pielou_sd <dbl>
ggplot(res_alfa, aes(x = Etapa, y = Shannon)) +                                # Inicia gráfico: etapa vs Shannon
  geom_boxplot() +                                                             # Dibuja caja y bigotes (distribución)
  geom_jitter(width = 0.12) +                                                  # Pone puntos con leve dispersión horizontal
  theme_minimal() +                                                            # Estilo simple del gráfico
  labs(title = "Diversidad (Shannon) por etapa de sucesión")                   # Título del gráfico

# 4. FASE 3 - Diversidad beta y NMDS

cat("\n==============================\n")
## 
## ==============================
cat("FASE 3: Diversidad beta (Bray-Curtis) y NMDS\n")
## FASE 3: Diversidad beta (Bray-Curtis) y NMDS
cat("==============================\n")
## ==============================
d_bray <- vegan::vegdist(mat, method = "bray")
nmds <- vegan::metaMDS(mat, distance = "bray", k = 2, trymax = 100)
## Square root transformation
## Wisconsin double standardization
## Run 0 stress 0.1110267 
## Run 1 stress 0.1216775 
## Run 2 stress 0.1302216 
## Run 3 stress 0.1110267 
## ... Procrustes: rmse 2.320007e-05  max resid 4.086374e-05 
## ... Similar to previous best
## Run 4 stress 0.3473068 
## Run 5 stress 0.1580368 
## Run 6 stress 0.1302216 
## Run 7 stress 0.1110267 
## ... Procrustes: rmse 2.272178e-05  max resid 3.76444e-05 
## ... Similar to previous best
## Run 8 stress 0.1302216 
## Run 9 stress 0.1110267 
## ... Procrustes: rmse 4.206489e-06  max resid 5.910237e-06 
## ... Similar to previous best
## Run 10 stress 0.1647716 
## Run 11 stress 0.1216775 
## Run 12 stress 0.1110267 
## ... New best solution
## ... Procrustes: rmse 1.056466e-05  max resid 1.912037e-05 
## ... Similar to previous best
## Run 13 stress 0.1216774 
## Run 14 stress 0.1216775 
## Run 15 stress 0.1216774 
## Run 16 stress 0.1251063 
## Run 17 stress 0.1251062 
## Run 18 stress 0.1251064 
## Run 19 stress 0.1110267 
## ... Procrustes: rmse 1.008663e-05  max resid 1.593712e-05 
## ... Similar to previous best
## Run 20 stress 0.1302216 
## *** Best solution repeated 2 times
cat("OK: NMDS ejecutado. Stress = ", round(nmds$stress, 3), "\n", sep = "")
## OK: NMDS ejecutado. Stress = 0.111
# Importante: usar SOLO "sites" para evitar el error de filas (parcelas vs especies)
scores_nmds <- as.data.frame(vegan::scores(nmds, display = "sites")) %>%
  tibble::rownames_to_column("ID") %>%
  left_join(res_alfa %>% select(ID, Etapa), by = "ID")

ggplot(scores_nmds, aes(x = NMDS1, y = NMDS2, shape = Etapa)) +
  geom_point(size = 3) +
  theme_minimal() +
  labs(title = paste0("NMDS (Bray-Curtis) - stress = ", round(nmds$stress, 3)))

gamma_n <- sum(colSums(mat) > 0)
cat("OK: Diversidad gamma (especies presentes): ", gamma_n, "\n", sep = "")
## OK: Diversidad gamma (especies presentes): 15
cat("\nResumen FASE 3:\n")
## 
## Resumen FASE 3:
cat("- Se calculo disimilitud Bray-Curtis.\n")
## - Se calculo disimilitud Bray-Curtis.
cat("- Se ejecuto NMDS 2D y se graficaron coordenadas de parcelas (sites).\n")
## - Se ejecuto NMDS 2D y se graficaron coordenadas de parcelas (sites).
cat("- Se calculo diversidad gamma.\n")
## - Se calculo diversidad gamma.
cat("Comandos clave: vegan::vegdist(), vegan::metaMDS(), vegan::scores(display='sites'), colSums().\n")
## Comandos clave: vegan::vegdist(), vegan::metaMDS(), vegan::scores(display='sites'), colSums().