# -----------------------------
# FASE 1. Generar dataset simulado (abundancias por parcela)
# -----------------------------

etapas <- c("Pionera", "Intermedia", "Tardia", "Madura")  # Define 4 etapas sucesionales (categorías)

parcelas <- expand.grid(Etapa = etapas, Parcela = 1:3) %>%   # Crea combinaciones: 4 etapas x 3 parcelas
  as_tibble() %>%                              # Convierte a tibble
  mutate(ID = paste0(Etapa, "_P", Parcela))   # Crea un ID único por parcela (ej. Pionera_P1)

especies <- paste0("Sp", sprintf("%02d", 1:15))   # Crea nombres Sp01...Sp15 (15 especies)

dirichlet_probs <- function(alpha){       # Define función para generar probabilidades tipo Dirichlet
  w <- rgamma(length(alpha), shape = alpha, rate = 1) # Genera pesos positivos con distribución gamma
  w / sum(w)                            # Normaliza para que sumen 1 (probabilidades)
}                                                        # Fin de función

alpha_por_etapa <- list(                                                       # Lista con "alpha" por etapa (controla dominancia)
  Pionera     = c(6,6,5, 2,2, 1,1,1,1,1, 0.5,0.5,0.5,0.5,0.5),                  # Pionera: pocas especies dominan mucho
  Intermedia  = c(3,3,3, 3,3, 2,2,2,1.5,1.5, 1,1,1,1,1),                        # Intermedia: dominancia más equilibrada
  Tardia      = c(1.5,1.5,1.5, 2,2, 2.5,2.5,2.5,2,2, 2,1.8,1.8,1.6,1.6),        # Tardía: muchas especies con peso medio
  Madura      = c(1.2,1.2,1.2, 1.5,1.5, 1.8,1.8,1.8,1.8,1.8, 2,2,2,2,2)          # Madura: más equidad, varias especies importantes
)

simular_parcela <- function(etapa, total_ind = sample(90:150, 1)){             # Función que simula una parcela (conteos por especie)
  alpha <- alpha_por_etapa[[etapa]]                                            # Selecciona el alpha que corresponde a la etapa
  p <- dirichlet_probs(alpha)                                                  # Genera probabilidades para las 15 especies (suman 1)
  as.integer(rmultinom(1, size = total_ind, prob = p))                         # Genera conteos multinomiales (enteros) según p
}                                                                              # Fin de función

abund <- parcelas %>%                                                          # Toma la tabla parcelas (Etapa, Parcela, ID)
  rowwise() %>%                                                                # Indica que operaciones se harán fila por fila
  mutate(conteos = list(simular_parcela(Etapa))) %>%                           # Para cada fila, simula conteos de 15 especies
  unnest_wider(conteos, names_sep = "_") %>%                                   # Expande la lista a 15 columnas (conteos_1...conteos_15)
  rename_with(~ especies, starts_with("conteos_")) %>%                         # Renombra esas columnas a Sp01...Sp15
  ungroup()                                                                    # Quita el modo fila-por-fila

mat <- abund %>% select(all_of(especies)) %>% as.matrix()                       # Extrae solo especies y las convierte a matriz
rownames(mat) <- abund$ID                                                      # Pone como nombres de fila los ID de parcelas
mat
##               Sp01 Sp02 Sp03 Sp04 Sp05 Sp06 Sp07 Sp08 Sp09 Sp10 Sp11 Sp12 Sp13
## Pionera_P1      16   40    3    4   17    2   14   18    2    3    0    1    1
## Intermedia_P1    6    5    9   11   20   10   11   11    5    2    3    1    6
## Tardia_P1       10    0    2   12   10    6   35    2    9    8    7   11   26
## Madura_P1        4    5    1    8   13   14    4    7    3    7    5   19    4
## Pionera_P2      10   23   20   13    7    4    5    2    0    3    1    0    4
## Intermedia_P2   17    4   28   19   16    4    2   16    5    2    6    1    0
## Tardia_P2        1    2    7    6    4    3   11    8   14    1   14    5    0
## Madura_P2        3    5    5    8    1   19    6   25    4    6    3    1   11
## Pionera_P3      31   38   26    3    2    4    1    0    2    4    0    3    7
## Intermedia_P3   13   21   14   15   10   11    7    0    3    4    3    4    3
## Tardia_P3       12    0    4    7    8   16    5    4    7    3   16    0    1
## Madura_P3        6    4    0    2    4   32    3    5   10    2    4    6   24
##               Sp14 Sp15
## Pionera_P1       0    0
## Intermedia_P1    0    2
## Tardia_P1        4    1
## Madura_P1       26    9
## Pionera_P2       1    3
## Intermedia_P2   13    1
## Tardia_P2        2   14
## Madura_P2        7    5
## Pionera_P3       2    2
## Intermedia_P3    3    3
## Tardia_P3        6    2
## Madura_P3        8    8
# FASE 2. Tema 2: Diversidad alfa (por parcela)
# -----------------------------

riqueza  <- vegan::specnumber(mat)                                             # Calcula riqueza S (número de especies con abundancia > 0)
shannon  <- vegan::diversity(mat, index = "shannon")                           # Calcula índice de Shannon H'
simpson  <- vegan::diversity(mat, index = "simpson")                           # Calcula índice de Simpson (diversidad)
pielou   <- shannon / log(pmax(riqueza, 1))                                    # Calcula equitatividad de Pielou (H'/ln(S))

res_alfa <- abund %>%                                                          # Parte del dataset con abundancias
  select(ID, Etapa, Parcela) %>%                                               # Se queda con variables de identificación
  mutate(Riqueza = riqueza,                                                    # Agrega riqueza por parcela
         Shannon = shannon,                                                    # Agrega Shannon por parcela
         Simpson = simpson,                                                    # Agrega Simpson por parcela
         Pielou  = pielou)                                                     # Agrega Pielou por parcela

print(res_alfa)                                                                # Imprime tabla de diversidad alfa por parcela
## # A tibble: 12 × 7
##    ID            Etapa      Parcela Riqueza Shannon Simpson Pielou
##    <chr>         <fct>        <int>   <int>   <dbl>   <dbl>  <dbl>
##  1 Pionera_P1    Pionera          1      12    1.95   0.815  0.786
##  2 Intermedia_P1 Intermedia       1      14    2.41   0.896  0.915
##  3 Tardia_P1     Tardia           1      14    2.30   0.872  0.872
##  4 Madura_P1     Madura           1      15    2.45   0.895  0.905
##  5 Pionera_P2    Pionera          2      13    2.18   0.856  0.849
##  6 Intermedia_P2 Intermedia       2      14    2.27   0.876  0.860
##  7 Tardia_P2     Tardia           2      14    2.37   0.892  0.898
##  8 Madura_P2     Madura           2      15    2.39   0.882  0.883
##  9 Pionera_P3    Pionera          3      13    1.90   0.795  0.740
## 10 Intermedia_P3 Intermedia       3      14    2.41   0.894  0.912
## 11 Tardia_P3     Tardia           3      13    2.35   0.888  0.915
## 12 Madura_P3     Madura           3      14    2.26   0.857  0.858
res_etapa <- res_alfa %>%                                                      # Usa resultados por parcela
  group_by(Etapa) %>%                                                          # Agrupa por etapa sucesional
  summarise(                                                                   # Resume con promedios y desviaciones estándar
    Riqueza_prom = mean(Riqueza), Riqueza_sd = sd(Riqueza),                    # Media y sd de riqueza
    Shannon_prom = mean(Shannon), Shannon_sd = sd(Shannon),                    # Media y sd de Shannon
    Simpson_prom = mean(Simpson), Simpson_sd = sd(Simpson),                    # Media y sd de Simpson
    Pielou_prom  = mean(Pielou),  Pielou_sd  = sd(Pielou),                     # Media y sd de Pielou
    .groups = "drop"                                                           # Quita agrupamiento para devolver tibble normal
  )

print(res_etapa)                                                               # Imprime tabla resumen por etapa
## # A tibble: 4 × 9
##   Etapa  Riqueza_prom Riqueza_sd Shannon_prom Shannon_sd Simpson_prom Simpson_sd
##   <fct>         <dbl>      <dbl>        <dbl>      <dbl>        <dbl>      <dbl>
## 1 Pione…         12.7      0.577         2.01     0.148         0.822     0.0309
## 2 Inter…         14        0             2.36     0.0815        0.889     0.0107
## 3 Tardia         13.7      0.577         2.34     0.0349        0.884     0.0106
## 4 Madura         14.7      0.577         2.37     0.0955        0.878     0.0191
## # ℹ 2 more variables: Pielou_prom <dbl>, Pielou_sd <dbl>
ggplot(res_alfa, aes(x = Etapa, y = Shannon)) +                                # Inicia gráfico: etapa vs Shannon
  geom_boxplot() +                                                             # Dibuja caja y bigotes (distribución)
  geom_jitter(width = 0.12) +                                                  # Pone puntos con leve dispersión horizontal
  theme_minimal() +                                                            # Estilo simple del gráfico
  labs(title = "Diversidad (Shannon) por etapa de sucesión")                   # Título del gráfico