# -----------------------------
# FASE 1. Generar dataset simulado (abundancias por parcela)
# -----------------------------

etapas <- c("Pionera", "Intermedia", "Tardia", "Madura")  # Define 4 etapas sucesionales (categorías)

parcelas <- expand.grid(Etapa = etapas, Parcela = 1:3) %>%   # Crea combinaciones: 4 etapas x 3 parcelas
  as_tibble() %>%                              # Convierte a tibble
  mutate(ID = paste0(Etapa, "_P", Parcela))   # Crea un ID único por parcela (ej. Pionera_P1)

especies <- paste0("Sp", sprintf("%02d", 1:15))   # Crea nombres Sp01...Sp15 (15 especies)

dirichlet_probs <- function(alpha){       # Define función para generar probabilidades tipo Dirichlet
  w <- rgamma(length(alpha), shape = alpha, rate = 1) # Genera pesos positivos con distribución gamma
  w / sum(w)                            # Normaliza para que sumen 1 (probabilidades)
}                                                        # Fin de función

alpha_por_etapa <- list(                                                       # Lista con "alpha" por etapa (controla dominancia)
  Pionera     = c(6,6,5, 2,2, 1,1,1,1,1, 0.5,0.5,0.5,0.5,0.5),                  # Pionera: pocas especies dominan mucho
  Intermedia  = c(3,3,3, 3,3, 2,2,2,1.5,1.5, 1,1,1,1,1),                        # Intermedia: dominancia más equilibrada
  Tardia      = c(1.5,1.5,1.5, 2,2, 2.5,2.5,2.5,2,2, 2,1.8,1.8,1.6,1.6),        # Tardía: muchas especies con peso medio
  Madura      = c(1.2,1.2,1.2, 1.5,1.5, 1.8,1.8,1.8,1.8,1.8, 2,2,2,2,2)          # Madura: más equidad, varias especies importantes
)

simular_parcela <- function(etapa, total_ind = sample(90:150, 1)){             # Función que simula una parcela (conteos por especie)
  alpha <- alpha_por_etapa[[etapa]]                                            # Selecciona el alpha que corresponde a la etapa
  p <- dirichlet_probs(alpha)                                                  # Genera probabilidades para las 15 especies (suman 1)
  as.integer(rmultinom(1, size = total_ind, prob = p))                         # Genera conteos multinomiales (enteros) según p
}                                                                              # Fin de función

abund <- parcelas %>%                                                          # Toma la tabla parcelas (Etapa, Parcela, ID)
  rowwise() %>%                                                                # Indica que operaciones se harán fila por fila
  mutate(conteos = list(simular_parcela(Etapa))) %>%                           # Para cada fila, simula conteos de 15 especies
  unnest_wider(conteos, names_sep = "_") %>%                                   # Expande la lista a 15 columnas (conteos_1...conteos_15)
  rename_with(~ especies, starts_with("conteos_")) %>%                         # Renombra esas columnas a Sp01...Sp15
  ungroup()                                                                    # Quita el modo fila-por-fila

mat <- abund %>% select(all_of(especies)) %>% as.matrix()                       # Extrae solo especies y las convierte a matriz
rownames(mat) <- abund$ID                                                      # Pone como nombres de fila los ID de parcelas
mat
##               Sp01 Sp02 Sp03 Sp04 Sp05 Sp06 Sp07 Sp08 Sp09 Sp10 Sp11 Sp12 Sp13
## Pionera_P1      21   22   10    9    1   10    2    3    4    1    7    0    0
## Intermedia_P1   25    8    5   19    6   11    8    1    4    5    0   10    1
## Tardia_P1       10    7    1   11   21   27   11    3    8    8    9    2    3
## Madura_P1        8    6    1   15    3    1    6   18    9   14    8   17   18
## Pionera_P2      25   32   16    2   13    0    0    1    2   11    1   32    0
## Intermedia_P2   18   17    9    9   16    9    5    5    9    4    9    3    0
## Tardia_P2        3    3   12    2   24    3   14    6    3    3    1    2   35
## Madura_P2        1    5    0   10    8    3    4    8    2    5   10   12    8
## Pionera_P3      25   17   35   26    0   10    1    3    2    1    0   19    6
## Intermedia_P3   10   10    2   21   23    4   10    3    4   19    1    7    3
## Tardia_P3        4    7    6   11    1   12    1   23    6    6    9    5    2
## Madura_P3        3    8    6   13    9   20    4    1    6    5    4   12    9
##               Sp14 Sp15
## Pionera_P1       4    0
## Intermedia_P1    2    9
## Tardia_P1        4    3
## Madura_P1       14   10
## Pionera_P2       2    1
## Intermedia_P2    6    5
## Tardia_P2        2    6
## Madura_P2       16    3
## Pionera_P3       3    0
## Intermedia_P3    9    8
## Tardia_P3        2   17
## Madura_P3       12    7
# -----------------------------
# FASE 2. Tema 2: Diversidad alfa (por parcela)
# -----------------------------

riqueza  <- vegan::specnumber(mat)                                             # Calcula riqueza S (número de especies con abundancia > 0)
shannon  <- vegan::diversity(mat, index = "shannon")                           # Calcula índice de Shannon H'
simpson  <- vegan::diversity(mat, index = "simpson")                           # Calcula índice de Simpson (diversidad)
pielou   <- shannon / log(pmax(riqueza, 1))                                    # Calcula equitatividad de Pielou (H'/ln(S))

res_alfa <- abund %>%                                                          # Parte del dataset con abundancias
  select(ID, Etapa, Parcela) %>%                                               # Se queda con variables de identificación
  mutate(Riqueza = riqueza,                                                    # Agrega riqueza por parcela
         Shannon = shannon,                                                    # Agrega Shannon por parcela
         Simpson = simpson,                                                    # Agrega Simpson por parcela
         Pielou  = pielou)                                                     # Agrega Pielou por parcela

print(res_alfa)                                                                # Imprime tabla de diversidad alfa por parcela
## # A tibble: 12 × 7
##    ID            Etapa      Parcela Riqueza Shannon Simpson Pielou
##    <chr>         <fct>        <int>   <int>   <dbl>   <dbl>  <dbl>
##  1 Pionera_P1    Pionera          1      12    2.13   0.853  0.856
##  2 Intermedia_P1 Intermedia       1      14    2.34   0.883  0.888
##  3 Tardia_P1     Tardia           1      15    2.41   0.889  0.891
##  4 Madura_P1     Madura           1      15    2.51   0.911  0.928
##  5 Pionera_P2    Pionera          2      12    1.95   0.830  0.786
##  6 Intermedia_P2 Intermedia       2      14    2.50   0.908  0.949
##  7 Tardia_P2     Tardia           2      15    2.18   0.840  0.804
##  8 Madura_P2     Madura           2      14    2.45   0.902  0.929
##  9 Pionera_P3    Pionera          3      12    2.05   0.848  0.827
## 10 Intermedia_P3 Intermedia       3      15    2.43   0.895  0.899
## 11 Tardia_P3     Tardia           3      15    2.41   0.891  0.890
## 12 Madura_P3     Madura           3      15    2.54   0.910  0.937
res_etapa <- res_alfa %>%                                                      # Usa resultados por parcela
  group_by(Etapa) %>%                                                          # Agrupa por etapa sucesional
  summarise(                                                                   # Resume con promedios y desviaciones estándar
    Riqueza_prom = mean(Riqueza), Riqueza_sd = sd(Riqueza),                    # Media y sd de riqueza
    Shannon_prom = mean(Shannon), Shannon_sd = sd(Shannon),                    # Media y sd de Shannon
    Simpson_prom = mean(Simpson), Simpson_sd = sd(Simpson),                    # Media y sd de Simpson
    Pielou_prom  = mean(Pielou),  Pielou_sd  = sd(Pielou),                     # Media y sd de Pielou
    .groups = "drop"                                                           # Quita agrupamiento para devolver tibble normal
  )

print(res_etapa)                                                               # Imprime tabla resumen por etapa
## # A tibble: 4 × 9
##   Etapa  Riqueza_prom Riqueza_sd Shannon_prom Shannon_sd Simpson_prom Simpson_sd
##   <fct>         <dbl>      <dbl>        <dbl>      <dbl>        <dbl>      <dbl>
## 1 Pione…         12        0             2.04     0.0876        0.844    0.0118 
## 2 Inter…         14.3      0.577         2.43     0.0801        0.895    0.0128 
## 3 Tardia         15        0             2.33     0.135         0.873    0.0290 
## 4 Madura         14.7      0.577         2.50     0.0449        0.908    0.00483
## # ℹ 2 more variables: Pielou_prom <dbl>, Pielou_sd <dbl>
ggplot(res_alfa, aes(x = Etapa, y = Shannon)) +                                # Inicia gráfico: etapa vs Shannon
  geom_boxplot() +                                                             # Dibuja caja y bigotes (distribución)
  geom_jitter(width = 0.12) +                                                  # Pone puntos con leve dispersión horizontal
  theme_minimal() +                                                            # Estilo simple del gráfico
  labs(title = "Diversidad (Shannon) por etapa de sucesión")                   # Título del gráfico

# 4. FASE 3 - Diversidad beta y NMDS

cat("\n==============================\n")
## 
## ==============================
cat("FASE 3: Diversidad beta (Bray-Curtis) y NMDS\n")
## FASE 3: Diversidad beta (Bray-Curtis) y NMDS
cat("==============================\n")
## ==============================
d_bray <- vegan::vegdist(mat, method = "bray")
nmds <- vegan::metaMDS(mat, distance = "bray", k = 2, trymax = 100)
## Wisconsin double standardization
## Run 0 stress 0.09448796 
## Run 1 stress 0.09448795 
## ... New best solution
## ... Procrustes: rmse 4.83561e-05  max resid 9.130438e-05 
## ... Similar to previous best
## Run 2 stress 0.09448795 
## ... Procrustes: rmse 1.887705e-05  max resid 3.50099e-05 
## ... Similar to previous best
## Run 3 stress 0.1397667 
## Run 4 stress 0.1209304 
## Run 5 stress 0.1147497 
## Run 6 stress 0.1209304 
## Run 7 stress 0.1209304 
## Run 8 stress 0.09448796 
## ... Procrustes: rmse 3.616261e-05  max resid 6.587087e-05 
## ... Similar to previous best
## Run 9 stress 0.1209304 
## Run 10 stress 0.1209304 
## Run 11 stress 0.1209305 
## Run 12 stress 0.09448795 
## ... New best solution
## ... Procrustes: rmse 4.208314e-06  max resid 7.387545e-06 
## ... Similar to previous best
## Run 13 stress 0.2514444 
## Run 14 stress 0.09448795 
## ... Procrustes: rmse 1.950579e-05  max resid 3.688606e-05 
## ... Similar to previous best
## Run 15 stress 0.1625998 
## Run 16 stress 0.1979959 
## Run 17 stress 0.1209304 
## Run 18 stress 0.1979959 
## Run 19 stress 0.197996 
## Run 20 stress 0.1147497 
## *** Best solution repeated 2 times
cat("OK: NMDS ejecutado. Stress = ", round(nmds$stress, 3), "\n", sep = "")
## OK: NMDS ejecutado. Stress = 0.094
# Importante: usar SOLO "sites" para evitar el error de filas (parcelas vs especies)
scores_nmds <- as.data.frame(vegan::scores(nmds, display = "sites")) %>%
  tibble::rownames_to_column("ID") %>%
  left_join(res_alfa %>% select(ID, Etapa), by = "ID")

ggplot(scores_nmds, aes(x = NMDS1, y = NMDS2, shape = Etapa)) +
  geom_point(size = 3) +
  theme_minimal() +
  labs(title = paste0("NMDS (Bray-Curtis) - stress = ", round(nmds$stress, 3)))

gamma_n <- sum(colSums(mat) > 0)
cat("OK: Diversidad gamma (especies presentes): ", gamma_n, "\n", sep = "")
## OK: Diversidad gamma (especies presentes): 15
cat("\nResumen FASE 3:\n")
## 
## Resumen FASE 3:
cat("- Se calculo disimilitud Bray-Curtis.\n")
## - Se calculo disimilitud Bray-Curtis.
cat("- Se ejecuto NMDS 2D y se graficaron coordenadas de parcelas (sites).\n")
## - Se ejecuto NMDS 2D y se graficaron coordenadas de parcelas (sites).
cat("- Se calculo diversidad gamma.\n")
## - Se calculo diversidad gamma.
cat("Comandos clave: vegan::vegdist(), vegan::metaMDS(), vegan::scores(display='sites'), colSums().\n")
## Comandos clave: vegan::vegdist(), vegan::metaMDS(), vegan::scores(display='sites'), colSums().
cat("\n==============================\n")
## 
## ==============================
cat("FASE 4: Curvas rango-abundancia\n")
## FASE 4: Curvas rango-abundancia
cat("==============================\n")
## ==============================
rank_df <- abund %>%
  group_by(Etapa) %>%
  summarise(across(all_of(especies), mean), .groups = "drop") %>%
  pivot_longer(-Etapa, names_to = "Especie", values_to = "Abundancia") %>%
  group_by(Etapa) %>%
  arrange(desc(Abundancia), .by_group = TRUE) %>%
  mutate(Rango = row_number())

ggplot(rank_df, aes(x = Rango, y = Abundancia)) +
  geom_line() +
  facet_wrap(~Etapa, scales = "free_y") +
  theme_minimal() +
  labs(title = "Curvas rango-abundancia por etapa")

cat("\nResumen FASE 4:\n")
## 
## Resumen FASE 4:
cat("- Se promediaron abundancias por especie dentro de cada etapa.\n")
## - Se promediaron abundancias por especie dentro de cada etapa.
cat("- Se ordenaron especies por dominancia y se graficaron curvas.\n")
## - Se ordenaron especies por dominancia y se graficaron curvas.
cat("Comandos clave: summarise(across()), pivot_longer(), arrange(), row_number(), facet_wrap().\n")
## Comandos clave: summarise(across()), pivot_longer(), arrange(), row_number(), facet_wrap().
cat("\n==============================\n")
## 
## ==============================
cat("FASE 5: Interacciones (red didactica)\n")
## FASE 5: Interacciones (red didactica)
cat("==============================\n")
## ==============================
tipos <- tibble(
  Tipo = c("Mutualismo", "Comensalismo", "Competencia", "Depredacion", "Amensalismo", "Neutralismo"),
  efecto_A = c(+1, +1, -1, +1, 0, 0),
  efecto_B = c(+1,  0, -1, -1, -1, 0)
)

interacciones <- tibble(
  A = sample(especies, 30, replace = TRUE),
  B = sample(especies, 30, replace = TRUE),
  Tipo = sample(tipos$Tipo, 30, replace = TRUE,
                prob = c(0.15, 0.15, 0.25, 0.20, 0.10, 0.15))
) %>%
  filter(A != B) %>%
  left_join(tipos, by = "Tipo")

balance <- bind_rows(
  interacciones %>% transmute(Especie = A, Efecto = efecto_A),
  interacciones %>% transmute(Especie = B, Efecto = efecto_B)
) %>%
  group_by(Especie) %>%
  summarise(Balance_neto = sum(Efecto), n_interacciones = n(), .groups = "drop") %>%
  arrange(desc(Balance_neto))

balance
## # A tibble: 14 × 3
##    Especie Balance_neto n_interacciones
##    <chr>          <dbl>           <int>
##  1 Sp07               3               6
##  2 Sp13               3               3
##  3 Sp06               2               6
##  4 Sp09               1               5
##  5 Sp15               1               4
##  6 Sp05               0               3
##  7 Sp08               0               4
##  8 Sp10               0               1
##  9 Sp12               0               2
## 10 Sp01              -1               4
## 11 Sp02              -1               3
## 12 Sp11              -1               2
## 13 Sp14              -1               7
## 14 Sp04              -2               4
g_int <- igraph::graph_from_data_frame(interacciones %>% select(A, B, Tipo), directed = TRUE)
plot(g_int, vertex.size = 16, vertex.label.cex = 0.7,
     main = "Red de interacciones (didactica)")

cat("\nResumen FASE 5:\n")
## 
## Resumen FASE 5:
cat("- Se simularon interacciones entre especies y se asignaron efectos.\n")
## - Se simularon interacciones entre especies y se asignaron efectos.
cat("- Se estimo balance neto por especie.\n")
## - Se estimo balance neto por especie.
cat("- Se construyo y grafico una red dirigida.\n")
## - Se construyo y grafico una red dirigida.
cat("Comandos clave: sample(), filter(), left_join(), bind_rows(), igraph::graph_from_data_frame().\n")
## Comandos clave: sample(), filter(), left_join(), bind_rows(), igraph::graph_from_data_frame().
cat("\n==============================\n")
## 
## ==============================
cat("FASE 6: Niveles troficos y piramide de energia\n")
## FASE 6: Niveles troficos y piramide de energia
cat("==============================\n")
## ==============================
niveles <- tibble(
  Especie = especies,
  Nivel = case_when(
    Especie %in% paste0("Sp", sprintf("%02d", 1:5))   ~ "Productores",
    Especie %in% paste0("Sp", sprintf("%02d", 6:10))  ~ "Herbivoros",
    Especie %in% paste0("Sp", sprintf("%02d", 11:14)) ~ "Carnivoros",
    TRUE ~ "Apex"
  )
)

biomasa_nivel <- abund %>%
  select(ID, Etapa, all_of(especies)) %>%
  pivot_longer(all_of(especies), names_to = "Especie", values_to = "Abund") %>%
  left_join(niveles, by = "Especie") %>%
  group_by(Etapa, ID, Nivel) %>%
  summarise(Biomasa = sum(Abund), .groups = "drop") %>%
  group_by(Etapa, Nivel) %>%
  summarise(Biomasa_prom = mean(Biomasa), .groups = "drop")

E0 <- 10000
ef <- 0.10
orden <- c("Productores", "Herbivoros", "Carnivoros", "Apex")

energia_base <- tibble(
  Nivel = orden,
  Energia_teorica = E0 * ef^(match(Nivel, orden)-1)
)

energia <- biomasa_nivel %>%
  left_join(energia_base, by = "Nivel") %>%
  group_by(Etapa) %>%
  mutate(prop_biomasa = Biomasa_prom / sum(Biomasa_prom),
         Energia_asignada = Energia_teorica * prop_biomasa) %>%
  ungroup()

ggplot(energia, aes(x = Nivel, y = Energia_asignada)) +
  geom_col() +
  facet_wrap(~Etapa) +
  theme_minimal() +
  labs(title = "Piramide de energia (modelo simple) por etapa",
       y = "Energia asignada (unidades relativas)")

cat("\nResumen FASE 6:\n")
## 
## Resumen FASE 6:
cat("- Se asignaron niveles troficos a especies.\n")
## - Se asignaron niveles troficos a especies.
cat("- Se calculo biomasa (proxy) por nivel y etapa.\n")
## - Se calculo biomasa (proxy) por nivel y etapa.
cat("- Se asigno energia por nivel (transferencia ~10%) y se grafico.\n")
## - Se asigno energia por nivel (transferencia ~10%) y se grafico.
cat("Comandos clave: case_when(), pivot_longer(), summarise(), mutate(), geom_col().\n")
## Comandos clave: case_when(), pivot_longer(), summarise(), mutate(), geom_col().
cat("\n==============================\n")
## 
## ==============================
cat("FASE 7 (Opcional): Nutrientes N y P + razon N:P\n")
## FASE 7 (Opcional): Nutrientes N y P + razon N:P
cat("==============================\n")
## ==============================
nut <- parcelas %>%
  mutate(
    N_mgL = case_when(
      Etapa == "Pionera"    ~ runif(n(), 0.8, 1.6),
      Etapa == "Intermedia" ~ runif(n(), 0.6, 1.2),
      Etapa == "Tardia"     ~ runif(n(), 0.4, 1.0),
      TRUE                  ~ runif(n(), 0.3, 0.8)
    ),
    P_mgL = case_when(
      Etapa == "Pionera"    ~ runif(n(), 0.05, 0.12),
      Etapa == "Intermedia" ~ runif(n(), 0.04, 0.10),
      Etapa == "Tardia"     ~ runif(n(), 0.03, 0.08),
      TRUE                  ~ runif(n(), 0.02, 0.06)
    )
  ) %>%
  mutate(
    N_molar = N_mgL / 14,
    P_molar = P_mgL / 31,
    NP_molar = N_molar / P_molar,
    Limitacion = case_when(
      NP_molar < 16 ~ "Limitado por N",
      NP_molar > 16 ~ "Limitado por P",
      TRUE          ~ "Cercano a equilibrio"
    )
  )

nut %>% select(ID, Etapa, N_mgL, P_mgL, NP_molar, Limitacion)
## # A tibble: 12 × 6
##    ID            Etapa      N_mgL  P_mgL NP_molar Limitacion    
##    <chr>         <fct>      <dbl>  <dbl>    <dbl> <chr>         
##  1 Pionera_P1    Pionera    1.00  0.0633     35.2 Limitado por P
##  2 Intermedia_P1 Intermedia 1.07  0.0963     24.5 Limitado por P
##  3 Tardia_P1     Tardia     0.906 0.0458     43.7 Limitado por P
##  4 Madura_P1     Madura     0.553 0.0485     25.2 Limitado por P
##  5 Pionera_P2    Pionera    0.884 0.0746     26.2 Limitado por P
##  6 Intermedia_P2 Intermedia 1.08  0.0578     41.3 Limitado por P
##  7 Tardia_P2     Tardia     0.824 0.0675     27.0 Limitado por P
##  8 Madura_P2     Madura     0.781 0.0550     31.4 Limitado por P
##  9 Pionera_P3    Pionera    0.801 0.111      16.0 Limitado por N
## 10 Intermedia_P3 Intermedia 1.08  0.0410     58.4 Limitado por P
## 11 Tardia_P3     Tardia     0.830 0.0449     41.0 Limitado por P
## 12 Madura_P3     Madura     0.699 0.0460     33.7 Limitado por P
ggplot(nut, aes(x = Etapa, y = NP_molar)) +
  geom_boxplot() +
  geom_hline(yintercept = 16, linetype = "dashed") +
  theme_minimal() +
  labs(title = "Razon molar N:P por etapa (linea = 16)",
       y = "N:P (molar)")

cat("\nResumen FASE 7:\n")
## 
## Resumen FASE 7:
cat("- Se simularon concentraciones de N y P por etapa.\n")
## - Se simularon concentraciones de N y P por etapa.
cat("- Se calculo N:P y se interpreto limitacion relativa usando el umbral 16.\n")
## - Se calculo N:P y se interpreto limitacion relativa usando el umbral 16.
cat("Comandos clave: runif(), case_when(), mutate(), geom_hline().\n")
## Comandos clave: runif(), case_when(), mutate(), geom_hline().