Análisis de Datos Challabamba 2009-2022

Author

Centro Internacional de la Papa

Show the code
knitr::opts_chunk$set(
  echo = FALSE, message = F,
  warning = F, ft.keepnext = F, tab.topcaption = TRUE,
  ft.align = "left", tab.cap.pre = "Tabla ", tab.cap.sep = ": "
)
library(tidyverse)
library(emmeans)
library(agricolae)
library(ComplexUpset)
library(janitor)
library(data.table)
library(forcats)
library(gower)
library(officer)
library(plotly)
library(flextable)
library(knitr)
library(dumbbell)
library(ggplot2)
library(sf)
### librarias para modelos

library(vegan)

set.seed(123)
autonum <- run_autonum(seq_id = "tab", bkm = "TC1", bkm_all = TRUE)
options(knitr.duplicate.label = "allow")
#source("R/curacion_seedsystem.R")
source("D:/omar/METRIKA-GROUP/Github/agrograf/bar_plot.R")
source("D:/omar/METRIKA-GROUP/Github/agrograf/dumbbell_plot.R")
source("D:/omar/METRIKA-GROUP/Github/agrograf/dumbbell_utils.R")
source("D:/omar/METRIKA-GROUP/Github/agrograf/count_utils.R")
source("D:/omar/METRIKA-GROUP/Github/agrograf/upset_tools.R")
source("D:/omar/METRIKA-GROUP/Github/agrograf/upset_plot.R")
#source("D:/omar/METRIKA-GROUP/Github/analisis_datos_cip/SeedSystems/R/curacion_seedsystem_backup.R")
#source("D:/omar/Analisis_colegas/yanapai/yanapai_variedades/R/utils.R")
#source("R/utils.R")
library(corrplot)
library(agricolae)
library(ggpubr)
library(emmeans)

# Function to calculate summary statistics for three columns
calculate_summary_stats <- function(data, categoria ,col1, col2, col3) {
  summary_stats <- data.frame(
      
    count_fam  = apply(data[, c(categoria, categoria, categoria)], 2, length),  
    Mean = apply(data[, c(col1, col2, col3)], 2, mean) %>% round(2),
    Median = apply(data[, c(col1, col2, col3)], 2, median) %>% round(2),
    Max = apply(data[, c(col1, col2, col3)], 2, max) %>% round(2),
    Min = apply(data[, c(col1, col2, col3)], 2, min) %>% round(2),
    sum = apply(data[, c(col1, col2, col3)], 2, sum) %>% as.integer()
  )
  
  return(summary_stats)
}

1 Analisis descriptivo

1.1 Número de observaciones y familias

Show the code
n_09 <- nrow(datos_09)
fam09 <- datos_09$code_farmer %>% unique()
nfam09 <- fam09 %>% length()
##
n_moni22 <- nrow(datos_moni22)
fam22_moni <- datos_moni22$code_farmer %>% unique()
nfam22_moni <- fam22_moni %>% length()
##
n_mues22 <- nrow(datos_muestreo22)
fam22_mues <- datos_muestreo22$code_farmer %>% unique() 
nfam22_mues <- fam22_mues %>% length()

nobs <- c(n_09,n_mues22,n_moni22) 
nfam <- c(nfam09, nfam22_mues,nfam22_moni)
out <- data.frame(nobs,nfam) 
label <- c("estudio 2009","muestreo 2022", "monitoreo 2022")
out <- cbind(label,out)


flextable(out)

label

nobs

nfam

estudio 2009

1,714

98

muestreo 2022

5,041

351

monitoreo 2022

6,872

351

Observación

Existe un total de 62 familias del 2009 que se repiten tanto en el muestreo y el monitoreo del 2022. Esto representa un

Show the code
n_coinci <- c("62","62","62")
p_coinci <- c("73%", paste0(100*(62/nfam22_mues) %>% round(2),"%"), paste0(100*(62/nfam22_moni) %>% round(2),"%") )
out$n_coincidencia <- n_coinci
out$p_coincidencia <- p_coinci

fam_intersect <- intersect(fam09, fam22_moni)

flextable(out)

label

nobs

nfam

n_coincidencia

p_coincidencia

estudio 2009

1,714

98

62

73%

muestreo 2022

5,041

351

62

18%

monitoreo 2022

6,872

351

62

18%

1.2 Conteo único de variedades del 2009

Show the code
# tbl_variety_xfam <- datos_09 %>% count_distinct("code_farmer", variable = "cu_variety_name")
# 
# tbl_variety_xloc <- datos_09 %>% count_distinct(c("locality","code_farmer"), variable = "cu_variety_name")

#conteo de variedades
tbl_variety_xcom09 <- datos_09 %>% count_distinct(c("cu_community","code_farmer"), variable = "cu_variety_name")

#conteo de 
tbl_variety_names09 <- datos_09 %>% group_by(code_farmer) %>% count(cu_variety_name) %>% ungroup()

out09 <- left_join(tbl_variety_xcom09, tbl_variety_names09 %>% select(-n)) %>% select(1,2,4,3)

DT::datatable(out09)

1.3 Conteo único de muestreo 2022

Show the code
# tbl_variety_xfam <- datos_09 %>% count_distinct("code_farmer", variable = "cu_variety_name")
# 
# tbl_variety_xloc <- datos_09 %>% count_distinct(c("locality","code_farmer"), variable = "cu_variety_name")

#conteo de variedades
tbl_variety_xcom_mues22 <- datos_muestreo22 %>% count_distinct(c("cu_community","code_farmer"), variable = "cu_variety_name")

#conteo de 
tbl_variety_names_mues22 <- datos_muestreo22 %>% group_by(code_farmer) %>% count(cu_variety_name) %>% ungroup()

out_mues22 <- left_join(tbl_variety_xcom_mues22, tbl_variety_names_mues22 %>% select(-n)) %>% select(1,2,3,4)

DT::datatable(out_mues22)

1.4 Conteo único de monitoreo 2022

Show the code
# tbl_variety_xfam <- datos_09 %>% count_distinct("code_farmer", variable = "cu_variety_name")
# 
# tbl_variety_xloc <- datos_09 %>% count_distinct(c("locality","code_farmer"), variable = "cu_variety_name")

#conteo de variedades
tbl_variety_xcom_mon22 <- datos_moni22 %>% 
            count_distinct(c("cu_community","code_farmer"), 
                           variable = "cu_variety_name")

#conteo de 
tbl_variety_names_mon22 <- datos_muestreo22 %>% 
    group_by(code_farmer) %>% 
    count(cu_variety_name) %>% ungroup()

out_mon22 <- left_join(tbl_variety_xcom_mon22, tbl_variety_names_mon22 %>% select(-n)) %>% select(1,2,3,4)

DT::datatable(out_mon22)

2 Richness

Tabla de cantidad de variedades por familia y porcentajes de cambio del estudio de monitoreo y muestreo del 2022.

Show the code
tbl_richness_area <- datos_09 %>% count(cu_variety_name) %>% arrange(desc(n))

tbl_richness_adm3 <- datos_09 %>% group_by(adm3_name) %>% count(cu_variety_name) %>% arrange(desc(n))

tbl_richness_comu <- datos_09 %>% group_by(cu_community) %>% count(cu_variety_name) %>% arrange(desc(n))

2.1 Family Level

2.2 Summary by family level

Estadisticos de las familias

2.3 Summary by community

Resultados del modelos aplicado a Chaccllabamba

Resultados del modelos aplicado a Cochacochayocc

Resultados del modelos aplicado a Turuyuq

3 Abundancia y Evenness

3.1 Abundancia por variedad (con las mismas familias y mismas localidades)

  • Se consideró la presencia de agricultores por cada una de las variedades

Resultados del datasets challabamba09

Resultados del datasets challabamba_mues22

Resultados del datasets challabamba_moni22

Tabla de resultados

Show the code
tbl_abundance_vrty <- inner_join(inner_join(out_abun_vrty[[1]],out_abun_vrty[[2]], by ="cu_variety_name" ), out_abun_vrty[[3]],by ="cu_variety_name")
names(tbl_abundance_vrty)[2:4]<- paste("abund",sets,sep = "_")
DT::datatable(tbl_abundance_vrty)
Show the code
writexl::write_xlsx(tbl_abundance_vrty,path = "tbl_abudancia_variety.xlsx")

Grafico

Show the code
res <- tbl_abundance_vrty %>% 
            pivot_longer(cols = 2:4, names_to = "estudio") %>% 
            arrange(desc(value)) %>% 
            slice_head(n=40)
            
 plot_ly(
    res,
    x = ~ estudio,
    y =  ~ cu_variety_name,
    z =  ~ value,
    type = 'heatmap',
    colors = "BuGn"
  )

3.2 Abundancia por familia (con las mismas familias)

  • Se consideró la cantidad de familias por cada una de las variedades

Resultados del datasets challabamba09

Resultados del datasets challabamba_mues22

Resultados del datasets challabamba_moni22

Tabla de resultados

Gráfico

3.3 Abundancia por comunidad (con familias en común)

Resultados del datasets challabamba09

Resultados del datasets challabamba_mues22

Resultados del datasets challabamba_moni22

Comparando por localidades en común

Graficamos respecto a las 3 comunidades de Challabamba

3.4 Evenness por comunidad (con familias en comun)

Resultados del datasets challabamba09

Resultados del datasets challabamba_mues22

Resultados del datasets challabamba_moni22

Comparando por localidades en común

Gráficamos

3.5 Evenness por familia (con las mismas familias)

Resultados del datasets challabamba09

Resultados del datasets challabamba_mues22

Resultados del datasets challabamba_moni22

Juntando las familias y los índices de abundancia de los datasets:

Gráfico

3.6 Evenness por variedad (con las mismas familias)

Resultados del datasets challabamba09

Resultados del datasets challabamba_mues22

Resultados del datasets challabamba_moni22

Juntando las familias y los índices de abundancia de los datasets:

Gráfico

3.7 Bray-Curtis (variedades y codigo agricultor)

  • Se considero el índice de similaridad de Bray-Curtis

4 Abundance por comunidad y familia para Challabamba Monitoreo-2022

Show the code
# tbl_freq_community <- datos_moni22 %>% tabyl(cu_community, cu_variety_name) %>% as.data.frame()
# plyr::ddply(tbl_freq_community,~cu_community,function(x) {
#          data.frame(Pielou=diversity(x[-1], index="simpson")/log(sum(x[-1]>0))) })

# tbl_freq_fam <- datos_moni22 %>% tabyl(code_farmer, cu_variety_name) %>% as.data.frame()
# plyr::ddply(tbl_freq_fam,~code_farmer,function(x) {
#          data.frame(Pielou=diversity(x[-1], index="simpson")/log(sum(x[-1]>0))) })
# 
# 
# tbl_freq_adm3 <- datos_moni22 %>% tabyl(adm3_name, cu_variety_name) %>% as.data.frame()
# plyr::ddply(tbl_freq_adm3, ~adm3_name,function(x) {
#          data.frame(Pielou=diversity(x[-1], index="simpson")/log(sum(x[-1]>0))) })
  • Bray-Curtis dissimilarity index

5 Abundance por comunidad y familia para Challabamba Muestreo-2022

6 Presencia-Ausencia

6.1 Con las mismas localidades

6.2 Con todas las comunidades

7 Caso: sin considerar familias en común

7.1 Abundancia por comunidad (sin familias en común)

Resultados del datasets challabamba09

Resultados del datasets challabamba_mues22

Resultados del datasets challabamba_moni22

Comparando por localidades en común

7.2 Evenness por comunidad (sin familias en comun)

Resultados del datasets challabamba09

Resultados del datasets challabamba_mues22

Resultados del datasets challabamba_moni22

Comparando por localidades en común