Sobrevuelo de la base regional

Análisis del archivo: C:/ZMTcloud/Documents/GCRMN-ETPN/etp_reef_asociated_data/data/processed/monitoring_data/benthos/2025_01_30_22_40_54_benthos_global_report.rds

 

  1. La base regional tiene 205668 lineas. Cada línea es el porcentaje de cobertura de un componente del fondo (abiotic, hard_coral, other, algae) en una replica (cuadrante) de un evento de muestreo (i.e. un transecto en un sitio en una fecha)
  2. Los paises representados son mexico, costa_rica, ecuador, colombia, el_salvador, panama, nicaragua
  3. Las fechas incluidas van desde 1994 hasta el 2024
  4. Hay 514 especies incluidas

 

Vista resumida de la base de datos

Tiene las siguientes columnas

##  [1] "category"                     "comments"                    
##  [3] "country"                      "coverPercentage"             
##  [5] "datasetID"                    "decimalLatitude"             
##  [7] "decimalLongitude"             "ecoregion"                   
##  [9] "eventDate"                    "eventDay"                    
## [11] "eventMonth"                   "eventYear"                   
## [13] "filePath"                     "higherGeography"             
## [15] "locality"                     "location"                    
## [17] "maximumDepthInMeters"         "minimumDepthInMeters"        
## [19] "originalOrganismQuantityType" "province"                    
## [21] "quadrant"                     "realm"                       
## [23] "recordedBy"                   "sampleSizeUnit"              
## [25] "sampleSizeValue"              "samplingProtocol"            
## [27] "speciesName"                  "subcategory"                 
## [29] "taxa"                         "taxaLevel"                   
## [31] "transect"                     "transectID"                  
## [33] "waterTemperatureC"

Limpieza de la base de datos

  1. Numero de filas sin coordenadas = 0.
  2. Numero de filas sin fecha = 0.
  3. Numero de filas excluidas por representar taxa no sésil (i.e. mollusk, trematoda, sea_urchin, echinoderm, sea_cucumber, fish, starfish) fueron 6480.

Las subcategorias de fondo son: anemone, anthozoa, azooxanthellate, bleaching_coral, bryozoa, coral, coralline_algae, crustacean, cyanobacteria, dead_coral, diatom, hexacorallia, hydrocoral, hydrozoa, macroalgae, medusozoa, octocorallia, other, polychaeta, rock, rubbles, sand, sponge, tunicate, turf_algae, zoanthid

Revisión de duplicados

Método:

  1. Identifiqué los transectos que están en más de un datasetID
  2. Resumí el numero de taxa, % de cobertura minimo y máximo y promedio de cada transecto para ver si representaban la misma comunidad
  3. Usando la resta de cada par, identifiqué cuales son identicos, similares o distintos
  4. Se revisaron todos los casos individualmente, eliminé uno de cada par. Se conservo el transecto que tenia la taxonomia más desglosada (más numero de taxa). Algunos casos parecen ser dos bases de datos iguales con diferente detalle en la identificacion. Por ejemplo, en una base de datos identifican las spp de coral y en la otra ponen solo coral con el % de coral sumado de todas las especies.
    Los transectos duplicados estaban basicamente entre:
    160924_murcielago_cobertura_y_invert.xls:fondo vs. 160916_cobertura_e_invertebrados_murcielago.xls:cobertura
    gorgona_coral_reef_monitoring_2015_2018_benthic_data.xlsx:data vs. gorgona_i_benthic_cover_all_reefs_1998_2022.xlsx:data
    cobertura_culebra_2014.xls:fondo vs. cobertura_punta_leona_y_culebra_caro.xls:fondo
  • Verifique que el mismo transectID no este en varios datasetID, para poder usar el transectID como identificadores unicos de cada réplica.
## [1] 14798
## [1] 199187
## [1] 14798
## [1] 89
## [1] 5
## [1] 123
## [1] 123
## [1] 109
## [1] 107
## [1] 0
## [1] 14798

Revisión de cuadrantes que no suman 100 %

## [1] 14798
## [1] 107
## [1] 123
## [1] 1056
## [1] 13802
  1. En el dataset hay 123 transectos con cuadrantes cuyo porcentaje de cobertura es mayor a 100% y 1056 transectos con cuadrantes que suman menos de 100%.

Sin embargo, los transectos correctos, donde todos los cuadrantes suman 100 (aceptando un margen de error de ± 5) son la mayoría (i.e. 13802 transectos).

En la siguiente tabla se muestra los datasets que tienen cuadrantes que no suman 100 (aceptando un margen de error de ± 5) y el conteo de transectos con error en cada una:

## 
##                                         1997_2020_oaxaca_piso.xlsx:hoja1 
##                                                                      183 
##             base_bentos_jalisco_colima_sep_nov_2023.xlsx:bentossep_nov23 
##                                                                       20 
##                                   base_datos_fondo_acg_140706.xlsx:fondo 
##                                                                        6 
##    cobertura_provincias_costa_de_ecuador.xlsx:manabi_esmeraldas_staelena 
##                                                                       13 
##  cobertura_provincias_costa_de_ecuador.xlsx:manabi_sesiles_costa_ecuador 
##                                                                        5 
## cobertura_provincias_costa_de_ecuador.xlsx:santa_elena_sesiles_c_ecuador 
##                                                                        2 
##                                           cobi_pcu_rgi_2007_2017_.csv:NA 
##                                                                      181 
##             corales_i_de_la_plata_2010.xlsx:coral_data_1m2_qdat_81puntos 
##                                                                        7 
##                                      dwc_sesiles_v2_cambios.xlsx:sheet_1 
##                                                                      283 
##                                           fondo_act_ci.xlsx:bd_fondo_act 
##                                                                        7 
##                    gorgona_i_benthic_cover_all_reefs_1998_2022.xlsx:data 
##                                                                        1 
##                           la_azufrada_reef_gorgona_i_1998_2014.xlsx:data 
##                                                                      184 
##                          machalilla_sesiles_sep_2010.xlsx:los_horcados_n 
##                                                                        1 
##                           machalilla_sesiles_sep_2010.xlsx:salango_sur_1 
##                                                                        1 
##                              machalilla_sesiles_sep_2010.xlsx:sombrerito 
##                                                                        1 
##                              mbd_bentos_jalisco_colima_sep_24.xlsx:hoja1 
##                                                                       10 
##          monitoreo_ecologico_submareal_y_corales_1994_2014.xlsm:sessiles 
##                                                                      186 
##                                          nicaragua_2011_14_15.xlsx:coral 
##                                                                        1 
##  reef_life_survey_rls_habitat_quadrats.xlsx:reef_life_survey_rls_habitat 
##                                                                       76 
##                                  sessiles_mobiles_jjdoctorado.xlsx:fondo 
##                                                                       11

     

Adaptacion de base regional para analisis

Para incluir los datos de benthos en los análisis, la base debe estar en el siguiente formato:
cada fila representa el porcentaje de cobertura de un taxón o categoría de fondo en un transecto.
Como los datos estaban desagregados por cuadrante, se calculó el promedio de cobertura de cada taxón para obtener un solo valor por transecto.

  1. Se agregan los taxa que estan en al menos uno de los cuadrantes del transecto a todos los cuadrantes. Si no tiene % de cobertura, se le coloca 0. Para que al sacar un promedio, se consideren los 0 y baje el % promedio del taxa.
## [1] 14798
## [1] 107
## [1] 14798
## [1] 107

Sitios

   

Fechas por sitio

En este grafico se muestran solo los transectos cuyo % de cobertura ronda 100 %.

Duracion del monitoreo en los sitios de cada país

Esfuerzo

Cantidad de transectos en cada país

En este grafico se muestran solo los transectos cuyo % de cobertura ronda 100 %.

Parametros bioticos

Cobertura de Coral

   

Relacion cobertura de coral-macroalga

Contribuyentes

Desafios de integración

  1. Datasets duplicados
  2. Coordenadas ausentes
  3. Fechas ausentes
  4. Claves de referencia para las especies
  5. Autorias mixtas

Dudas con la base de datos

  1. Hay repeticiones de las especies en varios cuadrantes y con las mismas abundancias. Fue resuelto promediando el % decobertura por taxa en cada transecto
  2. Hay algunos transectID que al revisarlos en las bases de datos crudas no encuentro los mismos datos:
    e.g.mex::NA::NA::achotines::2021-09-02::1:3 del datasetID panama_septiembre_2021.xlsx:coral

Siguientes pasos

  1. Enviar datos según formato de envío establecido
  2. Confirmar permiso de uso de datos: Solo reporte global, bajo previa autorizacion, para todo proyecto del nodo
  3. Personas colaboradoras
  4. Politica de uso de datos

 

Generar devolución de base de datos procesador de cada autor.