Package {hydrodataFR} - Introduction

Pascal Irz

Le 10 mai 2021

Pourquoi ce package ?

Le package {hydrodataFR} propose une palette d’outils pour faciliter l’exploitation des données de la banque HYDRO.

Il permet déjà de :

Installation

Pré-requis

La machine de l’utilisateur est supposée configurée avec les outils nécessaires pour compiler des packages R. Ce qui permet d’installer le package {hydrodataFR}. Pour les détails de la configuration R et RStudio, se reporter à la description donnée au début du tuto sur l’importation des données avec le package {aspe}.

Téléchargement du package

devtools::install_github("pascalirz/hydrodataFR")

Activation des packages.

library(tidyverse)
library(hydrodataFR)

Contenu

Les données concernées sont :

Le référentiel associé est disponible en ligne.

La plupart des données sont rattachées à un site ou à une station de mesure. La sélection des stations peut être opérée de diverses manières :

Les fonctions du package utilisées ici sont préfixées en référence à la source, par exemple bh_ pour la banque HYDRO.

Caractéristiques des stations

L’API donne accès à certaines données basiques sur les stations HYDRO. Il est possible de sélectionner les stations sur divers critères qui sont expliqués sur la page de l’API. Par exemple, on peut sélectionner selon un rectangle géographique. Dans ce cas le format est imposé :

donnees_stations <- bh_sta_data(bbox = "-7, 46, -3, 48")

Autre exemple, si l’on s’intéresse aux stations de la région Bretagne (code Insee = 53) :

donnees_stations <- bh_sta_data(code_region = 53)

On obtient un tableau de 215 lignes et 35 colonnes nommées :

names(donnees_stations)
#>  [1] "code_site"                           "libelle_site"                       
#>  [3] "type_site"                           "coordonnee_x_site"                  
#>  [5] "coordonnee_y_site"                   "code_projection"                    
#>  [7] "longitude_site"                      "latitude_site"                      
#>  [9] "altitude_site"                       "code_systeme_alti_site"             
#> [11] "surface_bv"                          "statut_site"                        
#> [13] "premier_mois_etiage_site"            "premier_mois_annee_hydro_site"      
#> [15] "influence_generale_site"             "code_entite_hydro_site"             
#> [17] "code_troncon_hydro_site"             "code_commune_site"                  
#> [19] "code_zone_hydro_site"                "libelle_commune"                    
#> [21] "code_departement"                    "code_region"                        
#> [23] "libelle_region"                      "code_cours_eau"                     
#> [25] "libelle_cours_eau"                   "uri_cours_eau"                      
#> [27] "grandeur_hydro"                      "date_maj_site"                      
#> [29] "date_premiere_donnee_dispo_site"     "commentaire_influence_generale_site"
#> [31] "commentaire_site"                    "type_contexte_loi_stat_site"        
#> [33] "type_loi_site"                       "libelle_departement"                
#> [35] "geometry"

Les premières lignes contiennent par exemple les informations suivantes (sélection de colonnes) :

donnees_stations %>% select(code_site,
                            libelle_site,
                            longitude_site,
                            latitude_site,
                            altitude_site,
                            surface_bv,
                            code_departement) %>%
  head() %>% # uniquement les premières lignes
  DT::datatable()