L’analyse fréquentielle en hydrologie est une méthode statistique utilisée pour comprendre et prédire la probabilité d’occurrence future d’événements et de phénomènes hydrologiques rares à partir de l’étude des données passées (séries historiques).
Elle est largement utilisée pour l’étude des événements extrêmes, qu’il s’agisse de crues majeures, de précipitations intenses ou de sécheresses sévères. Cette section présente les bases théoriques de l’analyse fréquentielle appliquée à l’hydrologie.
Méthodes d’échantillonnage des valeurs extrêmes
L’analyse fréquentielle des événements extrêmes nécessite l’utilisation de méthodes d’échantillonnage adaptées afin d’extraire les observations les plus représentatives des phénomènes rares à partir des séries hydrologiques. Il s’agit de filtrer la chronique complète des débits journaliers afin de constituer un échantillon de données dites « exceptionnelles ».
Dans la théorie des valeurs extrêmes, deux approches méthodologiques standards et complémentaires permettent de réaliser cette sélection: la méthode des maxima par blocs (Block Maxima) et la méthode des dépassements de seuil (Peaks Over Threshold, POT).
Méthode des maxima par blocs (Block Maxima)
Principe
La méthode des maxima par blocs consiste à diviser la chronique temporelle continue en intervalles de temps réguliers et de durées égales, appelés « blocs » qui correspondent généralement à des années hydrologiques ou civiles. Pour chaque bloc annuel, seule la valeur maximale absolue du débit est extraite et conservée.
Cette méthode repose sur le théorème des valeurs extrêmes, selon lequel les maxima d’échantillons suffisamment grands convergent vers une loi de type GEV (Generalized Extreme Value). L’échantillon ainsi constitué (composé d’une valeur par an) est destiné à être ajusté par des distributions statistiques adaptées telles que la loi de Gumbel ou la loi GEV.
Avantages
Simplicité conceptuelle et opérationnelle: Cette approche est intuitive, facile à mettre en œuvre et largement documentée dans la littérature hydrologique. Elle bénéficie de l’appui de nombreux outils numériques et packages statistiques éprouvés (comme extRemes sous R).
Atténuation de la dépendance temporelle: En ne sélectionnant qu’une seule valeur par bloc, la corrélation temporelle à court terme — propre aux séries de débits journaliers — est naturellement éliminée (hypothèse d’indépendance des variables (i.i.d.) respecté).
Filtrage du bruit de fond hydrologique: Le processus de sélection isole le sommet des hydrogrammes et élimine les fluctuations quotidiennes ou saisonnières mineures. L’analyse se focalise ainsi exclusivement sur les événements générateurs de crues réelles.
Robustesse de l’assise théorique: Elle repose sur des théorèmes asymptotiques rigoureux et éprouvés, offrant un cadre statistique hautement validé par la communauté scientifique.
Signification hydrologique directe: L’interprétation physique est concrète et intuitive pour les ingénieurs et les gestionnaires du risque, facilitant la communication des résultats (notion de crue annuelle).
Standardisation internationale: Elle est largement adoptée dans les guides techniques et les études d’impact hydro-climatiques à travers le monde (parfaite comparabilité des résultats avec la littérature existante).
Limites
Perte importante d’information: En ne retenant qu’une seule valeur par an, elle censure et ignore toutes les autres crues majeures secondaires survenues au cours de la même année.
Échantillon réduit et forte incertitude: La taille de la série finale est limitée au nombre d’années d’observation. Cela fragilise l’extrapolation des crues rares (périodes de retour à 50 ou 100 ans) et élargit les intervalles de confiance.
Sensibilité aux années sèches: Lors d’une année de faible hydraulicité, le maximum extrait reste numériquement bas. L’introduire dans l’échantillon intègre du bruit et fausse la queue de la distribution.
Arbitraire du découpage temporel: Le choix de la fenêtre du bloc (année civile ou hydrologique) est figé. Si un événement majeur se produit à cheval sur deux blocs, sa magnitude peut être artificiellement divisée.
Incapacité à gérer le regroupement (Clustering): La méthode ne peut pas modéliser la succession rapprochée de plusieurs événements extrêmes au cours d’une même saison, un aspect pourtant critique pour la gestion des risques.
Méthode Peaks Over Threshold (POT)
Principe
La méthode des dépassements de seuil, connue sous le nom de Peaks Over Threshold (POT), est une approche de la théorie des valeurs extrêmes qui consiste à sélectionner toutes les observations dépassant un seuil élevé prédéfini. Contrairement à la méthode des maxima par blocs, qui ne conserve qu’un seul maximum par période, la méthode POT permet de retenir plusieurs événements extrêmes au sein d’une même année.
Contrairement à la méthode des maxima par blocs, qui ne conserve qu’un seul maximum par période, la méthode POT permet de retenir plusieurs événements extrêmes au sein d’une même année. Par ailleurs, les événements extrêmes sélectionnés doivent être indépendants. Il est alors nécessaire d’utiliser des techniques de declustering afin de conserver uniquement les événements indépendants.
Avantages
Optimisation et richesse de l’information : Elle exploite pleinement la chronique chronologique en capturant tous les événements extrêmes réels, sans subir la censure d’un découpage annuel rigide.
Flexibilité temporelle : Elle permet de conserver plusieurs crues majeures indépendantes au cours d’une même année, tout en excluant totalement les valeurs basses liées aux périodes de sécheresse ou d’hydraulicité normale.
Élargissement de l’échantillon : En augmentant potentiellement le nombre d’observations de crise par rapport aux maxima annuels, elle offre une base statistique beaucoup plus dense et représentative.
Précision accrue des estimations : L’apport de données supplémentaires améliore significativement la robustesse des ajustements statistiques et réduit les marges d’erreur.
Fiabilité sur les longues périodes de retour : En modélisant plus fidèlement la queue de la distribution, elle permet une meilleure extrapolation de la magnitude des événements rares (comme les crues cinquantenaires ou centenaires).
Limites
Délicatesse du choix du seuil: La sélection du seuil optimal reste subjective et empirique. Un seuil trop bas intègre des données ordinaires (violation de la théorie), tandis qu’un seuil trop élevé réduit drastiquement la taille de l’échantillon et accroît l’incertitude.
Dépendance statistique des observations: Lors d’un même épisode de crue, plusieurs débits journaliers consécutifs dépassent fréquemment le seuil. Ces valeurs successives étant fortement corrélées entre elles, elles violent l’hypothèse fondamentale d’indépendance (i.i.d.).
Nécessité de procédures de filtrage: Pour garantir l’indépendance des événements, il est obligatoire d’appliquer des algorithmes supplémentaires et contraignants de dégroupement (declustering) afin d’isoler uniquement le pic principal de chaque crue.
Complexité de mise en œuvre: En raison du choix du seuil et du traitement de la dépendance des données, sa manipulation pratique et statistique est nettement plus lourde et complexe que celle de la méthode des maxima annuels.
2.4.3 Comment ajuster un modèle fréquentiel ?
L’ajustement d’un modèle fréquentiel repose sur des méthodes qui permettent de représenter statistiquement ou fonctionnellement les variables hydrologiques (précipitations, débits, volume de crue, etc.) et de prédire leur comportement à partir de données historiques.
Plusieurs méthodes d’ajustement peuvent être utilisées en analyse fréquentielle. Les plus courantes sont la méthode des moments, la méthode du maximum de vraisemblance et la méthode des L-moments.
La méthode des moments ordinaires :
Elle consiste à égaliser les caractéristiques théoriques de la loi (sa moyenne, sa variance,etc) avec les caractéristiques calculées directement sur l’échantillon de données.
La méthode du Maximum de Vraisemblance (MLE) :
Elle s’appuie sur une fonction de calcul qui recherche les paramètres de la loi rendant l’observation de l’échantillon réel la plus probable possible.
La méthode des L-moments
Elle est une alternative robuste à la méthode des moments classiques et repose sur des combinaisons linéaires des statistiques d’ordre plutôt que sur les moments traditionnels.