avec les compléments apportés par Carine Chaléon, DRIEAT Ile de France, ainsi que Stéphanie Pitsch et Jean-Nicolas Audouy, SCHAPI.
Relectures de Dominique Marbouty, Bernard Pouyaud et Yves Dandonneau.
En décembre 2023, nous proposions une « brève » sur l’ouverture à tous des archives météorologiques de Meteo-France.
Les archives hydrologiques des cours d’eau français étaient pour leur part disponibles depuis les années 2000 sous la forme de hauteurs d’eau ou de débits, mais avec une limitation en volume. Depuis juin 2024, il est possible de les récupérer dans leur totalité.
Dès le début des années 2000, la banque Hydro, devenue Hydro Portail, a permis de localiser les stations hydrométriques françaises, d’identifier les variables disponibles et de visualiser / importer (en clair sous la forme d’un tableau csv) une série temporelle limitée à 500 000 enregistrements. Depuis 2020, on peut aussi obtenir les données instantanées des 30 derniers jours via une API (interface de programmation d’application) Hubeau, ainsi que les moyennes journalières et mensuelles sur l’ensemble des chroniques disponibles. D’autres métadonnées sont accessibles par le site Sandre, plus ancien. Noter que la fluidité de ces sites est loin d’être optimale.
Depuis juin 2024 on a la possibilité d’importer la totalité de la base de données hydrométriques françaises, incluant l’outre-mer, sans limitation du nombre de stations ou du nombre d’enregistrements. La procédure de récupération décrite ci-après est relativement complexe.
Elle s’opère à partir d’un fichier compressé "stations.tar" (4Gb) que l’on récupère avec un mot de passe explicitement indiqué sur le site de data.eaufrance. Après déstockage du fichier tar, on obtient d’une part un fichier en clair (tableau csv) qui inventorie la liste de toutes les stations françaises avec des données, et d’autre part un répertoire de ces stations, lui-même divisé en sous répertoires annuels dans lesquels les données sont archivées sous une forme compressée gz.
[Pourquoi introduire un mot de passe qui n’en est pas vraiment un puisqu’il est donné ? C’est aussi un peu bizarre d’utiliser deux algorithmes d’intégration/compression distincts pour des données en accès libre, d’autant plus que, s’ils sont bien connus des usagers de Linux, tar (un intégrateur) et gz un compresseur), sont largement ignorés des communautés majoritaires Windows ou MacOs !].
Pour accéder aux informations d’identification de stations et aux méta-données de ces dernières, on peut utiliser le fichier d’inventaire mentionné ci-dessus, mais on gagnera du temps en utilisant les formulaires du référentiel Hydro Portail. A partir du (ou des) code(s) de station, on accède aux données qui nous intéressent.
Si on peut se féliciter de l’ouverture de ces données à tous, on est en droit toutefois de s’interroger sur la complexité de la procédure, quelque soit l’accès utilisé ! De plus, alors que Meteo-France assure une mise à jour quasi quotidienne de sa base de données, celle de data.eaufrance ne devrait être renouvelée qu’avec une fréquence de 6 mois, selon les dispositions actuelles.
A titre d’exemple, je propose ci-dessous un affichage des données de trois grand fleuves extraites et traitées avec la librairie htsr dans laquelle j’ai inclus une fonction d’extraction de la base de données data.eaufrance.
On peut par exemple observer sur de telles longues chroniques :
(1) la crue historique de la Seine à Paris durant l’hiver 1910,
(2) une variation curieuse des débits d’étiage du Rhône à Tarascon (est-ce un effet des nombreux travaux d’aménagement ou bien des problèmes d’étalonnage ?),
ou (3) une fréquence plutôt irrégulière des fortes crues de la Garonne à Portet (une dizaine de km à l’amont de Toulouse).
.............