Afin de décrire les situations météorologiques à un lieu donné de manière appropriée, nous avons besoin de plusieurs sources de données.
Les données utilisées par meteoblue proviennent de nombreux centres météorologiques nationaux, ainsi que d'autres sources complémentaires. Les conditions initiales sont habituellement déterminées grâce aux mesures et aux observations qui recouvrent les lieux et les variables météorologiques les plus importantes, mais elles décrivent uniquement une fraction de la surface de la Terre et des processus météorologiques. Ces mesures sont ensuite incorporées dans les simulations du modèle (assimilation de données) pour déterminer l'état du temps sur l'ensemble du globe. Après l'utilisation du modèle, les données de sorties peuvent être validées et corrigées grâce à des données de mesure et d'observation, en utilisant des techniques de post-traitement comme la réduction d'échelle, les statistiques, l'apprentissage automatique (machine learning) et les prévisions immédiates (nowcasting).
Afin d'obtenir le plus haut niveau de précision, il est nécessaire de combiner ces différentes sources de données d'une manière intelligente, ce qui représente la valeur clef offerte par meteoblue. L'offre est complétée par des informations géographiques additionnelles, tels que des noms de lieux, la densité de population, la santé de la végétation, ce qui fait de meteoblue une offre unique pour des applications privées et professionnelles.
Les principales sources de données:
- Données de simulation météo
- Ces données sont obtenues par des modèles météo numériques ou de ré-analyse:
- modèles meteoblue - disponible pour history & forecast
- Modèle par une tierce partie - disponible pour history & forceast
- Données de ré-analyse - disponible pour history seulement
- Observations - Ce sont des archives
obtenues par des capteurs manuels ou mécaniques et transformés en variables météo:
- Images satellite - disponible pour nowcast seulement
- Radiation / nuages - disponibles pour history & nowcast
- Précipitations - disponibles pour history & nowcast
- Végétation - disponible pour history only
- Observation des utilisateurs
- Mesures - Ce sont des données obtenues par des
instruments qui mesurent les variables météo:
- Température - disponible pour history & nowcast
- Précipitations - disponibles pour history seulement
- Vent - disponible pour history & nowcast
- Radiation - disponible pour history seulement
- Post-processing - Ce sont des approches
techniques qui combinent des simulations avec des mesures et des observations:
- Nowcasting - correction en temps réel des prévisions
- Statistics (MOS) - réduction d'échelle statistique sur les mesures
- Machine learning (mLM) - intelligence artificielle qui trouve le meilleur modèle météo
- Données géographiques - Ce sont
des attributs de lieux qui sont statiques (d'une période donnée)
- Noms de lieux - Plus de 8 millions de noms de lieux disponibles
- Densité de population - distribution de la population dans le monde entier
- Topographie - modèle numérique d'élévation de haute résolution
- Utilisation des sols - distribution d'utilisation du sol dans le monde entier
- Caractéristiques des sols - propriétés des sols dans le monde entier
- Qualité de l'air - disponible pour history & forecast
- Modèles océaniques - disponibles pour history & forecast
Vous trouverez de plus amples détails pour chaque source de données en cliquant sur le liens de la page correspondante.
Caractéristiques des données météo provenant de diverses sources
En règle générale, meteoblue offre par défaut l'ensemble de données ayant la plus grande précision (pour les données disponibles sur le site web de meteoblue, l'API ou history +). Néanmoins, à des fins professionnelles, le choix judicieux des données météorologiques est crucial pour la réussite du projet. Pour faire ce choix avec succès, de nombreux aspects doivent être pris en compte.
Pour les longues séries chronologiques de plus de 10 ans, les seules séries de données cohérentes disponibles comprenant toutes les variables de base sont NEMSGLOBAL et ERA5. Les deux modèles ont la même résolution spatiale (30 km) et temporelle (1 h). Les données ERA5 ont l'avantage d'être recalculées avec des mesures locales. Cependant, cela n’accorde pas une précision généralement supérieure (en particulier dans les endroits où aucune station de mesure n’est disponible) et les données ne sont pas encore disponibles avant 2000. De plus, les données ERA5 ne sont mises à jour que de façon irrégulière et généralement avec un retard de plusieurs mois, tandis que NEMSGLOBAL produit des ensembles de données homogènes de 1984 à 7 jours jusqu'à 7 jours à l'avance, pour chaque point de la planète. Le choix du modèle dépend des critères d'utilisation. En règle générale, il est recommandé d’observer les deux modèles afin d’obtenir une estimation de l’incertitude des différences entre les deux modèles.
Quant aux données de précipitations spécifiquement, les données d'observation de précipitations CMOPRH et CHIRPS2 sont disponibles également pour de longues séries temporelles.
Au cours des 1 à 5 dernières années, de nombreux autres modèles météorologiques sont disponibles, avec une résolution spatiale plus élevée. En règle générale, il convient d’examiner autant de modèles que possible pour mieux comprendre l’incertitude. Si des mesures locales sont disponibles, certains modèles peuvent être ignorés, en fonction de leurs performances par rapport aux mesures. Malheureusement, il n’existe pas beaucoup de règles universelles concernant la précision des différents modèles - Le meilleur modèle ou la meilleure combinaison de modèles doit être évalué au cas par cas. Quelques points généraux:
- Une résolution plus élevée ne signifie PAS nécessairement une plus grande précision. Cela signifie principalement plus de détails spatiaux. Cela est particulièrement vrai pour la précision des précipitations, qui pourrait diminuer à une résolution plus élevée (inférieure à 5 km)
- L'utilisation de plusieurs modèles et la comparaison sont bénéfiques
- Les événements extrêmes - comme les tempêtes, les orages, les vents très violents - sont hautement imprévisibles et ne seront pas observés avec précision dans aucune donnée de simulation ou de ré-analyse
- Les détails microclimatiques locaux - comme le climat plus chaud sur une pente exposée au sud - ne peuvent pas être reproduits.
- Les agrégations spatiales et temporelles sont plus précises que les données horaires d'un lieu spécifique
Un aperçu des avantages et des limites des diverses sources de données météo est donné dans le tableau ci-dessous:
Disponibilité des données météo
Comme cité plus haut, les sources de données ont différentes disponibilités temporelles et spatiales. Quant à la disponibilité, nous pouvons différencier trois différentes dimensions:
- Disponibilité temporelle (intervalle de temps et résolution spatiale disponibles)
- Disponibilité spatiale (résolution et région disponible)
- Fréquence des mises à jour (mise à jour automatisées et retards)
NEMSGLOBAL offre une disponibilité optimale des modèles, qui est disponible pour toutes les plages horaires depuis 1984 et qui est mise à jour automatiquement tous les jours. Cela signifie qu'il est disponible à partir du 01.01.1984 jusqu'à 7 jours à l'avance. ERA5 sera disponible pour le même intervalle de temps, mais aujourd'hui, il n'est disponible que de 2000 à 2017. Les autres sources de données météorologiques sont disponibles différemment pour certaines années auparavant, jusqu'à sept jours plus tard. Veuillez noter que les données d'observation sont des données brutes provenant de fournisseurs tiers ou de réseaux officiels. Ainsi, ils peuvent montrer des lacunes substantielles dans les données.
Le graphique ci-dessous donne un aperçu des sources de données les plus importantes: