Um die Wettersituation an einem bestimmten Ort ausreichend zu beschreiben werden verschiedene Datenquellen benötigt.
Die von meteoblue verwendeten Daten kommen von verschiedenen nationalen Wetterdiensten sowie weiteren Quellen. Anfangsbedingungen werden in der Regel mit Hilfe von Messungen und Beobachtungen bestimmt, die die wichtigsten Orte und Wettervariablen abdecken, jedoch nur einen Bruchteil der Erdoberfläche und Wettervorgänge beschreiben. Diese Messungen werden dann in Modellsimulationen (Datenassimilation) einbezogen, um den Wetterzustand über den gesamten Globus zu bestimmen. Nach dem Modelllauf können die Ausgabedaten durch Messungen und Beobachtungsdaten validiert und korrigiert werden, wobei verschiedene Nachbearbeitungstechniken wie Herunterskalierung, Statistik, maschinelles Lernen / künstliche Intelligenz und Nowcasting verwendet werden.
Um das höchste Genauigkeitsniveau zu erreichen, müssen diese unterschiedlichen Datenquellen auf intelligente Weise kombiniert werden, was einen westentlichen Wertbeitrag von meteoblue darstellt. Das Angebot wird durch zusätzliche geografische Informationen wie Ortsnamen, Bevölkerungsdichte, Vegetationszustand und Bodeneigenschaften ergänzt. Dies macht meteoblue zu einem einzigartigen Angebot für private und berufliche Anwendungen.
Die Hauptdatenquellen sind:
- Wettersimulationsdaten - Dies sind
Daten, die durch numerische Wettermodelle oder Reanalyse erhalten werden:
- meteoblue-Modelle - verfügbar für History & Forecast
- Modelle von Drittanbietern - verfügbar für History & Forecast
- Reanalyse-Datensätze - nur für History verfügbar
- Beobachtungen - Dies sind Datensätze, die durch
manuelle oder mechanische Erfassung erhalten und in Wettervariablen umgewandelt werden:
- Satellitenbilder - nur für Nowcast verfügbar
- Strahlung / Wolken - verfügbar für History & Nowcast
- Niederschlag - verfügbar für History & Nowcast
- Vegetation - nur für History verfügbar
- Benutzer-Beobachtungen
- Messungen - Dies sind Daten, welche von
Instrumenten, die Wettervariablen messen, erfasst werden:
- Temperatur - verfügbar für History & Nowcast
- Niederschlag - nur für die History verfügbar
- Wind - verfügbar für History & Nowcast
- Strahlung - nur für die History verfügbar
- Nachbearbeitung - Dies sind technische Ansätze
um Simulationen mit Messungen und Beobachtungen zu kombinieren:
- Nowcasting - Echtzeitkorrektur der Vorhersage
- Statistik (MOS) - Statistische Herunterskalierung von Messungen
- Maschinelles Lernen (mLM) - künstliche Intelligenz welche das beste Wettermodell findet
- Geografische Daten - Dies sind
Ortsattribute, die statisch sind (für einen bestimmten Zeitpunkt)
- Ortsnamen - Über 8 Millionen Ortsnamen verfügbar
- Bevölkerungsdichte - weltweite Bevölkerungsverteilung
- Topographie - digitales Höhenmodell in hoher Auflösung
- Landnutzung - weltweite Landnutzungsverteilung
- Bodeneigenschaften - weltweite Bodeneigenschaften
- Luftqualität - verfügbar für History & Forecast
- Ozeanmodelle - verfügbar für History & Forecast
Weitere Informationen zu jeder Datenquelle finden Sie indem Sie auf den Link zur jeweiligen Seite klicken.
Eigenschaften der unterschiedlichen Wetterdatenquellen
Im Allgemeinen bietet meteoblue standardmässig den Datensatz mit der höchsten Genauigkeit (für Daten, die über den meteoblue-Webauftritt, die API oder history+ verfügbar sind) an. Für einige professionelle Zwecke ist jedoch die richtige Wahl der Wetterdaten entscheidend für den Erfolg des Projekts. Um diese Entscheidung richtig treffen zu können müssen viele verschiedene Aspekte berücksichtigt werden.
Für lange Zeitreihen von mehr als 10 Jahren sind NEMSGLOBAL und ERA5 die einzigen verfügbaren konsistenten Datenreihen, die alle Basisvariablen enthalten. Beide Modelle haben die gleiche räumliche (30 km) und zeitliche (1 h) Auflösung. ERA5-Daten haben den Vorteil, dass sie mit lokalen Messungen neu berechnet werden. Dies bedeutet jedoch keine allgemein höhere Genauigkeit (insbesondere an Orten wo keine Messstationen vorhanden sind), und Daten sind noch nicht vor 2000 verfügbar. Außerdem werden ERA5-Daten nur unregelmäßig und in der Regel mit einigen Monaten Verspätung aktualisiert, wohingegen NEMSGLOBAL lückenlose Datensätze von 1984 bis 7 Tage im Voraus bietet, für jeden Punkt der Welt. Die Modellauswahl hängt von den Verwendungskriterien ab. Grundsätzlich ist es empfehlenswert beide Modelle zu betrachten, und aus den Unterschieden zwischen den beiden Modellen eine Abschätzung der Unsicherheit abzuleiten.
Speziell für Niederschlagsdaten stehen die Niederschlagsbeobachtungs-Datensätze CMORPH und CHIRPS2 zur Verfügung, auch für längere Zeitreihen.
Für die letzten 1 - 5 Jahre sind viele weitere Wettermodelle mit einer höheren räumlichen Auflösung verfügbar. Grundsätzlich sollten immer möglichst viele Modelle betrachtet werden, um die Unsicherheit besser einschätzen zu können. Wenn lokale Messungen verfügbar sind werden einige Modelle, abhängig von ihrer Leistung, aufgrund eines Vergleichs zu den Messungen, verworfen. Leider gibt es nicht viele allgemeingültige Regeln für die Genauigkeit der verschiedenen Modelle - Das beste Modell oder die beste Modellkombination muss von Fall zu Fall eruiert werden. Einige allgemeingültige Punkte:
- Eine höhere Auflösung bedeutet NICHT notwendigerweise eine höhere Genauigkeit. Sie bedeutet hauptsächlich mehr räumliche Details. Dies gilt insbesondere für die Niederschlagsgenauigkeit, die bei höherer Auflösung (unter 5 km) abnehmen kann.
- Die Verwendung von mehr als einem Modell und Vergleichsbetrachtungen sind vorteilhaft
- Extreme Ereignisse - wie Stürme, Gewitter, sehr starke Winde - sind äußerst unvorhersehbar und werden in keinen Simulations- oder Reanalyse-Daten genau gesehen
- Lokale mikroklimatische Details - wie das wärmere Klima an einem Südhang - können nicht reproduziert werden.
- Räumliche und zeitliche Aggregationen sind an einem bestimmten Ort genauer als stündliche Daten
Einen Überblick über die Vorteile und Einschränkungen der unterschiedlichen Wetterdatenquellen bietet die folgende Tabelle:
Wetterdatenverfügbarkeit
Wie oben erwähnt, haben die Datenquellen unterschiedliche zeitliche und räumliche Verfügbarkeiten. Für die Verfügbarkeit können wir drei verschiedene Dimensionen unterscheiden:
- Zeitliche Verfügbarkeit (verfügbarer Zeitbereich und Zeitauflösung)
- Räumliche Verfügbarkeit (Auflösung und verfügbare Region)
- Aktualisierungsfrequenz (automatisierte Updates und Verzögerung)
Die beste Modellverfügbarkeit bietet NEMSGLOBAL, das seit 1984 für alle Zeitbereiche verfügbar ist und täglich automatisch aktualisiert wird. Dies bedeutet, dass es seit dem 01.01.1984 bis 7 Tage im Voraus verfügbar ist. ERA5 wird in der Zukunft für den gleichen Zeitraum verfügbar sein, ist heute allerdings nur von 2000 - 2017 verfügbar. Die anderen Wetterdatenquellen sind unterschiedlich verfügbar, meist seit ein paar Jahren bis 7 Tage in die Zukunft. Bitte beachten Sie, dass Beobachtungsdaten Rohdaten von Drittanbietern oder offiziellen Netzwerken sind. Somit können sie erhebliche Datenlücken aufweisen.
Die folgende Abbildung gibt einen Überblick über die Verfügbarkeit der wichtigsten Datenquellen: