Lufttemperatur

  • meteoblue ist einer der besten Wettervorhersage-Anbieter der 24-Stunden-Lufttemperaturvorhersage.
  • meteoblue weist die höchste 12-Stunden-Vorhersagegenauigkeit auf.
  • Das meteoblue Learning MultiModel (mLM), das für die operative Temperaturvorhersage verwendet wird, schneidet am besten ab, gefolgt von Standard-MOS und den Rohmodellen.
  • Die mLM-Vorhersage übertrifft die Vorhersage des Reanalysemodells ERA5, das von allen anderen ausgewählten numerischen Rohwettermodellen das Beste ist.
  • Auf globaler Ebene haben die Temperaturvorhersagen die höchste Treffsicherheit auf kleinen ozeanischen Inseln und entlang eisfreier Küsten.
  • Die Treffsicherheit nimmt mit zunehmend komplexer Topografie und zunehmender Entfernung vom Meer ab.

Die Lufttemperatur ist eine der wichtigsten Variablen in der Meteorologie, und die Möglichkeit, diese vorherzusagen, ist von großer Bedeutung. In Zeiten des Klimawandels steigen die Temperaturen weltweit an. Die Zahl der Hitzewellen nimmt zu, was erhebliche Folgen für die landwirtschaftliche Produktion, die Stadtbevölkerung und viele andere Phänomene haben kann. Für solche Anwendungsfälle ist eine genaue Vorhersage dieser Wettervariablen von zentraler Bedeutung.

Auf dieser Seite wird ein Überblick über Verifikationsstudien gegeben, in denen die Vorhersagegenauigkeit der Temperatur 2 m über Grund untersucht wurde. Es wurden mehrere Verifikationsstudien durchgeführt, in denen die Genauigkeit verschiedener Rohmodellvorhersagen, Wetterdienstleister, verschiedener Modellansätze und stündliche Messungen verglichen wurden. Darüber hinaus wurde die regionale Variabilität der Modellfehler untersucht. Indem wir eine Zusammenfassung unserer Ergebnisse anbieten, wollen wir sicherstellen, dass unsere Kunden die Temperaturvorhersage und ihre Aspekte bezüglich der Genauigkeit vollständig nachvollziehen können.

Vergleich verschiedener Modellansätze (2017)

In dieser Studie wird die Genauigkeit verschiedener Modellansätze verglichen - Vorhersagedaten von 5 verschiedenen Rohwettermodellen, Vorhersagedaten, die mit dem meteoblue Learning MultiModel (mLM) und Model Output Statistics (MOS) berechnet wurden, und das Reanalysemodell ERA5. Diese Vorhersagen wurden anhand von stündlichen Messungen von mehr als 11'000 Beobachtungsstellen weltweit überprüft. Die Analyse wurde für 2017 und teilweise für September - Oktober 2018 durchgeführt.

Verschiedene Modellansätze und deren MAE berechnet mit mehr als 11'000 stündlichen Messungen im Jahr 2017.
Modellansatz MAE [K]
meteoblue Learning MultiModel (mLM) 1.2 K
Model Output Statistics (MOS) 1.5 K
Reanalysemodell ERA5 1.5 K
5 verschiedene Wettervorhersagemodelle (Roh) 1.7 - 2.2 K

Die folgende Tabelle zeigt den mittleren absoluten Fehler (MAE) in Kelvin für die verschiedenen Modellansätze. Der mLM-Ansatz weist den niedrigsten MAE auf, gefolgt von MOS und ERA5. Diese Modellansätze schneiden besser ab als die Rohmodelle.

Darüber hinaus ist zu beobachten, dass die Modellgenauigkeit in der Regel mit zunehmender Anzahl von Vorhersagestunden abnimmt (siehe Abbildung unten). Die Genauigkeit der 2-m-Lufttemperatur bei Verwendung des mLM liegt innerhalb von 1,2 K für die 24-Stunden-Vorhersage und innerhalb von 2,0 K für die 6-Tage-Vorhersage. Auf der Grundlage der obigen Tabelle bedeutet dies, dass die 24-Stunden-Vorhersage des mLM genauso gut ist wie die 6-Tage-Vorhersage der Rohmodellvorhersagen.

MAE [K] in Funktion der Vorhersagestunden für das mLM von einzelnen Analysetagen und im Durchschnitt (schwarz). Zusätzlich wird der 24-Stunden-Vorhersagefehler für MOS (blau) und die Rohmodelle (rot) gezeigt.

Die räumliche Verteilung der Modellfehler (siehe Karten unten) unterstreicht die Tatsache, dass das mLM das beste historische Reanalysemodell ERA5 übertrifft. Im Allgemeinen schneiden Rohmodelle wie GFS schlechter ab als Modellansätze, die auf Post-Processing-Methoden basieren, bei denen lokale stündlichen Messungen berücksichtigt werden.

MAE [K] der 2-m-Lufttemperatur der ERA5-Reanalyse (nicht als Vorhersage verfügbar), die für die langfristige historische Analyse verwendet wurde.
Die Verifikation basiert auf allen stündlichen Daten des Jahres 2017. MAE [K] der 2-m-Lufttemperatur des meteoblue Learning MultiModel (mLM), das für die operationelle Wettervorhersage verwendet wird. Die Verifikation basiert auf allen stündlichen Daten von September und Oktober 2018. MAE [K] der 2-m-Lufttemperatur des vom GFS berechneten ‘eigenständigen' Modelloutputs. Die Verifikation basiert auf allen stündlichen Daten des Jahres 2017.

Vergleich verschiedener globaler Modelle (2018)

Eine zusätzliche Verifikationsstudie zur Bewertung der Genauigkeit verschiedener globaler Modelle wurde in einer eigenen Bachelorarbeit (Fessler, 2019) durchgeführt. Die 24-stündigen 2-m-Lufttemperaturvorhersagen des Jahres 2018 der Vorhersagemodelle NEMS, GFS05, MFGLOBAL, GEM und ICON wurden mit weltweit verteilten stündlichen Messungen von mehr als 8000 Stationen der WMO (World Meteorological Organization) und GDAS (Global Data Assimilation System) der NOAA (National Oceanic and Atmospheric Administration) verglichen. Darüber hinaus wurden historische Daten des Reanalysemodells ERA5 einbezogen, in denen verschiedene statistische Fehlermetriken berechnet und verglichen wurden. Außerdem wurden die globalen Muster der Genauigkeitsvariabilität untersucht.

Vergleich der Rohmodelle

MAE [K] und MBE [K] von fünf numerischen Wettervorhersagemodellen und einem Reanalysemodell für das gesamte Jahr 2018 basierend auf mehr als 8'000 WMO-Stationen.
Modell MAE [K] MBE [K]
ERA5 1.5 0.2
NEMSGLOBAL 2.2 0.1
GFS05 2.3 0.2
MFGLOBAL 2.3 -0.1
GEM 2.4 -0.7
ICON 2.0 -0.1

Ein einfacher Fehlervergleich ermöglicht die Bewertung der Genauigkeit zwischen verschiedenen Modellen. Die folgenden Ergebnisse (siehe Tabelle unten) bestätigen die Erkenntnisse der vorherigen Studie. Das Reanalysemodell ERA5 übertrifft mit einem MAE von 1,5 K alle in dieser Studie untersuchten Rohmodelle, gefolgt von ICON und NEMSGLOBAL. ERA5, NEMSGLOBAL und GFS05 neigen dazu, die Temperatur höher vorherzusagen, als sie tatsächlich ist, während MFGLOBAL, GEM und ICON die Temperatur niedriger vorhersagen als gemessen.

Bei allen Wetterstationen schneidet ERA5 am besten ab und hat den niedrigsten MAE-Wert (siehe Abbildung unten).

MAE [K] für fünf numerische Wettervorhersagemodelle und ein Reanalysemodell für das gesamte Jahr 2018 basierend auf mehr als 8'000 WMO-Stationen.

Räumliche Analyse

Die räumliche Verteilung der MAE für die Reanalysemodelle ERA5 und NEMS wird in den folgenden Weltkarten dargestellt. Um Überschneidungen von Punkten verschiedener Stationen zu vermeiden, wurde der Globus in Modellgitterzellen mit einer horizontalen Auflösung von 2° unterteilt. Mit anderen Worten, die MAE für alle Stationen innerhalb einer Gitterzelle wurden zunächst zusammengeführt und dann in der der Gitterfeldes eingezeichnet. Die Verteilung des Modellfehlers zwischen beiden Modellen ist vergleichbar, allerdings ist zu beachten, dass NEMS einen verschobenen Fehlerbereich aufweist. Im Allgemeinen können wir höhere Fehler in den Rocky Mountains, Indien, China und Ostrussland beobachten. Hohe Genauigkeit kann in Nordeuropa, Nordamerika, Australien, Westrussland und Afrika festgestellt werden.

Räumliche Verteilung des MAE [K] für NEMS (oben) und ERA5 (unten), berechnet für stündliche Messungen des Jahres 2018 von über 8000 Wetterstationen weltweit.

Die Vorhersage der Lufttemperatur hat die höchste Genauigkeit auf kleinen ozeanischen Inseln und entlang eisfreier Küsten. In diesen Regionen wird die Lufttemperatur stark von der Temperatur der Meeresoberfläche beeinflusst. Die hohe Genauigkeit und Treffsicherheit über Europa und Nordamerika lässt sich dadurch erklären, dass die Wettervorhersagemodelle in diesen Regionen entwickelt wurden. Eine weitere erwähnenswerte (und in den Studien nicht behandelte) Tatsache ist, dass die Lufttemperatur im Winter der nördlichen Hemisphäre in der Regel schlechter simuliert wird als im Sommer. Außerdem zeigen die Ergebnisse, dass die Genauigkeit in Regionen mit komplexer Topografie wie den Rocky Mountains, dem Himalaya oder den Anden und mit zunehmender Entfernung vom Meer abnimmt. Daher werden kontinentale und hoch gelegene Regionen in der Regel schlechter simuliert als maritime und niedrig gelegene Regionen.

Vergleich der Anbieter (2021)

In dieser Studie wurde die Vorhersagegenauigeit verschiedener Wetteranbieter mit der meteoblue Vorhersage verglichen. Die Genauigkeit dieser Vorhersagen wurde mit 475 stündlichen METAR-Messungen weltweit verifiziert. Für die Analyse wurde die stündliche 12 - 35h Vorhersage, die um 12:00 UTC erstellt wurde, verwendet. Diese Verifikation wurde für das Jahr 2021 durchgeführt. Die folgende Tabelle zeigt, dass die meteoblue Vorhersage unter den drei besten liegt und die Lufttemperatur nur geringfügig unterschätzt.

MAE [K] und MBE [K] für die meteoblue Vorhersage und Vorhersagen verschiedener anderer Wetteranbieter für über 400 Stationen weltweit.
Anbieter MAE [°C] MBE [°C]
2 meteoblue 1.29 -0.16
1 Anbieter_D 1.26 -0.02
3 Anbieter_F 1.48 -0.21
Anbieter_C 1.61 -0.52
Anbieter_G 1.73 -0.03
Anbieter_B 1.71 -0.38
Anbieter_H 2.03 -0.23

Der Vergleich der MAE für verschiedene Vorhersagezeithorizonte (siehe Tabelle unten) zeigt die typische Abnahme der Vorhersagegenauigkeit mit zunehmenden Vorhersagezeiträumen (was bereits im obigen Abschnitt erwähnt wurde). Für die 12-Stunden-Vorhersage ist meteoblue am genauesten. Für die Vorhersagetage 1 bis 3 ist meteoblue am zweitgenauesten.

MAE [K] der verschiedenen Anbieter für verschiedene Vorhersagehorizonte und stündlichen Messungen des Jahres 2021 von über 400 Stationen weltweit.
Anbieter Tag 0
(0-11 h)
Tag 1
(12-35 h)
Tag 2
(36-47 h)
Tag 3
(48-71 h)
meteoblue 0.71 1 1.29 2 1.37 2 1.44 2
Anbieter_D 1.16 3 1.26 1 1.34 1 1.43 1
Anbieter_A 1.28 3 1.24 - -
Anbieter_F 1.36 1.48 1.56 1.65
Anbieter_C 1.54 1.61 1.68 1.92
Anbieter_G 1.56 1.73 1.77 -
Anbieter_B 1.68 1.71 - -
Anbieter_H 1.95 2.03 2.11 2.29