Earth System Foundation Model: KI sagt Taifune voraus, sogar mit lückenhaften Daten

13. Mai
3 Min. Lesezeit

Mai 2026: Forschende der ETH Zürich veröffentlichen ein neues KI-Modell für Wetter und Klima. Um zu beweisen, dass es tatsächlich funktioniert, stellten sie dem Modell eine Aufgabe: „Hier sind die Wetterdaten vom 21. Juli 2023. Was passiert in den nächsten Tagen?"

Das ist ja einfach, könnte man meinen, das ist schließlich schon fast drei Jahre her! Aber ganz so einfach war es dann doch nicht. Der Clou: Das Modell wurde nur mit Daten bis zum Jahr 2020 trainiert. Alles danach war ihm fremd. Trotzdem lieferte es eine ziemlich treffsichere Prognose: Supertaifun Doksuri, Windstärke, Position und Verlauf. Die Forschenden verglichen anschließend mit dem, was 2023 tatsächlich passierte und das Ergebnis war erstaunlich genau.

Was Doksuri so besonders macht

Im Juli 2023 verstärkte sich der Tropensturm Doksuri über dem Westpazifik zu einem Supertaifun. Winde rissen Dächer ab, sintflutartige Regenfälle überfluteten Küstenregionen in China und auf den Philippinen.

Für KI-Modelle sind solche Extremereignisse der härteste Test überhaupt. Denn extreme Stürme sind selten – die KI hat deshalb nur wenige vergleichbare Beispiele in ihren Trainingsdaten. Dennoch schätzte das „Earth System Foundation Model" (ESFM) die maximale Windgeschwindigkeit über mehrere Tage korrekt ein. Es erkannte sogar, wo sich das Taifunauge befand.

Puzzeln ohne alle Teile

Was dieses KI-System von anderen abhebt: Es arbeitet gezielt mit unvollständigen Daten. In der Realität fehlen fast immer Messwerte. Satelliten erfassen nur schmale Streifen der Erde. Bodenstationen sind ungleich verteilt – über den Ozeanen klaffen riesige Lücken.

Frühere KI-Modelle brauchten stets lückenlose Datensätze. ESFM erkennt stattdessen statistische Zusammenhänge zwischen Temperatur, Luftdruck, Feuchtigkeit und Windgeschwindigkeit. Fehlt eine Variable, leitet das Modell sie aus den übrigen ab – und bewahrt dabei physikalische Gesetzmäßigkeiten wie das Gleichgewicht zwischen Druckgefälle und Windstärke.

25 Jahre in einem Rutsch

Noch ein Kunststück: ESFM simuliert das Erdklima stabil über 25 Jahre hinweg. Die Forschenden starteten das Modell im Januar 1959 und ließen es autonom bis 1984 rechnen. Die saisonalen Temperaturschwankungen blieben physikalisch plausibel. Keine Ausreißer, keine Instabilität. Für die Klimaforschung eröffnet das neue Möglichkeiten, denn solche langen Simulationen kosteten bisher enorme Rechenkapazitäten.

Von Satelliten bis Wetterstationen – alles in einem Modell

Das ESFM vereint erstmals grob aufgelöste Klimamodell-Daten, feine Satellitenbilder und punktuelle Stationsmessungen in einem einzigen System. Es verarbeitet rund 12.000 Wetterstationen weltweit und nutzt dafür knapp 115 Millionen Parameter. Zum Vergleich: Ein großes Sprachmodell wie GPT-4 besitzt Hunderte Milliarden Parameter. Mit relativ bescheidenen Mitteln erreicht das ESFM also beachtliche Ergebnisse.

Was das für Unternehmen bedeutet

Das Prinzip hinter dem ESFM lässt sich auf viele Bereiche übertragen: Aus vorhandenen, unvollständigen Daten belastbare Prognosen ableiten. Im Mittelstand sieht die Datenlage oft ähnlich aus wie bei den Wetterstationen – lückenhaft, aus verschiedenen Quellen, nicht einheitlich formatiert. Kundendaten hier, Maschinensensoren dort, Lieferanteninformationen in einem dritten System.

Moderne KI-Modelle können genau damit arbeiten. Ob Absatzprognosen, Wartungsplanung oder Qualitätskontrolle – KI analysiert Muster dort, wo Menschen längst den Überblick verlieren. Kein Unternehmen braucht perfekte Daten, um zu starten. Es braucht die richtigen Werkzeuge, um aus dem Vorhandenen Mehrwert zu schöpfen.

Glossar

ESFM (Earth System Foundation Model): Ein KI-Modell der ETH Zürich, das Wetter- und Klimadaten aus unterschiedlichen Quellen gemeinsam verarbeitet und Vorhersagen erstellt.
Foundation Model: Ein KI-Modell, das auf sehr großen Datenmengen vortrainiert wird und sich anschließend für verschiedene Aufgaben anpassen lässt.
Parameter (im KI-Kontext): Zahlenwerte im Modell, die beim Training angepasst werden. Mehr Parameter ermöglichen komplexere Zusammenhänge – erfordern aber auch mehr Rechenleistung.