Die Erde erforschen mit terrabyte

satellit

Zur Erforschung von historischen und aktuellen Erdbeobachtungsdaten baute das Deutsche Zentrum für Luft- und Raumfahrt mit dem Leibniz-Rechenzentrum die Hochleistungsplattform terrabyte auf. Sie startet jetzt in den Betrieb und kann von Forschenden des DLR sowie aus Bayern genutzt werden.

 

Wo entstehen gerade Industriegebiete und wo neue Wohnungen? Mattia Marconcini kann solche Aktivitäten weltweit lokalisieren. Der promovierte Telekommunikationsingenieur beschäftigt sich seit 21 Jahren mit Satellitendaten und hat im Team von Prof. Dr. Thomas Esch im Earth Observation Center (EOC) des Deutschen Zentrum für Luft- und Raumfahrt (DLR) den World Settlement Footprint (WSF) entwickelt. Zur Beantwortung der Frage tippt Marconcini eine Webadresse ein, und schon zeigt eine Folge von Bildern, wie sich die Ränder von Kapstadt, Shanghai und anderen Metropolen oder Mega-Cities seit 1985 ins Umland verschoben haben. Ein Zoom in Stadtviertel zeigt außerdem, wo in den letzten Jahren Werkstätten oder Wohnungen entstanden: „Wenn wir wissen, in welchen Regionen der Siedlungsdruck zunimmt, können die notwendigen Planungen der Städte und Verwaltungen unterstützt werden“, erklärt der DLR-Forscher den Hauptnutzen des WSF. „Wachsen Städte ohne Strategie, fehlen diese Eingriffsmöglichkeiten.“ Und sind soziale wie ökologische Probleme vorprogrammiert.

Rechenkraft und leistungsfähige Speicher

Seit 2015 berechnet und modelliert das DLR die weltweite Siedlungsfläche aus Radar- und Multispektralbildern, die Satelliten zur Erde senden. Mit Hilfe neuer Auswertungsverfahren, höherer Auflösung und weiteren Informationen aus öffentlich zugänglichen Quellen wurden sowohl die lang- als auch die kurzfristige Kartierung stetig weiterentwickelt. Die ersten zweidimensionalen Ansichten, auf denen der Siedlungsverlauf mit Farben markiert war, wandelten sich in räumliche Bilder, auf denen heute sogar Straßenzüge und Gebäude zu erkennen sind. „Wenn wir es schaffen, die Auflösung von aktuell 30 Meter für die kurzfristige und 10 Meter für die langfristige Kartierung weiter zu erhöhen, können wir bald mit noch detaillierten Bildern arbeiten“, stellt Marconcini fest. „Das ist der nächste Schritt für die Auswertung von Erderkundungs- und Satellitendaten.“

Kapstadt1   Kapstadt2  Kapstadt3

Drei Ansichten von Kapstadt: Eine Luftaufnahme von Kartendiensten (li), aus Satellitenaufnahmen generierte Ansichten des Wachstums der Stadt aus den Jahren 2015 und 2019 (Fotos: DLR/WSF)

Dazu aber sind neben klassischen digitalen Bildauswertungen Anwendungen Künstlicher Intelligenz (KI) nötig, vor allem aber Rechenpower und leistungsfähige Speicher. Zusammen mit dem DLR hat das Leibniz-Rechenzentrum (LRZ) terrabyte aufgebaut. Diese Hochleistungs-Plattform für die Analyse von Satelliten- und Umweltdaten geht jetzt in den Regelbetrieb: „terrabyte bietet neben sehr großen Rechenkapazitäten auch hohes Speichervolumen und ermöglicht klassische Simulationen wie auch Auswertungen mit Methoden der Künstlichen Intelligenz“, erklärt Prof. Dr. Dieter Kranzlmüller, Leiter des LRZ, das Konzept. „terrabyte soll außerdem für Forschende komfortabel und online erreichbar sein.“

Über eine direkte Netzanbindung fließen die Satellitendaten aus dem Archiv des DLR bald mit 100 Gigabit/s zur High Performance Data Analytics-Plattform (HPDA) am LRZ. Diese kombiniert klassische Prozessoren (CPU) mit Beschleunigern und Graphics Processing Units (GPU). Den Kern der innovativen Plattform bilden ThinkSystem SD650-N V2-Server sowie DSS-G-Speicher von Lenovo. Für Modellierungen, Berechnungen und Analysen mit KI-Methoden enthalten sie neben 61 CPU-Knoten mit je zwei 40-Kern Intel Xeon Platinum-Prozessoren noch 15 GPU-Knoten mit jeweils vier A100-Beschleunigern von NVIDIA. Durch Infiniband HDR-Verbindungen verarbeitet terrabyte Daten mit einer Geschwindigkeit von bis zur 320GB/s. „Damit kann terrabyte aktuell eine Leistung von bis zu 1,3 Petaflops erreichen“, berichtet Dr. Reinhold Bader, Spezialist für Hochleistungssysteme am LRZ. Die Plattform bewältigt pro Sekunde also bis 1,3 Billiarden Gleitkommaberechnungen. Bis Herbst wird das System ausgebaut und die Leistung von terrabyte mehr als verdoppelt. Für den energie-effizienten Betrieb wurde das System mit einer Warmwasserkühlung ausgerüstet.

Nach dem Vorbild des LRZ Data Science Storages (DSS) ergänzen ab Herbst rund 50 Petabyte Online-Speicher die Plattform. Forschende des DLR sowie Wissenschaftler:innen aus Bayern können auf die Plattform online zugreifen und dort Datensätze und eigene Berechnungen so komfortabel verwalten wie bei kommerziellen Cloud-Diensten. „Mit terrabyte erreicht die globale Erdbeobachtung im DLR ein neues Niveau. Wir können damit künftig unabhängig und sicher flächendeckende Umweltveränderungen erfassen, etwa im Zuge der Urbanisierung, der Land- und Forstwirtschaft sowie in der Atmosphäre, und mit leistungsfähigen Werkzeugen analysieren“, sagt Prof. Dr. Stefan Dech, Direktor des Deutschen Fernerkundungsdatenzentrums (DFD). „KI-Methoden helfen dabei, Prozesse der Umweltveränderung schneller zu identifizieren und besser zu verstehen.“

Technische Alternativen für die Forschung

terrabyte macht den Datenschatz nationaler Satellitenmissionen des DLR für die Natur- und Umweltwissenschaften zugänglich. Mit Hilfe der historischen und aktuellen Informationen zum Zustand der Erde lassen sich Phänomene wie das Schmelzen von Gletschern oder der Polkappen aufzeigen oder Schutzmaßnahmen gegen Überschwemmungen, Waldbrände und Dürren planen. Die Entwicklung von Shanghai und anderen Ballungszentren könnte außerdem in kürzeren Zeitabständen dokumentiert werden. Neben dem Betriebssystem hat das LRZ auf terrabyte den Softwarestack für seine Höchst- und Hochleistungsrechner, außerdem oft eingesetzte, frei verfügbare Anwendungen fürs High-Performance Computing (HPC) integriert. Das DLR implementierte eigene Open Source-Software, Tools und Algorithmen für die Analyse von Satellitendaten, Marconcini und seine Kolleg:innen richten noch die Tools des WSF auf terrabyte ein: „Bisher wurde der World Settlement Footprint auf kommerziellen Clouds berechnet, dort konnten wir bestehende Werkzeuge nicht immer optimal an unsere Bedürfnisse anpassen. Auf terrabyte können wir nun eigene Algorithmen und Anwendungen auch mit Wissenschaftler:innen entwickeln und mit ihnen optimieren.“

Was das DLR und das LRZ auch als ein Beitrag zur digitalen Souveränität und zur zuverlässigen Sicherung von Forschungsdaten geplant hatten, bietet dem DLR-Forscher insbesondere Möglichkeiten, an der Auflösung von Bilddaten zur globalen Urbanisierung zu arbeiten. Bessere, also höher aufgelöste Bilder zu liefern, ist heute nicht mehr nur Aufgabe von Satelliten- oder Aufnahmetechnik, sondern insbesondere von smarter Bildverarbeitung: KI-Tools ergänzen mit Hilfe frei verfügbarer, aktueller Fotos der Ballungszentren die Satellitendaten, berechnen diese Informationen neu, verarbeiten sie zu neuen Ansichten: „KI ist wichtig, wenn man Kontext für eine Karte oder ein Modell braucht und dafür Daten aus zusätzlichen Quellen verarbeitet“, meint Marconcini unternehmungslustig. Mit terrabyte-Tools könnten Gebäude von Städten beispielsweise automatisch kategorisiert werden. Und: „Für den Settlement-Footprint ist außerdem die Superresolution mega-interessant, aber noch schwer hinzubekommen,“ so Marconcini. Auf der HPDA-Plattform wollen er und seine Kolleg:innen dieses Ziel jetzt angehen: mit Hilfe von Supercomputing und KI die Auflösung der kurzfristigen WSF-Kartierung auf 15 bis zu 10 Meter und die der langfristigen Kartierung auf 5 bis 2,5 Meter bringen, außerdem detaillierte 3D-Bilder berechnen, um so die Höhe von Gebäuden oder deren Zweck einzuschätzen und die Entwicklung von Stadtvierteln noch genauer aufzuzeigen. „Außerdem wollen wir den World Settlement Footprint in kürzeren Zeitabständen aufzeichnen, auch das wäre ohne KI nicht möglich“, so Marconcini weiter. „Aber jetzt werden wir bald aus bestehenden Simulationen in kurzer Zeit viele Szenarien ableiten können. Wahnsinn, unglaublich – vielleicht werden wir die Veränderungen von Städten bald monats- oder wochenweise dokumentieren können.“ (vs)

MM

Dr. Mattia Marconcini, Earth Observation Center des DLR


Portale und Tools für die Erdbeobachtung:

Open Geospatial Consortium
EOWEB Geo-Portal
GEO Knowledge Hub:
World Settlment Footprint (Karte)