Gemeinsam entwickeln

idee


Als erstes Supercomputing-Zentrum in Europa setzt das Leibniz-Rechenzentrum auf eine Innovationspartnerschaft zur Beschaffung des nächsten Höchstleistungsrechners. Bei seiner Planung und Entwicklung sind viele Kolleg:innen und Abteilungen  involviert, und die Testumgebung BEAST aus dem Future Computing-Programm liefert ebenfalls wertvolle Informationen.

Zurzeit wird viel und oft über neue Computertechnologien am Leibniz-Rechenzentrum (LRZ) diskutiert: Einmal in der Woche treffen sich je drei Kolleg:innen aus den Arbeitsgruppen  Future Computing, Künstliche Intelligenz und Big Data sowie Computational X Support X (CXS) mit den Vertreter:innen von HPE oder Lenovo und besprechen das Design von künftigen Prozessortypen, Netztechnologien und weiteren Komponenten. „Wir diskutieren, wie Rechenknoten und System aussehen, aufgebaut werden und arbeiten sollen“, sagt Amir Raoofy, Informatiker, Ingenieur und im Team Future Computing. „Es geht darum, verschiedene Design-Optionen zu verstehen, ihre Leistung, aber auch die entstehenden Kosten abzuwägen oder Benchmark-Ideen zur Bewertung dieser Möglichkeiten zu entwickeln.“ In den regelmäßigen Gesprächsrunden werden die Entwicklungen zum nächsten HPC-System am LRZ vorbereitet, spezifiziert, optimiert.

Unterschiedliche Perspektiven und Erfahrungen gefragt

Die Technologie fürs Supercomputing differenziert sich zurzeit schnell aus. Neben unterschiedlichen Central Processing Units (CPU) stehen heute eine Vielzahl von Beschleunigern, etwa Graphics Processing Units (GPU) oder Field Programmable Gate Arrays (FPGA), zur Verfügung, außerdem diverse Techniken, um diese Komponenten für einen schnellen Datenfluss zu verbinden. Doch mit der Auswahl potenzieller Komponenten wird die Entwicklung eines Supercomputers komplexer: „Deshalb entsteht unser nächstes HPC-System im Co-Design mit Technologieanbietern. Gemeinsam entwickeln wir gerade Prototypen oder optimieren Komponenten“, erklärt Prof. Dr. Dieter Kranzlmüller, Leiter des Leibniz-Rechenzentrums (LRZ). „Hard- und Software werden dabei in enger Abstimmung mit unseren Spezialist:innen für den gewünschten Einsatzzweck abgestimmt.“ Für diese enge Zusammenarbeit setzt die Innovationspartnerschaft den rechtlichen und wirtschaftlichen Rahmen. Das ist ein neues Beschaffungsverfahren in Form eines mehrstufigen Wettbewerbs zwischen potenziellen Anbieter- oder Integrator-Unternehmen, die für das LRZ den Supercomputer aufbauen können und dafür Prototypen entwickeln sowie innovative Komponenten anderer Hersteller einbetten.

Höchstleistungsrechner sollen heute nicht mehr nur größte Datenmengen berechnen und klassische Simulationen erstellen, sondern auch Methoden der Künstlichen Intelligenz (KI) beherrschen, möglichst energieeffizient arbeiten und in naher Zukunft sogar Quantentechnologien aufnehmen können. Für den Aufbau innovativer Systeme sind folglich unterschiedlichste Perspektiven und Erfahrungen gefragt. Am LRZ sind daher so viele Kolleg:innen wie nie in die Entwicklung des neuen Supercomputers eingebunden. Wenigstens 12 Spezialist:innen aus sieben Arbeitsgruppen sowie die Führungsebenen setzen sich ständig mit den einzelnen Entwicklungsschritten und notwendigen Optimierungen auseinander. Außerdem wird auch das Bavarian Energy, Architecture and Software Testbed (BEAST) eingesetzt, um Fragen zu klären.

Diskutieren, zuhören, die Anderen informieren

Die erste Konzeptphase der Innovationspartnerschaft konnten HPE und Lenovo 2022 für sich entscheiden. Inzwischen haben sie in getrennten Räumen Racks mit ersten Prototypen aufgebaut und erörtern im Wochentakt diese Lösungen mit ihrem jeweiligen LRZ-Team. „Die Unternehmen sind froh, von uns die Anforderungen verschiedener Nutzungsgruppen zu erfahren, sie wollen wissen, wie und wozu ein Supercomputer genutzt wird und welche Anwendungen einmal darauf laufen werden“, sagt Dr. Josef Weidendorfer, Leiter des Programms Future Computing. Um einen fairen Wettbewerb zu gewährleisten, sind alle Beteiligten zur Verschwiegenheit verpflichtet. Die Prototypen werden nicht nur in abgeschlossenen Räumen installiert, jedem Hersteller ist außerdem ein abteilungsübergreifendes Trio zugeordnet, das die anderen Kolleg:innen zwar über mögliche Leistungen und Funktionalitäten informieren kann, nicht aber über die Ausgestaltung der Technik sprechen darf. Das würde das geistige Eigentum beider Unternehmen berühren. „Die eigentliche Hardware wird ja noch nicht hergestellt“, stellt Raoofy fest. „Diese Prototypen-Systeme können aber einerseits helfen, die Technologie des künftigen HPC-Systems abzuschätzen und zu verstehen, andererseits kann die Entwicklung von Systemsoftware, etwa für das Betriebsmonitoring oder das Energiemanagement, schon tiefer erörtert und gestartet werden.“

Mit Ankunft der ersten Arbeitsmodelle hat das LRZ-Team außerdem einen effizienten Kommunikationsprozess installiert: Die Technologie-Unternehmen treffen sich regelmäßig mit ihren drei Ansprechpartner:innen, die neben Future Computing vor allem die anwendungsnahen Bereiche Daten und KI sowie HPC und damit die künftigen Einsatzfelder des Supercomputers abdecken. Was beide Teams von den Unternehmen über technische Lösungen erfahren und mit ihnen besprechen, kommt intern regelmäßig in unterschiedlichen Abteilungssitzungen und auf den Führungsebenen zur Sprache: „So bringen wir alle beteiligten Kolleg:innen auf den gleichen Informationsstand, können Techniklösungen und Vorschläge aus unterschiedlichen Perspektiven diskutieren“, erzählt Raoofy. „Außerdem brauchen die Unternehmen umgekehrt manchmal Feedback zu Anforderungen, wie sie zum Beispiel Speicher- oder Betriebskonzepte ausgestalten können, zu möglichen Betriebssystemen oder zum Einsatz von Verwaltungssoftware. Da brauchen wir dann Rückmeldungen der jeweils verantwortlichen Kolleg:innen, die wir zurück in unsere Gespräche mit den Unternehmen tragen.“

Anwendungsgruppen an Planungen beteiligen

Daneben baut auch noch BEAST eine Brücke zwischen Gegenwart und Zukunft, zwischen verfügbarer Technik und geplanten Innovationen: „BEAST beinhaltet unterschiedliche Prozessoren- und Beschleunigerarchitekturen. Damit können wir Erwartungen klären und eigene Benchmarks setzen“, berichtet Weidendorfer. Die Testumgebung wird durch Leihgaben und Anschaffungen stetig ergänzt, zurzeit sind unter anderem Systeme von AMD und Intel, ARM-Prozessoren sowie GPU von NVIDIA installiert, außerdem diverse Beschleuniger. So kommen unterschiedliche Architekturen und neuartige Komponenten zusammen, die Vergleichsmöglichkeiten bieten, zudem einen Blick auf aktuelle Techniktrends und mögliche Entwicklungswege auch in der Innovationspartnerschaft: „Vor dem Start boten uns die BEAST-Systeme einen Überblick über verfügbare Hardware-Entwicklungen“, erläutert Dr. Gerald Mathias, Leiter des CXS-Labs, das Forschende bei der Arbeit mit den LRZ-Supercomputern unterstützt. „Wir konnten auf verschiedenen Architekturen oder Prozessor-Typen Codes testen, Leistungsdaten messen, optimieren. Und mit diesen Erkenntnissen verfolgen wir nun detailliert, wie sich aktuelle Neuerungen auswirken.“

Die Ergebnisse aus Experimenten im Testfeld, außerdem Beobachtungen aus Forschungsarbeiten mit diversen Chip-Konzepten sowie Leistungs- und Vergleichsdaten flossen in das Lastenheft für den zukünftigen Supercomputer ein und bilden die Grundlage für diverse Benchmark-Suites, mit denen nun die Prototypen objektiv betrachtet und bewertet werden können. Mit Hilfe von BEAST konnten außerdem Wissenschaftler:innen und Anwender:innen des SuperMUG-NG, an den Planungen zum neuen Supercomputer beteiligt werden.

Forschungsgruppen prüfen in BEAST, wie ihre Applikationen auf unterschiedlichen Computer-Architekturen funktionieren. Die Wissenschaftler:innen des Seismologie-Projekts SeisSol wollten beispielsweise wissen, ob sie ihren Erdbeben-Code durch neue Parameter ergänzen können, wenn CPU und GPU zusammenarbeiten, zudem wie er auf neuen Prozessoren implementiert werden kann und damit arbeitet. „Solche Tests funktionieren nur mit BEAST“, sagt Anwendungs- und Support-Spezialist Mathias. „Durch diese Experimente konnten wir Erfahrungen und Wünsche unserer Anwender:innen in die Innovationspartnerschaft einbringen.“ Daraus entstanden potenzielle Anwendungsszenarien und weitere Vergleichsmaßstäbe, mit denen die Technologie-Unternehmen ihre Konzepte spezifizieren können. „BEAST dient dem Tech-Scouting, wir evaluieren damit Hardware und Software-Stacks, die bereits verfügbar sind“, fasst Dr. Herbert Huber, Leiter der Abteilung Hochleistungssysteme am LRZ, zusammen: „Die Innovationspartnerschaft zielt dagegen auf zukünftige Technologien, die frühestens 2025 auf dem Markt verfügbar sein werden. Im Vorfeld konnten wir aber Anforderungen formulieren und eine Richtung für die Entwicklung in der Innovationspartnerschaft vorgeben.“

Die Innovationspartnerschaft zwischen Technologieunternehmen und LRZ ist ein fruchtbares Geben und Nehmen: Die Unternehmen können Technik eng an den geplanten Einsatz anpassen, das LRZ empfiehlt sich als Ideengeber und Unterstützer für technische Entwicklungen. Es erfährt früher von Innovationen, kann darauf mit Anschaffungen reagieren, bekommt – oft im Rahmen von Forschungsprojekten – Leihgaben für BEAST. „Wir bekommen früher Zugriff auf neue Technik“, bestätigt Huber, „können enger mit Herstellerunternehmen kooperieren und technische Neuerungen mitentwickeln oder optimieren.“ (vs)