

Erfahrungen fürs High Performance Computing (HPC) in Bayern auf- und ausbauen: Das war und ist das Ziel des Kompetenznetzwerkes für wissenschaftliches Hochleistungsrechnen, kurz KONWIHR, das 2000 zum Start des ersten nationalen Höchstleistungsrechners am Leibniz-Rechenzentrum (LRZ) als Förderprogramm in Bayern initiiert wurde. KONWIHR hat in den letzten 25 Jahren rund 300 Forschungsgruppen bei der Entwicklung und Optimierung von Codes unterstützt – nicht nur mit Geld, sondern vor allem durch die Erfahrung der Computerspezialistinnen des Regionalen Rechenzentrums Erlangen (RRZE), das heute ein Standort für Nationales Hochleistungsrechnen ist (NHR@FAU), sowie des LRZ, das sich seinen Namen als europäisches Supercomputing-Zentrum machte.
Nebenbei entstand ein lebendiges Netzwerk aus Wissenschaftlerinnen und Forschenden, die mit Hilfe von Hoch- und Höchstleistungsrechnern Wissen schufen und gleichzeitig Codes, frei verfügbare Programme hinterließen, die heute noch eingesetzt werden. „KONWIHR-Projekte sind meistens klar umrissen und zielen auf ein konkretes, technisches Detail der Forschungsarbeit, zum Beispiel auf die Erweiterung der Funktionalität von Software oder deren Implementierung auf einem Parallelrechner“, erläutert Prof. Hans-Joachim Bungartz, einer der Sprecher des Netzwerks, sein Kollege Prof. Gerhard Wellein ergänzt: „Sie werden meist von einer Gruppe, einem Wissenschaftler oder einer Professorin beantragt. Wir haben sogar eine Stammkundschaft, die regelmäßig Anträge stellt. Das ist der Tatsache geschuldet, dass viele Arbeitsgruppen über Jahrzehnte HPC-Software weiter entwickeln und dabei die Promovierenden oft wechseln.“ Ein Gespräch über Hochleistungsrechnen in Bayern und technische Entwicklungen.
Warum wurde KONWIHR eingerichtet?
Prof. Hans-Joachim Bungartz: Im Vorfeld der Planungen zum Höchstleistungsrechner Bayern oder HRLB 1 förderte die Bayerische Forschungsstiftung FORTWIHR, den Forschungsverbund für technisch-wissenschaftliches Höchstleistungsrechnen, um in der Forschung das Wissen über Algorithmen sowie Erfahrung in der Software-Entwicklung für Rechner der höchsten Leistungsklasse zu erhöhen. Es wuchs die Erkenntnis, dass es zum Supercomputer ein Begleitprogramm braucht, um diese Kompetenzen dauerhaft unter den Anwenderinnen zu verankern. So entstand KONWIHR zur Unterstützung von wissenschaftlichen Codes und deren Implementierung.
Prof. Gerhard Wellein: Es ging auch um Kosten und Effizienz, man wollte kein Geld verplempern durch den Einsatz von ineffizienter Software. Schließlich kostete ein Supercomputer schon damals viele Millionen Mark, und pro Nutzungsstunde wurden durchaus mehrere tausend Mark fällig.
Was hat KONWIHR bewegt, und erinnern Sie sich an persönliche Highlights?
Wellein: KONWIHR hat einen wesentlichen Teil dazu beigetragen, dass wir in Bayern HPC-Software entwickeln können. In Erlangen hat das Programm neue Akzente gesetzt, in der Informatik der Friedrich-Alexander-Universität entstand etwa meine Arbeitsgruppe High Performance Computing, die sich unter anderem mit Performance Engineering beschäftigt. In Würzburg etablierte sich im Fachbereich Physik das Research Software Engineering. KONWIHR hat viele wichtige Codes, Libraries oder Programme wie waLBerla, preCICE, MARQOV oder dealii, gefördert, die heute in aller Welt genutzt und geschätzt werden. Das Programm schuf Grundlagen für die Entwicklung des LRZ zum internationalen Höchstleistungs-Rechenzentrum und des RRZE zu einem Standort des Nationalen Hochleistungsrechnens.
Bungartz: Das Hosten von umfangreicheren Wissenschaftscodes an Universitäten funktioniert nicht, wenn es dafür keine Mittel gibt. Nur in wenigen Ausnahmen fördern die Deutsche Forschungsgemeinschaft sowie die Wissenschaftsministerien die Entwicklung von Software. Im Wesentlichen steht eine Forschungsfrage im Vordergrund, die Software hat nebenbei zu entstehen. KONWIHR füllt hier eine Lücke, das Programm entfaltet starke Hebelkraft an Hochschulen. Man braucht im Softwarebereich gar nicht so viel Geld, aber Beständigkeit.
Nützliche Programme
KONWIHR förderte viele Codes oder Programmpakete, die heute international genutzt und in der Wissenschaft hoch geschätzt sind. Ein paar Beispiele:
Was unterstützt KONWIHR genau und wen?
Bungartz: Wer an einer bayerischen Hochschule forscht, kann Förderung beantragen. KONWIHR vermittelt Geld und Expertise für die Arbeit an wissenschaftlichen Codes. Dafür gibt es je nach Fragestellung zwei Formate: bis zu 10.000 Euro für drei Monate sowie bis zu 50.000 Euro für ein Jahr. Jedes Projekt bekommt zudem eine Ansprechpartnerin an einem der Rechenzentren. KONWIHR soll Kompetenzen stärken, aber auch das bayerische HPC-Netzwerk. Ziel ist, dass so etwas wie ein Peer to Peer-Consulting entsteht, dass also die Spezialistinnen an den Rechenzentren Forschende mit Wissenschaftlerinnen zusammenbringen, die vergleichbare Fragen mit Hilfe von KONWIHR schon gelöst haben und nun Aufgaben beschleunigen helfen können.
Wellein: Über KONWIHR können Mitarbeitende von Projekten für einige Zeit direkt in einem der beiden Rechenzentren arbeiten und im direkten Kontakt mit Spezialistinnen Aufgaben rund um die Software oder deren Implementierung lösen. Seit Corona wird das leider nicht mehr so oft beansprucht, aber wenn Forschungsgruppen erstmals auf Hochleistungsrechnen setzen, profitieren sie davon sehr stark. Außerdem gibt es jedes Jahr zwei KONWIHR-Workshops, in denen Antragstellerinnen vor größerer Runde ihre Vorhaben präsentieren, auch das dient der Vernetzung und dem Wissenstransfer.
Mit welchen Fragen wird KONWIHR konfrontiert?
Wellein: Ein großes Thema ist sicher das Portieren von Codes auf ein anderes System oder auf eine neue Rechnerarchitektur. Das nächste sind Code-Optimierungen – eine Software soll effizienter und auf mehr parallelen Knoten rechnen oder die Arbeit aller eingesetzten Rechenknoten soll beschleunigt und verbessert werden.
Bungartz: KONWIHR fördert außerdem Funktionserweiterungen von Software, also zum Beispiel, wenn Klimasimulationen um weitere Parameter ergänzt werden, oder wenn Analysemöglichkeiten in einen Simulationscode eingebaut werden sollen. Auch wenn zwei Codes für die Simulation eines Problems gekoppelt werden sollen und dafür noch eine elegante Schnittstelle benötigen, ist das ein Projekt für KONWIHR.
Wellein: Oder das Team hat einen Workflow, der auf Laptops unter Windows funktioniert und nun an einem Hochleistungsrechner ausgeführt werden soll. KONWIHR fördert klar umrissene Projekte innerhalb von Forschungsaufgaben, die technisch zu lösen sind.
Was ist ein klassisches KONWIHR Projekt?
Bungartz: Voraussetzung ist immer eine wissenschaftliche Frage, die nur mit Rechnerunterstützung vernünftig zu beantworten ist. KONWIHR zielt dabei auf die technische Seite ab, es muss ein Optimierungspotenzial am Code geben.
Wellein: Alle Anträge werden von zwei Spezialistinnen begutachtet. Eine achtet auf die wissenschaftliche Fragestellung. Die andere bewertet den Einsatz von HPC: Eignet sich die Technik oder der Code? Bringt die höhere Auflösung der Berechnung wirklich voran? Ist der Arbeitsplan schlüssig? Diametral unterschiedliche Einschätzungen sind dabei durchaus möglich: Da unterstützt die Fach-Expertin das Projekt, weil die Aufgabenstellung neu ist, die Computerspezialistin kritisiert dagegen, dass ein Simulationscode gar nicht parallelisiert ist und daher nicht ausgeführt werden kann.
Ziel von KONWIHR war es, den Einsatz von HPC in Forschung und Wissenschaft zu verbreiten – ist diese Aufgabe nicht schon übererfüllt?
Bungartz: Das könnte man so sehen. Vor 25 Jahren modellierten nur wenige Expertinnen Gasströmungen im Universum oder komplexe technische Prozesse. Heute sind Simulationen Standardwerkzeuge in den Natur-, Lebens- und Ingenieurswissenschaften. Aber die Technik entwickelt sich ja weiter. Über die Datenanalytik und die Methoden der Künstlichen Intelligenz werden gerade die Sozial- und Geisteswissenschaften ans Hochleistungsrechnen herangeführt. Typischerweise ist vor allem hohe Rechenkraft gefragt, aber es heißt ja ,High Performance Computing‘ und nicht ,High Performance Computer‘. Es geht nicht darum, die größten Computersysteme einzusetzen, sondern aus diesen die volle Leistungsfähigkeit herauszuholen.
Wellein: Außerdem kommen viele Forschende zwangsläufig zum Hochleistungsrechnen. Die meisten programmieren erst auf dem Laptop Lösungen für ihre Datenfragen. Geht das gut, reichen irgendwann die technischen Ressourcen nicht mehr aus, weil es Wochen braucht, bis Ergebnisse vorliegen. An diesem Punkt kommen KONWIHR und die Rechenzentren ins Spiel: Wir eröffnen dem Team ein größeres System, damit es komplexer rechnen kann.
Bungartz: KONWIHR hilft dabei auch Hemmschwellen zu überwinden. Forschende einer Hochschule im ländlichen Raum erkennen durch das Programm, dass ihnen die Hochleistungsrechner am LRZ oder des NHR@FAU ebenfalls offenstehen. Nicht zuletzt verlassen Studierende und Doktoranden die Hochschulen, werden Professoren und Professorinnen neu berufen, kommen also immer wieder neue Leute, die praktische HPC-Erfahrungen brauchen, um ihre Forschungsfragen zu lösen.
Welche Entwicklungen haben KONWIHR in den letzten 25 Jahren geprägt?
Wellein: Was noch immer nachwirkt, ist die Parallelisierung von Rechenknoten mit dem Message Passing Interface oder MPI. Dann wuchs der Unterstützungsbedarf stark im Bereich numerischer Simulation und in der Algorithmik. Nun ist die Integration von Beschleunigern und deren Auswirkungen auf Codes ein großes Thema. Seit ein, zwei Jahren wird auch für das Zusammenspiel von KI und HPC oder für den Einsatz von KI-Modellen Unterstützung beantragt.
Bungartz: Das KONWIHR-Ziel, effizienter zu rechnen, ist in der Simulations-geprägten HPC-Gemeinde angekommen und hat dort zu viel Wissen geführt. Die KI-Welt beginnt erst, über Effizienz nachzudenken – so gesehen erleben wir gerade einige Déjà-vus: Wir hatten schon vor 20, 25 Jahren Forschende, die immer mehr CPU oder Rechenkraft wollten. Jetzt kommt das ,gebt mir mehr‘ verstärkt aus der KI-Ecke. Dabei wird mit zunehmender Erfahrung klar, dass der Leistungszuwachs zu gleichen Teilen von der Hardware und von der numerisch-linearen Algebra oder Algorithmen getrieben wird.
Wo fließen die höheren Fördersummen hin – ans LRZ, weil dort die größeren, aufwändigeren Rechner stehen?
Wellein: Die Zuwendungen haben nichts mit der Größe der Systeme zu tun, sondern wie lange sich die Forschenden mit einer Software beschäftigen. Zu beobachten ist, dass die 3-Monats-Projekte oft genutzt werden, um eine studentische Hilfskraft für Anpassungen einzustellen. Bei den größeren Anträgen gibt es bereits eine Software und Basiskenntnisse. Das sind oft Vorhaben, die die Deutschen Forschungsgesellschaft für drei, vier Jahre unterstützt und für die jemand gebraucht wird, der sich um Software oder Technik kümmert. Mit 50.000 Euro können Sie jemanden etwa 8, 9 Monate beschäftigen und dafür sorgen, dass das Projekt nicht nur wissenschaftlich Ergebnisse bringt, sondern auch in puncto Software Nachhaltigkeit erreicht.
Ob mit GPU, Quantensystemen oder neuen analogen Technologien – wie reagiert KONWIHR auf Beschleunigertechnologien?
Wellein: Diese Entwicklungen spiegeln sich vor allem in den Anträgen wider. Wir sehen jetzt erste explorative Projekte zum Quantencomputing. Die Technik ändert sich, aber das Ziel bleibt, die Anwendung, den Code oder den Workflow effizienter, schneller, sparsamer zu machen. Bei den KI-Methoden und der Datenanalytik ist die Situation vergleichbar mit dem HPC vor 30 Jahren. Der Unterschied ist, damals hatte jeder einen eigenen Code. Für KI werden heute weitgehend Standard-Frameworks verwendet, aber sobald sich Methoden oder Codes ausdifferenzieren und angepasst werden sollen, können wir das Knowhow, das wir über 30 Jahre aufgebaut haben, einsetzen.
Neben neuen Technologien rückt die Energieeffizienz in den Fokus – auch ein Thema in KONWIHR-Anträgen?
Bungartz: KONWIHR war und ist ein Instrument, um Nachhaltigkeit und Energieeffizienz sicherzustellen. Wenn Sie ein wissenschaftliches Problem in zehn Prozent der Laufzeit berechnen können, sparen Sie auch 90 Prozent Energie. Keine Forschungsgruppe stellt einen Antrag auf Energieeffizienz, sondern auf die Verbesserung der Anwendung.
Was wünschen Sie KONWIHR für die nächsten 25 Jahre?
Wellein: Mehr Anträge, in denen ein Verständnis über das Verhalten eines Codes gesucht wird. Warum oder wann wird er schneller – das interessiert eher erfahrene Anwenderinnen. Dieses Wissen in allen rechnergestützten Wissenschaften zu verbreiten, ist mein Anliegen. Forschende sollten nicht nur ihre Fachfragen verstehen, sondern auch die Methodik oder die Implementierung ihrer Anwendung. Außerdem würde ich mir wünschen, dass KONWIHR eine Brücke von den klassischen HPC-Nutzerinnen hin zu neuen Anwendungsgruppen und neuen HPC-relevanten Fragen schlägt.
Bungartz: Ich würde mir wünschen, dass sich der Effizienzgedanke auch bei den KI-Methoden durchsetzt. Mit Modellen, Algorithmen und Software von der Stange wird selten der energietechnisch günstigste Weg gefunden. Angesichts der Energiemengen, die täglich durch den Einsatz von KI verbrannt werden, wäre schon eine kleine Effizienzverbesserung ein Gewinn für die Menschheit. (Interview: vs | LRZ)
Kleines, aber feines Förderprogramm
Seit 2000 unterstützt KONWIHR die Entwicklung von Codes und Software für die Forschung.
Mehr Infos unter: www.konwihr.de/about-konwihr/
Neues von KONWIHR
Über KONWIHR berichtet viermal im Jahr das Quartl auf Deutsch und Englisch über HPC-Entwicklungen und rechnergestützte Forschung. Das Archiv erzählt viel aus der Geschichte von Supercomputern. Reinlesen und abonnieren.