Bauplan für eine datenschutz-konforme, sichere Datenwolke

Secure


Für das Digitalisierungs-Projekt DigiMed Bayern hat das Leibniz-Rechenzentrum eine sichere Cloud für sensible, medizinische Forschungsdaten aufgebaut: Sie könnte zur Blaupause für weitere vergleichbare Angebote für Wissenschaft und Forschung sein.

Seit ihrem offiziellen Start im Dezember 2023 wird sie voller: Das Deutsche Herzzentrum und die Deutsche Herzstiftung haben bereits gut 802 Terabyte Daten in die DigiMed Bayern Secure Cloud geladen. Darunter finden sich 15.000 Bilder des menschlichen Herzen, von Herzkranzgefäße, Arterien, Gewebe, aber auch Informationen von Krankenkassen sowie Messwerte von Patient:innen, etwa Blutdruck, Herzströme oder Gewicht. „Die Verfügbarkeit von Gesundheitsdaten und die Möglichkeit, diese auch mit Hilfe von Künstlicher Intelligenz und in interdisziplinären Expertenteams auswerten zu können, sind eine der Grundlagen für ein modernes Gesundheitssystem“, stellt Dr. Jens Wiehler, Geschäftsführer und Koordinator von DigiMed Bayern fest. „Dazu brauchen wir eine sichere, effiziente und skalierbare Infrastruktur, neben allen medizinisch-wissenschaftlichen Ergebnissen hat DigiMed mit der Entwicklung einer sicheren Cloud-Umgebung in einem öffentlichen Rechenzentrum diese nun geschaffen.“

Blaupause für vergleichbare Datenspeicher

Gefördert vom Bayerischen Staatsministerium für Gesundheit, Pflege und Prävention beschäftigen sich 13 Forschungsinstitute seit 2018 bei DigiMed Bayern mit der Digitalisierung der Medizin. Neben dem Herzzentrum, Kliniken und Lehrstühlen der Ludwig-Maximilians-Universität (LMU) sowie der Technischen Universität München (TUM) waren das Helmholtz Zentrum München sowie das Max-Planck-Institut für Biochemie und andere Institutionen beteiligt. Die Medizin der Zukunft sollte prädikativ, präventiv, personalisiert und partizipatorisch sein und sollte dafür digitaler werden. Daher beteiligte sich auch das Leibniz-Rechenzentrum (LRZ) an DigiMed Bayern. Seine Aufgabe: die Planung und der Aufbau eines sicheren Online-Tresors für sensible medizinische Daten, den Forschende und – in Zukunft auch – Mediziner:innen mit individuellen Zugriffsrechten nutzen können. „Im Konzept wurde klar, dass die Cloud sehr flexibel und vielseitig, vor allem aber komfortabel und einfach zu nutzen sein sollte“, erklären Florent Dufour und Dr. Peter Zinterhof aus dem LRZ-Team für Big Data und Künstliche Intelligenz (BDAI), die die Entwicklung dieser Datenwolke planten und umsetzten. „Die DigiMed Secure Cloud wurde nach dem Vorbild der LRZ-Cloud aufgebaut und auf allen Ebenen um wesentliche Sicherheitsmerkmale ergänzt.“

Eine Mammut-Aufgabe, für die nicht nur unterschiedlichste Anforderungen zu ordnen, sondern vor allem rechtliche und technische Fragen zu klären waren. So mussten der DigiMed-Verbund noch Rahmenbedingungen für die Nutzung der Cloud regeln, außerdem die technische Ausstattung an geltendes Recht anpassen. „Vor sechs Jahren war Vieles noch unsicher, unklar, und, zugegeben, unsere Erwartungen waren zu hoch. Das aber ist wenig überraschend bei solchen Projekten, mit denen grundlegende Infrastrukturen erforscht, entwickelt und aufgebaut werden. Nur mit Ambitionen wird etwas vorangebracht“, sagt Koordinator Wiehler. „Der zentrale Vorteil der DigiMed Secure Cloud ist, dass die Daten am LRZ und damit unter öffentlicher Obhut in Deutschland gespeichert und verarbeitet werden und für viele Arbeits- und Forschungsgruppen gemeinsam nutzbar sind. Damit bietet die Cloud eine Blaupause für eine sichere, datenschutz-konforme Zusammenarbeit von Forschung und den Stätten der Gesundheitsversorgung, nach der weitere vergleichbare Angebote geplant und aufgebaut werden können.“

Die DigiMed Secure Cloud wurde nach dem Vorbild der LRZ Cloud und nach den Prinzipien des Confidential Computings (CC) aufgebaut. Sie besteht aus drei Management- und Rechenknoten, jeweils mit  Secure Encrypted Virtualisation - Secure Nested Paging (SEV-SNP) Komponenten sowie Speicherkapazitäten auf Basis von Solid State und Hard Disk Drives (SSD/HDD). Mit dieser Technik und mit dem Datei- oder Filesystem Quobyte werden alle Daten automatisch verschlüsselt, und zwar beim Hochladen, beim Transport von Server zu Client oder Recheneinheit, beim Verarbeiten und beim Speichern. „Wir setzten auf Hardware, die so genannte Trusted Execution Environments oder TEE für gesichertes Computing schafft“, erklärt LRZ-Forscher Dufour. „Die Cloud selbst baut auf das Betriebssystem OpenStack, auf virtuelle Maschinen und auf Self-Service, sie kann also von allen Nutzer:innen nach deren Bedürfnissen eingerichtet und mit Programmen, Analyse-Werkzeugen sowie weiteren Speicherkapazitäten ausgestattet werden.“ Eine Folge der vertrauenswürdigen Computer-Technik ist, dass alle Daten in jeder Phase der Nutzung verschlüsselt sind und folglich selbst die Administrator:innen am LRZ nicht sehen können, was in dieser Datenwolke liegt und geschieht.

Mit Datenspenden Forschung ermöglichen

Unter anderem lagern dort inzwischen 2500 Datensätze von Nutzer:innen der HerzFit-App der Deutschen Herzstiftung, die diese Informationen zu Forschungszwecken gespendet haben. „Die Idee hinter der App ist die eines digitalen Coaches für die Herzgesundheit“, erklärt Dr. Lara Marie Reimer, Wirtschaftsinformatikerin und Betreuerin der App. „Nutzer:innen können darin manuell Messwerte wie Blutdruck, Ruhepuls und mehr erfassen oder von Wearables hochladen und diese überprüfen. Sie erfahren, was sie gegen kardiovaskuläre Risiken tun und wie sie ihre Gesundheit durch Sport oder Ernährung verbessern können.“ Die App bietet einen Risikorechner für Herz- und Kreislaufkrankheiten, weitere Dienste sollen folgen. Etwa 120.000 Menschen haben HerzFit heruntergeladen, ein Drittel von ihnen kontrolliert damit regelmäßig Daten. „Die Bereitschaft, sich mit Gesundheitsdaten zu beschäftigen und diese digital zu erfassen, wächst in der Bevölkerung“, beobachtet Reimer. Die gespendeten Datensätze von den Mobilgeräten wurden am Deutschen Herzzentrum aufgenommen, dort pseudo- und anonymisiert und in die DigiMed Secure Cloud geladen.

Secure-3

HerzFit App: Digitaler Coach für die Herzgesundheit. Foto: Deutsche Herzstiftung

Ein Ziel ist, langfristig noch mehr Menschen aus der HerzFit-Community zu Datenspenden zu motivieren: „Wir können die HerzFit-App bei Bedarf für Umfragen zur Herzgesundheit nutzen, vor allem aber wollen wir die Gesundheitswerte aus den Datenspenden auswerten“, sagt Reimer. Für Langzeitstudien, etwa zur Entwicklung, Behandlung und Vermeidung von Krankheiten, sind solche Daten in der Wissenschaft höchst gefragt: „Rechtlich ist es für die Herzstiftung und für andere Forschungsinstitutionen sehr schwer, solche medizinischen Daten zu erfassen und speichern. Bei kommerziellen Cloud-Anbietern fehlen oft das Vertrauen und die Sicherheit, dass Daten in Deutschland oder Europa gesichert werden. Durch die DigiMed Secure Cloud besteht jetzt endlich eine sichere Alternative, die sich in öffentlicher Hand befindet“, so Reimer.  „Wir erkunden aktuell die vorhandenen Datensätze, um Analyse-Tools einzusetzen und selbst zu entwickeln.“ Auch die digitale Souveränität und der Aufbau von Erfahrungen mit der Digitalisierung im Gesundheitswesen war ein Ziel von DigiMed Bayern.

Ein Großteil der Daten zur Herz-Gesundheit in der Secure Cloud stammt von Studienteilnehmer:innen vom Deutschen Herzzentrum: „Unsere Bild- und klinischen Daten erlauben die Analyse der Morphologie von Herzkranzgefäßen, sie stellen zudem längerfristige Entwicklungen zur Herzgesundheit dar. Damit können wir jetzt KI-Modelle, etwa zur Mustererkennung, trainieren“, sagt Facharzt Dr. Moritz von Scheidt, stellvertretender wissenschaftlicher Leiter von DigiMed Bayern. Neben den Ärzt:innen und Forschenden des Herzzentrums sollen Wissenschaftler:innen in Bayern mit diesen Informationen arbeiten können. Dazu wurde die Secure Cloud so konstruiert, dass sie Workloads des High-Performance Computings (HPC) und für Methoden der Künstlichen Intelligenz (KI) integriert: „Wir setzten außerdem auf den Sovereign Cloud Stack (SCS), der in die europäische Dateninfrastruktur Gaia-X integriert ist“, beschreibt Dufour spezielle Ausstattung. Dadurch können Anwender:innen Datensätze ganz oder teilweise in der Datenwolke separieren, mit anderen Gruppen teilen sowie mit unterschiedlichen Zugriffsrechten versehen, nicht nur innerhalb der bayerischen DigiMed-Zirkel, sondern bei Bedarf auch in europäischen Forschungsverbünden: „Es wird beim Deutschen Herzzentrum einen Bereich geben, in dem alle DigiMed-Partner:innen Informationen verarbeiten können sowie einen exklusiven Teil, zu dem nur unsere Kolleg:innen Zutritt haben“, plant von Scheidt.

Rezept für weitere Angebote in öffentlicher Hand

Die ersten Anwender:innen sind zufrieden mit den Funktionen und Möglichkeiten der DigiMed Secure Cloud. Im November, wenn das Projekt endet, werden während eines Symposiums wissenschaftliche Ergebnisse des Projekts sowie dessen IT-Infrastruktur präsentiert und grundlegend diskutiert. Bis zum nächsten Arbeitstreffen im April will das Konsortium erste Erfahrungen mit Anwendungen und Analyse gesammelt haben, auch um zu beweisen, dass in Zukunft mehr zentralisierte, digitale Services der öffentlichen Hand und aus Deutschland notwendig werden, wenn Wissenschaft und Forschung, vor allem aber die Gesundheitsversorgung besser werden sollen: „Die Idee, sensible, medizinische Daten in der öffentlichen Hand zu behalten, begrüße ich ausdrücklich“, sagt von Scheidt. „Wünschenswert wäre, dass das DigiMed-Angebot verstetigt und weitere vergleichbare, parallel übergeordnete Cloud-Angebote aufgebaut werden, denn die Bedeutung der Daten bleibt über die Projektlaufzeit hinaus von hohem Nutzen für die gemeinwohl-orientierte Forschung.“

Dazu müssten die Betriebskosten der Cloud gesichert, außerdem mit wachsenden praktischen Erfahrungen deren Ausstattung optimiert werden: „So wurde im Projektverlauf zunehmend klar, dass die Integration von Rechenleistung und Grafikprozessoren oder GPU in die Secure Cloud sinnvoll ist“, stellt DigiMed-Geschäftsführer Wiehler fest. Die DigiMed Secure Cloud könnte an weitere Bedürfnisse angepasst und sich damit als Blaupause für vergleichbare Angebote entwickeln. Der Bedarf für geschützte Datentresore wächst auch im Gesundheitswesen: 2022 wurde Artikel 27 des Bayerischen Krankenhausgesetzes geändert, seither sind Kliniken und Hospitäler nicht mehr gezwungen, geschlossene IT- und Speichersysteme unter eigener Hoheit vorzuhalten. Sie könnten sich – so die Vision eines digitalen Gesundheitssystems – in sicheren Datenwolken mit Arztpraxen, Laboren, Apotheken vernetzen und anonymisierte, pseudonymisierte Untersuchungsdaten zudem mit ihren Patient:innen oder der Forschung teilen. Damit können Gesundheitsrisiken besser prognostiziert, Krankheitsursachen umfassend analysiert und Behandlungen wirkungsvoll personalisiert werden, die differenzierte Vorsorge wäre zudem möglich. (vs)

Technische Daten Secure DigiMed Cloud:

• 3 Management- und Rechenknoten, jeweils mit  Secure Encrypted Virtualisation
• Mehr als 500 sichere Kerne
• Speicherkapazitäten auf Basis von SSD/HDD
• 100-G-Hochleistungsnetzstruktur
• 1PB sicherer Rohspeicher
• OpenStack, Coverein Cloud Stack, Quobyte-Filesystem

Secure-2

Teamarbeit: Das LRZ-Team der Secure Cloud Florent Dufour (2. v. li), und Vincent Bode /3. v li) starten mit
DigiMed-Geschäftsführer Dr. Jens Wiehler (2. von re.) und Dr. Moritz v. Scheidt (li), stellvertretender Leiter,
die Digimed Secure Cloud gemeinsam durch den roten Buzzer. Foto: BioM