Im Zuge der Digitalisierung und entsprechend der aktuellen Datenstrategie der Bundesregierung erfreut sich das Gesundheitswesen an der Durchsetzung einer Patienten-zentrierten Verwaltung von Gesundheitsdaten, die durch das Digitale-Versorgung-Gesetz (DVG), dem Patientendatenschutz-Gesetz (PDSG) und der Datentransparenzverordnung (DaTraV) mittels der Verankerung in §363 SGB V juristisch adressiert werden. Ein wichtiger Bestandteil dieser Gesetze sieht vor, dass die Versorgungs- und Behandlungsdaten von Patienten freiwillig unter Einhaltung der gesetzlichen Rahmenbedingungen und auf Grundlage einer Einwilligung aus der elektronischen Patientenakte und für Forschungszwecke ab Januar 2023 gespendet werden können. Hierzu sollen die Daten an ein Forschungsdatenzentrum (benannte Stelle: Bundesinstitut für Arzneimittel und Medizinprodukte - BfArM) weitergeleitet werden, welches als Datentreuhänder mit der Verwaltung der Daten betraut wird und diese der medizinischen Forschung zur Verfügung stellen soll. Kritisiert wird hierbei gegenwärtig, dass entsprechend der DaTraV ebenfalls Sozialdaten ohne eine Einwilligung oder ein Widerspruchsrecht des Versicherten von den Krankenkassen an das Forschungsdatenzentrum weitergeleitet werden sollen und Nutzungsberechtigte auf Grundlage einer Selbstverpflichtung dazu berechtigt werden die Daten an Dritte weiterzuleiten, ohne Prüfung der Nutzungsberechtigung dieser. Dies führt zu einer Gefährdung der Persönlichkeitsrechte des Datensubjekts und trägt nicht zur Förderung der Akzeptanz solcher Lösungen in der breiten Gesellschaft bei, obwohl die Verknüpfung und Analyse der gesammelten Daten durch die Forschung ein enormes Potential für Einblicke in den körperlichen und psychischen Gesundheitszustand sowie Lebensstil eines Menschen bietet. Insbesondere die Forschung zu seltenen Erkrankungen kann von einer Datenspende profitieren, da häufig durch die Seltenheit, Komplexität und Unspezifität von bestimmten Krankheitsbildern und Symptomen noch enormer Forschungsbedarf besteht und gleichzeitig die Datenlage dünn ist. Zusätzlich zeichnen sich die Krankheiten durch einen lebenslangen Verlauf mit chronischen Beschwerden und Einschränkungen der Lebensqualität aus, welche sich oftmals mit zunehmenden zeitlichen Fortschritt verstärken jedoch durch eine frühzeitige Diagnose verlangsamt oder einige Symptome gar gestoppt werden können. Diese Problemstellung gilt insbesondere für den gewählten Anwendungsfall der Schlafforschung, beschränkt sich jedoch nicht nur auf diesen und gilt für alle Leiden mit einer eingeschränkten Datenlage.
Schlafbezogene Störungen betreffen bei gleichzeitig steigender Tendenz etwa ein Drittel der Bevölkerung, sie stellen einen wesentlichen Risikofaktor für kardiale und psychische Folgeerkrankungen dar. Der weit überwiegende Teil entfällt auf Insomnie, das Schlafapnoe- und das Restless-Legs-Syndrom, welche sämtlich gut charakterisiert sind. Viele der etwa 80 Schlafstörungen treten vergleichsweise selten in Erscheinung, ihre Diagnostik würde von einer verbesserten Datenlage wesentlich profitieren. Zentrales Element der Diagnostik solcher Störungen ist die Polysomnographie im Schlaflabor, die Prozesse zur Erhebung der Daten sind hochstandardisiert. Durch die standardisierten Studienabläufe zeigen aktuell Daten von Polysomnographien eine gewisse Datenqualität auf, welche zwischen verschiedenen Schlaflaboren aufgrund von verschiedenen technischen Infrastrukturen und der Zersplitterung der Datenablage schwanken kann. Oftmals leidet die Datenqualität durch fehlende oder uneinheitliche Zusatzdaten (Daten aus der Versorgung, Scorings, Metadaten). Die in Schlaflaboren vielzählig vorhandenen klinischen Daten aus Diagnostik und Studien sind meist nicht für eine Sekundärnutzung vorgemerkt oder Einwilligungen fehlen. So ist die Nutzung dieser Daten im Kontext der Forschung ausschließlich in stark anonymisierter Form möglich und ihr Nutzungspotential wird abgeschwächt. In den letzten Jahren wurden die Datenschutzbestimmungen mehrfach verschärft, was dazu führt, dass selbst die retrospektive Auswertung eigener diagnostischer Daten zunehmend problematisch und zeitintensiv wird. Insbesondere zur Verbesserung der Therapie und Diagnostik schlafbezogener Störungen im klinischen und ambulanten Umfeld wird ein erheblicher Mehrwert dieser Daten gesehen, aber auch zur Verbesserung der Standardisierung zwischen verschiedenen Schlaflaboren und zur Gewinnung neuer Marker, um spezifische personalisierte Therapieansätze und Therapie-Kontrollmechanismen erschließen zu können und ein besseres Verständnis des Phänomens Schlaf zu gewinnen.
Darüber hinaus sieht sich die Schlafforschung mit einer Replikationskrise konfrontiert. Eine exakte Reproduktion der Ergebnisse von wissenschaftlich veröffentlichten, datengetriebenen Methoden und Ansätzen (z.B. Methoden der künstlichen Intelligenz) ist zumeist unmöglich, da der Zugang zu den verwendeten Datensätzen, aufgrund von Datenschutzeinschränkungen/-bedenken oder fehlender Einwilligung, verwehrt bleibt. Hierdurch bleibt die Aussagekraft jener Ergebnisse eingeschränkt und diese können ohne die Verfügbarkeit von aggregierten, umfangreichen Datenmengen nicht ihr volles Potential für die Forschung entfalten. Es ist daher ein ethisch einwandfreies System nötig, mit dem Patienten und Studienteilnehmende ihr informiertes Einverständnis zu einer Datennutzung dokumentieren oder es auch widerrufen können.