(Wie) können Big Data und maschinelles Lernen die Gesundheitsversorgung verbessern?
Die Digitalisierung unseres Lebens ist zu einer allgegenwärtigen Tatsache geworden. Wir haben viele digitale Dienste weitgehend übernommen und stellen Firmen wie Amazon, Facebook oder Google ohne zu zögern große Mengen an personenbezogenen Daten zur Verfügung. Allerdings bleibt die Skepsis groß, wenn es um die Verwendung von Daten zur Verbesserung des Gesundheitssektors geht.
Bei der Verbesserung der Diagnose bestimmter Krankheiten durch den Einsatz von Algorithmen des maschinellen Lernens und Big Data wurden große Fortschritte erzielt. So liefern Bilderkennungsalgorithmen beispielsweise beeindruckende Ergebnisse bei der Analyse von Augenscans oder bei der Identifizierung von Tumoren in radiologischen Bildern. Sie versprechen, menschliche Vorurteile und Fehler bei kritischen Entscheidungen zu überwinden. Solche Erfolge beruhen entscheidend auf großen Datenmengen mit hochwertigen Informationen. Um die Innovation und den Einsatz datengetriebener Methoden im Gesundheitswesen zu erhöhen, ist es daher von entscheidender Bedeutung, qualitativ hochwertige Daten zu erheben, zu kombinieren und sorgfältig zu nutzen.
Die Gesellschaften stehen vor mehreren großen Herausforderungen, wenn es darum geht, eine bessere und personalisiertere Gesundheitsversorgung durch den Einsatz von datengesteuerten Technologien zu ermöglichen. Diese Herausforderungen spiegeln einen entscheidenden Kompromiss zwischen den Vorteilen der Nutzung personenbezogener Daten und den Risiken wider, die mit der Erhebung und (schädlichem) Gebrauch solcher Daten verbunden sind.
Eine grundlegende Herausforderung ist der Schutz personenbezogener Daten, der Privatsphäre und des Rechts des Einzelnen auf Selbstbestimmung. Gesundheitsdaten enthalten einige der intimsten persönlichen Informationen, was natürlich wichtige Vertrauensfragen mit sich bringt. Die Ansätze der politischen Entscheidungsträger sind in den einzelnen Ländern unterschiedlich. Einige diskutieren ausführlich und abstrakt über Risiken und ethische Fragen im Zusammenhang mit der Datenerhebung und -nutzung, während private Unternehmen vorpreschen und fragmentierte Lösungen in einem unsicheren politischen Umfeld anbieten. Länder wie Dänemark, Estland oder Israel fördern und verbessern integrierte Gesundheitsdatensysteme, die es ihnen ermöglichen, führend in Sachen Datenschutztechnologien zu werden und wertvolle Erfahrungen beim Aufbau effizienter und verantwortungsvoller Systeme zu sammeln.
Eine zweite Herausforderung ist die Weiterentwicklung der Fähigkeiten, aus Daten zu lernen und letztlich Werkzeuge zu implementieren, die die Entscheidungen über die medizinische Behandlung zuverlässig verbessern können. Während die Zahl der Datenwissenschaftler*innen in den letzten Jahren explodiert ist, sind wichtige Hindernisse für die Nutzung von Gesundheitsdaten noch nicht beseitigt.
Unterschiede in der Datenqualität, vor allem die Qualität der dokumentierten beobachteten Ergebnisse von Entscheidungen, ist eine davon. Dies können die Gesundheitsergebnisse einzelner Patienten nach einer bestimmten Behandlung oder Diagnosen aus medizinischen Tests sein, z.B. zu bakteriellen Infektionen oder die Beurteilung medizinischer Bilder durch Radiologen. Da Algorithmen aus Informationen lernen, die in realen Daten kodiert sind, werden Fehler des medizinischen Personals bei solchen Diagnosen in algorithmische Vorhersagen übertragen. Daher kann eine Unterschätzung der Relevanz des Kontextes und der Entscheidungen, durch die Gesundheitsdaten generiert werden, schwerwiegende Folgen haben.
Ein weiteres Hindernis ist die sachkundige Nutzung und Entwicklung algorithmischer Vorhersagen, um ihr Potenzial zur Verbesserung der aktuellen Praxis von Gesundheitsexperten*innen zu verstehen. Die Stärke von Algorithmen besteht darin, Vorhersagen auf der Grundlage von Korrelationen in Daten zu treffen. Wie hoch ist beispielsweise die Wahrscheinlichkeit, dass ein Tumor bei einem medizinischen Bild mit bestimmten Merkmalen vorliegt? Dies kann erreicht werden, ohne zu verstehen, warum ein Tumor vorliegt. Die meisten relevanten Entscheidungen erfordern jedoch ein Verständnis der kausalen Auswirkungen von Handlungen, aus denen man wählen kann. Bisher liefern Algorithmen ohne menschliches Wissen dieses Verständnis nicht. Eine naive Implementierung von datengesteuerten Entscheidungsunterstützungs- oder Diagnosesystemen könnte daher scheitern.
Aufgrund dieser Herausforderungen wird die Generierung, Interpretation und Verwendung von Algorithmen mit großen Datenmengen in den kommenden Jahrzehnten menschliches Fachwissen erfordern. Vor diesem Hintergrund stellen sich wichtige offene Fragen:
– Wie können wir neue datengesteuerte Technologien und personalisierte Waren und Dienstleistungen nutzen, ohne eine digitale Dystopie zu riskieren?
– Wie können wir Entscheidungen auf der Grundlage algorithmischer Vorhersagen zuverlässig mit menschlichen Entscheidungen vergleichen?
– Wie können wir Vertrauen in die Qualität und Zuverlässigkeit von Blackbox-Algorithmus-Vorhersagen schaffen?
– Wie können wir Vertrauen in den fairen Umgang mit personenbezogenen Daten und Algorithmen schaffen?

Wissenschaftlicher Partner:

Betreuer des YES!-Teams und Autor des Themenvorschlags:
Hannes Ullrich
Foto: (c) Florian Schuh www.px-photo.de
Hannes Ullrich ist wissenschaftlicher Mitarbeiter in der Abteilung Unternehmen und Märkte am Deutschen Institut für Wirtschaftsforschung (DIW Berlin) und Associate Professor of Economics an der Universität Kopenhagen in Dänemark. Er ist auch CESifo Research Affiliate und Fellow am Berlin Centre for Consumer Policies (BCCP). Seine Forschungsinteressen liegen in der angewandten Ökonometrie in den Bereichen der Industrie-, Personal- und Gesundheitsökonomik.