Big Data im Gesundheitswesen – was können Routinedaten?

Das Informationssystem Versorgungsdaten (Datentransparenz) ist im Jahre 2014 gestartet. Ein Datenschatz aller rund 70 Millionen gesetzlich Versicherten in Deutschland ist seither verfügbar. Dieser beinhaltet u. a. Angaben über ambulante und stationäre Diagnosen sowie zur ambulanten Arzneimittelversorgung. Im Jahre 2017 stellt sich die Frage was diese Daten tatsächlich bringen? Und vor allem was das für Daten sind – diese sogenannten Routinedaten. Der auf dem Bild abgebildete Schrottplatz soll das Folgende symbolisieren: zum einen die schier unendlichen Daten und zum anderen den Aspekt, dass die Daten nur so gut sind, wie sie durch die Ärzte kodiert werden.

Begriff

Routinedaten im Gesundheitswesen sind standardisierte Informationen, die v.a. zu Abrechnungszwecken mit den Leistungserbringern erhoben werden. Dies sind bspw. Daten der Gesetzlichen Krankenversicherung (GKV), Renten- und Unfallversicherung (Sozialdaten), aber auch der amtlichen Statistik (z. B. Krankenhausdiagnose- oder DRG-Statistik, siehe auch Vergütungssystem). Im Gegensatz zu Primärdaten, die eigens für den wissenschaftlichen Verwendungszweck erzeugt werden, handelt es sich bei Routinedaten um bereits vorliegende Daten, die zunächst für andere, nicht primär wissenschaftliche Zwecke erhoben wurden.

Merkmale

Die zu Abrechnungszwecken zwischen Leistungserbringern und Krankenkassen übermittelten Daten der Gesetzlichen Krankenversicherung, um beispielhaft die am stärksten genutzten Routinedaten zu charakterisieren, sind durch Gesetzliche Bestimmungen (hier SGB V, vgl. Sozialgesetzbuch) und Verordnungen (GKV-Datenaustausch) weitgehend formalisiert und standardisiert. Unterschiede zeigen sich lediglich auf der technischen Ebene, also wie bei den Dateneignern die Versichertenstammdaten und die Versorgungsdaten organisiert sind. Für die wissenschaftliche Nutzung können die versorgungsrelevanten Daten nach projektspezifischen Vorgaben selektiert und i.d.R. in pseudonymisierter Form genutzt werden.

(C) DIMDI 2016
Aufbau (Datenkranz) der DIMDI-Versorgungsdaten

Vorteile

Die Vorteile der GKV-Routinedaten liegen zunächst in der Größe der in wissenschaftliche Auswertungen einschließbaren Population, in der Länge (Kontinuität) der beobachtbaren Zeiträume sowie in der Tatsache begründet, dass diese Daten einen weitgehend unverzerrten Blick auf die Versorgungsrealität gestatten. Weitere Vorzüge sind in der Erfassung der Nachfrage nach bestimmten Gesundheitsleistungen und der Aufschlüsselung nach soziodemographischen Faktoren (z.B. Alter, Geschlecht, Versichertenstatus) zu sehen. Da Routinedaten aus dem Versorgungsalltag stammen, weisen sie in der Regel eine hohe externe Validität auf, so dass allgemeine Rückschlüsse auf die Grundgesamtheit bei einer ausreichend großen Stichprobe grundsätzlich möglich sind. Weitere Vorteile der Routinedaten liegen insbes. in folgenden Eigenschaften und Informationen: Personenbezug, Populationsbezug, Arzt- und Institutionenbezug, Behandlungsdaten aller Sektoren, mögliche Zuordnung von Kosten und einer kostengünstigen Beschaffung. Diese Eigenschaften unterstreichen, dass Routinedaten eine wichtige Informationsquelle zur Darstellung der erbrachten Versorgungsleistungen (Output) sowie der Intensität ihrer Inanspruchnahme sind. Routinedaten-/Sekundärdaten stehen in Abwägung ihrer Vor- und Nachteile durchaus gleichberechtigt neben Primärdaten.

Primäres Ziel

Primäres Ziel von Routinedaten, hier konkret der GKV-Daten, ist die Erfassung von – meist abrechnungsrelevanten – Informationen aus der medizinischen Routineversorgung. Ziele der Nutzung der Routinedaten als Sekundärdaten sind bspw. die Beantwortung von epidemiologischen Fragestellungen, von Fragen der Versorgungsforschung, der Qualitätssicherung oder die Erkenntnisgewinnung für gesundheitsökonomische Studien. Die genannten Merkmale und die mit der wissenschaftlichen Nutzung dieser Daten verbundenen Zielsetzungen gelten in ähnlicher Weise für die Routinedaten anderer Sozialversicherungsträger und weiterer Dateneigner.

Maßnahmen bzw. Instrumente

In Anlehnung an die im Jahre 2000 veröffentlichte „Gute Epidemiologische Praxis“ (GEP) wurde erstmalig im Jahr 2005 ein Standard für die Verwendung und Auswertung von Routinedaten im Gesundheitswesen etabliert, der zugleich Grundlage für vertragliche Absprachen zwischen Primärnutzern (wie bspw. Krankenkassen) und Sekundärnutzern (wie bspw. Forschungsinstituten) sein soll. Die erste Version der „Guten Praxis Sekundärdatenanalyse“ (GPS) wurde von der Arbeitsgruppe Erhebung und Nutzung von Sekundärdaten (AGENS) der Deutschen Gesellschaft für Sozialmedizin und Prävention (DGSMP) und der Deutschen Gesellschaft für Epidemiologie (DGEpi) veröffentlicht. Bis 2014 erfuhr die GPS zwei weitere Revisionen. Formal orientiert an der GEP, aber durchaus als eigenständiger methodischer Standard zu verstehen, umfasst die GPS insgesamt elf Leitlinien, die von ethischen Prinzipien über Qualitätssicherungsmaßnahmen bis hin zur verantwortungsvollen Kommunikation der Analyseergebnisse reichen. Hierbei wurden insbes. weitere Empfehlungen zur Leitlinie Datenschutz ergänzt.

Aktuelle Diskussion

Die Nutzung von Routinedaten im Gesundheitswesen hat in den vergangenen Jahren stetig zugenommen. Mittlerweile beschäftigen sich die unterschiedlichsten Fachdisziplinen mit Routinedaten. Ihr Einsatzspektrum reicht von der Versorgungsforschung über gesundheitsökonomische Analysen bis hin zur Verwendung für Modellierungen im Medical Decision Making und Health Technology Assessment (HTA). Auch vom Gesetzgeber wurde die Bedeutung dieser Datenquellen für die Gesundheitsberichtserstattung, Evaluation und Steuerung unseres Gesundheitssystems erkannt. Die zunehmenden technischen Möglichkeiten haben ebenso dazu geführt, dass größere Datenmengen unkompliziert verarbeitet werden können. Dabei nimmt die Analyse- und Aussagefähigkeit mit der Größe des erhobenen Datenmaterials zu, da eine bessere Repräsentanz der Versichertenpopulation gegeben ist. Sekundärdatenanalysen werden zunehmend als Datengrundlage der Gesundheitswissenschaft und der Gesundheitspolitik genutzt.

Im Zuge der anfangs erwähnten Datentranzparenzverordnung melden die einzelnen Daten an das Bundesversicherungsamt (BVA), welches wiederum die Daten an das Deutsche Institut für Medizinische Dokumentation und Information (DIMDI) übermittelt. Theoretisch ist vieles möglich. Praktisch gibt es Herausforderungen. Zum einen sind die inhaltlichen Kenntnisse über den Umgang mit Routinedaten unterschiedlich Das reicht von der Logik der Datenkodierung bis hin zu Structured Query Language (SQL)-Kenntnissen. Es ist ein Balance-Akt zwischen einem möglichst einfachem Zugang und möglichst hohem Schutz des Individuums. Die bisherigen Anfragen, die beim DIMDI eingegangen sind bewegen sich im zweistelligen Bereich. Vorliegende Ausgleichsjahre sind 2009-2013. Der Zeitverzug kommt zustande, weil die Daten aufwendig aufbereitet werden müssen. Wenn Sie zu den berechtigten Institutionen (§§ 303a bis 303e Sozialgesetzbuch V) gehören, dann können sich spannende Fragestellungen ergeben. Dieser „Public Use File“ ist trotz der Kritik der eingeschränkten Analysemöglichkeiten ein Datenschatz. Denn: bei vielen Krankheiten in Deutschland gibt es nicht einmal verlässliche Zahlen über Inzidenzen und Prävalenzen. Alleine diese rein deskriptiven Analysen bieten schon enorm viel Potenzial. Aber eines sei auch noch erwähnt: Leider steht derzeit noch kein Gastarbeitsplatz beim DIMDI (vollends) zur Verfügung, so dass ein Antrag auf Datenfernverarbeitung zu stellen ist. Und sicherlich ist etwas Zeit nötig, nach dem Ziehen eines Tickets.

Weiterführende Literatur

Beitrag zu Routinedaten (Langfassung): http://wirtschaftslexikon.gabler.de/Definition/routinedaten-im-gesundheitswesen.html

Ende 2016 wurde der Evaluationsbericht durch das DIMDI veröffentlicht: http://www.dimdi.de/static/de/versorgungsdaten/wissenswertes/evaluationsbericht.html

Quelle: xing newsProf. Dr. David MatusiewiczProf. Dr. David Matusiewicz

Schreibe einen Kommentar