Open Data: Weil gute Daten FAIR-zaubern!

Zur Open-Science-Bewegung, zu der neben Open Access auch Open Educational Resources, Open Peer Review, Open Methodology und Open Source gehören, zählt außerdem Open Data.

Im Gegensatz zu Open Access konzentriert sich Open Data auf Informationen, die nicht in textlicher Form gebunden sind. Unter Open Data wird somit gemeinhin die freie Verfügbarkeit und Nutzung von Daten zusammengefasst. Der Grundsatz der Europäischen Kommission zu Open Data lautet: "As open as possible, as closed as necessary!". Deshalb gibt es hier auch die Möglichkeit, von einem freien Zugang zu Forschungsdaten abzusehen und deren Nachnutzung über Lizenzen zu regeln.

Der große Mehrwert von offenen Daten ist, dass ihr freier Zugang einen gesellschaftlichen Nutzen verschafft und das Potenzial für die Forschung voll ausgeschöpft werden kann. Open Data gewährt damit die erneute Verwendung von digitalen Forschungsdaten, die in nahezu jedem Forschungsprozess entstehen: zum Beispiel Fotos, Scans, numerische Messungen, Transkriptionen oder Videos. Diese einzigartigen und aufwendig erzeugten Daten müssen angemessen erschlossen, aufbereitet sowie für die spätere Nutzung bereitgestellt und archiviert werden. Nutzende sollten ihre Forschungsdaten dabei verantwortungsbewusst im Sinne der sogenannten "FAIR"-Prinzipien behandeln. Das Akronym "FAIR" repräsentiert die vier Grundprinzipien, die idealerweise bei der Handhabung von Forschungsdaten beachtet werden sollten.

Dies sind Beispiele für die einzelnen Pfeiler, weiterführende Informationen gibt es bei der Initiative GO FAIR:

  • Findable (Auffindbar): Forschungsdaten werden durch aussagekräftige Metadaten beschrieben. Die Metadaten basieren auf einem standardisierten Schema und werden in zentrale Suchmaschinen eingespeist.
  • Accessible (Zugänglich): Jeder Forschungsdatensatz besitzt eine eindeutige ID, über die er dauerhaft erreichbar ist. Der Zugriff auf die Forschungsdaten erfolgt durch standardisierte Verfahren. Falls die Daten zugriffsbeschränkt sind, sind Zugriff und Authentifizierung klar geregelt.
  • Interoperable (Interoperabel): Für alle Daten werden möglichst Standard-Datentypen genutzt. Das heißt, insbesondere werden keine proprietären Dateiformate eingesetzt, Abweichungen von bestehenden Standards werden dokumentiert.
  • Reusable (Nachnutzbar): Die Daten werden derart lizenziert, dass andere Forschende sie möglichst umfänglich nachnutzen können. Datenerfassung und -speicherung folgen fachspezifischen Standards.

Durch die Berücksichtigung der FAIR-Prinzipen wird die Idee eines offenen wissenschaftlichen Austauschs – ganz im Sinne der Open-Science-Kultur – ideal unterstützt.