Herausforderungen des Publizierens von Forschungsdaten. Zu einem aktuellen Beitrag in Science.

Ben Kaden & Michael Kleineberg

2015-12-14

Eine Notiz von Ben Kaden (@bkaden)

In der aktuellen Ausgabe der Zeitschrift Science findet sich ein Artikel von Jorge L. Contreras und Jerome H. Reichman zu Strukturen und Kosten des Teilens von Forschungsdaten. Damit schließen sie an eines der Trendthemen unter anderem auch in der Bibliothekswissenschaft und Informationsinfrastrukturforschung an. Je mehr man sich mit den Themen Forschungsdaten und Forschungsdatenpublikation befasst, desto deutlicher treten freilich die Desiderata hervor. Allem voran geht die Frage nach der Möglichkeit entsprechender allgemeinverbindlicher Minimalstandards. Klar ist, dass der Trend zur Openness, der sich in Formeln wie „Open Science“ und „Open Scholarship“ kristallisiert, die gegenwärtige Wissenschaftspraxis maßgeblich prägt. Forschungsdaten sollen neben den Forschungspublikationen – also den als Paper, Aufsatz, Blogpost, Monografie o.ä. veröffentlichten Forschungsnarrativen – möglichst ohne Einschränkung zur Einsicht und Nachnutzung verfügbar gemacht werden.

Die Motivation findet sich einerseits im Erhöhung der Forschungstransparenz ergo Nachvollziehbarkeit der in den Forschungspublikationen dargelegten Analysen und Deutungen. Andererseits greift das durchaus ökonomisch motivierte Argument, dass man den einmal erhobenen Datensatz auch für andere Analysen heranziehen und beforschen kann. Das nennt man Nachnutzung.

Ein nächste Stufe der Forschungsdatenintegration wird schließlich erreicht, wenn man die einzelnen Datensätze vor der Veröffentlichung so aufbereitet, dass sie maschinenlesbar und automatisiert mit anderen Datensätzen verknüpfbar werden können. Derartige Netzwerke strukturierter Daten sind eine Herzensangelegenheit der Digital Humanites und ein bibliotheks- und netzwissenschaftes Perspektivthema, dem massives Potenzial zugeschrieben wird. Big Data und Semantic Web sind die rahmenden Termini.

An sich klingt es einfach und lässt sich prima an die Commons-Überlegungen der Netzkultur anschließen, wenn Jorge Contreras und Jerome Reichmann schreiben:

„Perhaps the most straightforward path to legal interoperability is simply to contribute data to the public domain and waive all future rights to control it. This approach has been advocated by more than 250 organizations that have endorsed the 2010 Panton Principles for open data in science.“

Die wissenschaftliche Realität setzt diesem Wunsch nach Gemeinfreiheit freilich ein ganze Bandbreite von Hürden entgegen, die nun zum Teil auf den persönlichen Verwertungs- und Kontrollanspruch der jeweiligen Datenerheber zugeführt werden können. Gerade persönlichkeitsrechtliche Aspekte und das hohe Gut des Datenschutzes bremsen die Möglichkeiten der Forschungsdatenpublikation vor allem dort, wo es sich um empirische Sozialforschung handelt. Auch wir konnten im Rahmen des Fu-PusH-Projektes entsprechend qualifizierte Erfahrungen sammeln.

Eine weitere Herausforderung bei der offenen Datenpublikation liegt schließlich in der wissenschaftstheoretischen Fragestellung, wie sehr der konkrete Forschungskontext – also die Forschungsfrage – das zulässige Analyse- und Deutungsspektrum für einen Datensatz definiert. Und schließlich unterläuft die künstlerisch orientierte Remixkultur des Netzes, auf die auch einige der Creative-Commons-Lizenzen vorrangig abzielen, den wissenschaftlichen Anspruch an Datenintegrität. Das kreative „Verändern“ von Forschungsdatenkontexten ist mit der guten wissenschaftlichen Praxis kaum vereinbar. Jorge Contreras und Jerome Reichmann benennen Creative Commons dennoch als Option:

„Alternatively, researchers who wish to receive attribution credit for their contributions, but are otherwise willing to relinquish control over them, have released data under standardized Creative Commons licenses that have been widely used for other online content, including open-source code software, music, and photographs. „

Sie merken zugleich an, dass diese Ansätze unzureichend und problematisch sein können. Dies bestätigt auch unser während des Projektes gewonnener Eindruck. Das Thema liegt sehr im Trend, wird aber derzeit an vielen Stellen jedenfalls in den Geisteswissenschaften eher allgemein als auf konkret realisierbare Lösungen hin diskutiert. Das könnte seine Ursache auch darin haben, dass aktuell Akteure fehlen, die Aktivitäten im Bereich der digitalen Forschungsdatenpublikationen für diese Disziplinen übergreifend und vor allem fachkulturell weithin anerkannt koordinieren.

Quelle:

Contreras, Jorge L.; Reichmann, Jerome H.: Sharing by design: Data and decentralized commons. In: Science 11 December 2015: Vol. 350 no. 6266 pp. 1312-1314 DOI: 10.1126/science.aaa7485

Lizenz

Icon für Creative Commons Namensnennung-Weitergabe unter gleichen Bedinungen 4.0 International

Das Fu-PusH-Weblog Copyright © 2016 by Ben Kaden & Michael Kleineberg is licensed under a Creative Commons Namensnennung-Weitergabe unter gleichen Bedinungen 4.0 International, except where otherwise noted.

Lizenz

Dieses Buch teilen