13 Über Data Sharing und Open Humanities

2014-12-17

Eine Notiz von Ben Kaden (@bkaden)

Der freie Zugang zu Forschungsdaten und damit die allgemeine Nachnutzbarkeit von Datenbeständen sind ein zentraler Aspekt des Diskurses zum zukünftigen Publizieren in den Geisteswissenschaften. Denn natürlich ist es gerade für Infrastrukturanbieter wie Hochschulbibliotheken aber auch für Wissenschaftsdienstleister wie zum Beispiel Verlage sehr wichtig, absehen zu können, in welcher Form Forschungsdatenrepositorien aufzubauen und zu implementieren sind, welche Werkzeuge und Infraststrukturen für welche Varianten des Data Sharing notwendig werden, auf welcher Basis die Frage der Langzeitarchivierung und idealerweise auch der Langzeitverfügbarkeit von Forschungsdaten adressiert wird und schließlich welche Datenstandards, Austauschformate u.ä. vorliegen oder noch entwickelt werden müssen.

Angesichts dieser Herausforderungen ist es möglicherweise gar nicht so schlecht, dass das Teilen von Forschungsdaten nach dem Open-Data-Konzept bisher keinesfalls der Regelfall ist, wie ein aktueller Aufsatz in der Zeitschrift Research Policy für die Wirtschaftswissenschaften nachweist. (Andreoli-Versbach, Mueller-Langer, 2014) Dort ist nur ein sehr kleiner Teil der Community bereit, sein Datenmaterial den Peers oder darüber hinaus der Allgemeinheit zur Verfügung zu stellen.

Eigene Erfahrungen sowie Eindrücke aus der laufenden Fu-PusH-Interviewrunde mit FachwissenschafterInnen lassen nicht vermuten, dass sich die Situation in den Geisteswissenschaften grundlegend anders darstellt. Prinzipien der Open Science bzw. eher noch Open Scholarship oder Open Humanities werden weithin begrüßt. Jedoch gilt sowohl für die Open-Access-Idee als auch für den Open-Data-Ansatz, dass dieses Wohlwollen eher prinzipieller Natur ist und die konkrete Umsetzung weit dahinter zurücksteht.

Dabei gibt es gute Gründe für das Offenstellen und Teilen von Forschungsdaten. Patrick Andreoli-Versbach und Frank Mueller-Langer betonen folgende Aspekte:

  1. Es erleichtert die Reproduktion von Forschungsergebnissen.
  2. Es erhöht die Glaubwürdigkeit empirischer Forschung.
  3. Es verbessert die Genauigkeit von Forschung und wirkt als Anreiz, datenspezifische Fehler zu vermeiden.
  4. Es reduziert Betrug.
  5. Es ermöglicht Forschern bestehende Datensätze zu verwenden, um neue Fragestellungen an dieses Material zu beforschen. (vgl. LIBREAS, 2014)

Denkt man darüber hinaus an das für die Digital Humanities sehr zentrale Feld der Quellendigitalisierung und der Erstellung und Erschließung von Textkorpora als Forschungsdaten, so wird zunächst deutlich, dass man Empirie hier vielleicht anders interpretieren muss. Aber gerade das letztgenannte Argument einer flexiblen Nachnutzung und Re-Interpretierbarkeit solcher Datensätze erweist sich nicht zuletzt aus wissenschaftsökonomischen Gesichtspunkten als sehr stark. Dabei ist jede Edition natürlich bereits jetzt eine Art Forschungsdatenpublikation. (vgl. dazu auch Kindling, 2009)

Insofern sind die Geisteswissenschaften hier punktuell den Sciences sogar etwas voraus. Open Data in einem Open-Scholarship-Kontext würde aber mehr als bisher bedeuten, dass diese Forschungsdaten nicht nur an sich publiziert sind, sondern möglichst in leicht nachnutzbaren Formaten über entsprechende Infrastrukturen. Das TextGrid-Repositorium könnte hier ein Ansatz sein.

Interessant an der Untersuchung von Patrick Andreoli-Versbach und Frank Mueller-Langer ist zudem, wie sehr die Bereitschaft des Zugänglichmachens von Forschungsdaten nach wie vor von individuellen Einstellungsmustern und, Stichwort: Tenure, Anstellungsmustern geprägt ist. Ein Trend auch in den Interviews bei Fu-PusH ist, dass Ideen wie Open Data und Open Scholarship aber auch offene Publikationskonzepte wie das Bloggen gerade nicht von NachwuchswissenschaftlerInnen praktiziert werden. Diese gehen bei aller Sympathie und Aufgeschlossenheit häufig auf Nummer sicher und folgen, sofern sie eine wissenschaftliche Karriere anstreben, vorsichtshalber den ganz traditionellen Pfaden.

Open Scholarship ist noch immer hauptsächlich etwas, was sich WissenschafterInnen mit einem bestimmten Absicherungsgrad im Wissenschaftsbetrieb leisten. Sie bleibt also in gewisser Weise ein Luxus. Wer dabei aktiv wird, ist wiederum – so auch eine Erkenntnis von Patrick Andreoli-Versbach und Frank Mueller-Langer – bisher vor allem aus eigener Überzeugung dazu bereit. Welche Motivationen individuell für diesen Bruch mit den etablierten Verfahren der wissenschaftlichen Kommunikation vorliegen, wäre eine schöne Forschungsfrage für die Wissenschaftssoziologie.

Ein Eindruck aus den Fu-PusH-Interviews ist jedenfalls, dass wir in den meisten geisteswissenschaftlichen Disziplinen intradisziplinär de facto zwei Publikationskulturen vorfinden: eine Normwissenschaft (sehr traditionell, auch digital dem Printparadigma möglichst nah bleibend) und unterschiedlich intensiv ausgeprägte Abweichungen im Publikations- und Kommunikationsverhalten (Open Access, Social-Media-basiertes Kommunizieren, etc.).

Digitale Wissenschaft und die elaborierte wissenschaftskulturelle Variante der Open Scholarship scheinen schließlich da besonders verbreitet, wo die Forschung bereits traditionell digitalen Hilfsmitteln und Werkzeugen gegenüber aufgeschlossen war (z.B. in der Sprachwissenschaft und der Archäologie). Entsprechend spielen forschungspraktische Aspekte mutmaßlich eine wichtige Rolle.

Da wir im laufenden Untersuchungsverfahren von Fu-PusH nicht nach Wissenschaftsfeldern und wissenschaftsstrukturellen Bedingungen mappen, können wir leider keine belastbaren Aussagen zwischen dieser Beobachtung und einem möglichen Institutionalisierungsgrad von Open-Scholarship-Elementen in den Kommunikationspraxen der jeweiligen Communities treffen. Es lässt sich jedoch durchaus die Hypothese formulieren, dass dort, wo sich bestimmte übergreifende Infrastrukturen etablieren (beispielsweise die Blogplattform Hypotheses in den Geschichtswissenschaften), eine höhere Akzeptanz in der Community über den Faktor persönlicher Präferenzen hinaus herausbildet. Kurz gesagt: Wo belastbare und technisch und institutionell stabile und einfach benutzbare Infrastrukturen für offenere Kommunikationsformen vorliegen, dürfte die Chance auf eine breitere überindividuelle Nutzung in der Community und damit eine Annahme durch die Community als akzeptable und sinnvolle Kommunikationsform mit der Zeit steigen. Wenn einige Leuchttürme des Faches relevante Inhalte dort (möglichst bevorzugt) publizieren, wird sich die Etablierung dieser Plattformen und Verfahren beschleunigen.

Das klingt trivial, erweist sich in der Praxis aber als sehr kompliziert. Die Akzeptanz digitaler und offenerer Formen der wissenschaftlicher Kommunikation ist an mehrere Faktoren geknüpft. Neben einer individuellen Bereitschaft (oder Einsicht) sind es geeignete technische Möglichkeiten und angemessene, eindeutige und akzeptable Kommunikationsregeln.

Wenig überraschend weisen Patrick Andreoli-Versbach und Frank Mueller-Langer darauf hin, dass das Vorhandensein von Data Availability Policies (oder besser noch Mandatory Data-Disclosure Policies) besonders bei High-Impact-Journals in einer Disziplin die Motivation erhöht, Datenmaterial auch über die Zeitschrift hinaus zugänglich zu machen. Wer nämlich seine Datenbasis für eine derartige Begleitpublikation einmal aufbereitet hat, tut sich mutmaßlich entscheidend leichter, sie auch anderweitig einsehbar zu machen. Ein qualitativ hochwertiger Datensatz kann (und könnte in Zukunft noch umfassender) reputationsfördernd sein. Allerdings fehlen auch bei der Kreditierung von Datenerhebung (vielleicht auch erheberrechtlich als Pendant zum Urheberrecht) und -aufbereitung noch wissenschaftskulturelle Standards.

Patrick Andreoli-Versbach und Frank Mueller-Langer sehen naheliegend die Zeitschriften und die Hochschulen in der Pflicht, sich für Fortschritte im Bereich des Data-Sharing zu engagieren. Dies wird allerdings nur im Dialog mit den Wissenschaftsgemeinschaften gelingen.

Was die Institutionen, zu denen auch wissenschaftliche Bibliotheken und andere Infrastrukturanbieter zu zählen sind, in jedem Fall einbringen können, sind Angebote und Dienste, die bedarfsgerecht und in puncto Usability auf die Ansprüche durchschnittlicher WissenschaftlerInnen zugeschnitten eine Praxis der Openness in der wissenschaftlichen Kommunikation inklusive des Kommunizierens von Forschungsdaten unterstützen. Denn dass der Focus derzeit Disziplin übergreifend verstärkt auf Forschungsdaten rückt, steht außer Frage. Wo Big Data und datenintensive Humanities Konzepte der Stunde sind, sollte man konsequenterweise auch die gesamte Kette bis hin zum generell offenen Data-Sharing bedienen können.

Quellen:

Patrick Andreoli-Versbach, Frank Mueller-Langer (2014) Open access to data: An ideal professed but not practised. In: Research Policy. Volume 43, Issue 9, November 2014, S. 1621–1633. DOI: 10.1016/j.respol.2014.04.008

Maxi Kindling (2009) Möglichkeiten der Strukturmodellierung – eine exemplarische Zusammenführung funktionaler Anforderungen an die Bereitstellung digitaler Forschungsdaten für ausgewählte geisteswissenschaftliche Disziplinen. Berlin: Humboldt-Universität zu Berlin, Philosophische Fakultät I, urn:nbn:de:kobv:11-100185124

LIBREAS-Redaktion (2014) Anreize für Open Data müssen von den Journals und den Hochschulen kommen. Meinen Patrick Andreoli-Versbach und Frank Mueller-Langer. In: LIBREAS.Tumblr, 17.12.2014, http://libreas.tumblr.com/post/105441026466/opendata

Lizenz

Icon for the Creative Commons Attribution-ShareAlike 4.0 International License

Das Fu-PusH-Weblog by Ben Kaden & Michael Kleineberg is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License, except where otherwise noted.

Dieses Buch teilen

Rückmeldung / Fehlermeldung

Kommentare sind gesperrt