52 Wie digital archivieren? Wolfgang Ernst befasst sich in der ZfBB mit der Memorisierung des Web.

2015-08-18

Eine Notiz von Ben Kaden (@bkaden).

Eine zentrale Frage für alle, die sich mit konkreten Lösungen für kulturelle Überlieferungen befassen und damit insbesondere „Gedächtnisinstitutionen wie Archiv und Bibliothek“ (Wolfgang Ernst), lautet: Wie sammeln und archivieren wir digitale Inhalte möglichst lange und möglichst verfügbar? Die aktuelle Ausgabe der Zeitschrift für Bibliothekswesen und Bibliografie (ZfBB) widmet sich nun dieser Herausforderung unter der Überschrift „Webarchivierung in Bibliotheken“.

In seinem Beitrag Memorisierung des »Web« – Von der emphatischen Archivierung zur Zwischenarchivierung der Gegenwart analysiert der Medientheoretiker Wolfgang Ernst vor allem aus der Perspektive von Zeitlichkeit und Flüchtigkeit:

„Das Vertrauen auf die Strahlkraft des Wissens in Archiven und Bibliotheken, das seit Zeiten der Schriftträger und des Buchdrucks das abendländische Bewusstsein prägt, unterliegt einer doppelten Transformation, die radikaler nicht sein kann. Einmal wandeln sich litterae in binär kodierte Datenworte (Bits); zudem transformiert ihre Substanz von dauerhafter Fixierung (Tinte und Druckschwärze) in flüchtige Ladungen und Impulse – von der der Inschrift zum Datenstrom.“

Und eigentlich geht es auch um das Konzept von Geschichtlichkeit, das für unsere Kultur und vor allem auch die Geisteswissenschaften prägend war und ist und das nun vielleicht gefährdet ist. Denn:

„Das vertraute Konzept von historischer Zeit bedeutet Computern nichts.“

Was freilich implizierte, dass Computer so etwas wie Bedeutung kennen könnten. Solange sie allerdings im Erbe der Kommunikationstheorie nach Claude Shannon operieren, ist das nicht zu erwarten. Sinnvoller wäre folglich, zu fragen, ob wir das Konzept der historischen Zeit im Digitalen verankern wollen? Bejahen wir das, muss man entsprechende informatische Strategien angehen. Das ist selbstredend eine Kulturaufgabe ersten Ranges. Gedächtnisinstitutionen allein sind, wie aus dem Text Ernsts immer wieder hervorgeht, bereits damit vollausgelastet, die Ansprüche der digitalen Gegenwart anzunehmen, die ihrer Tradition doch erheblich entgegenstrebt.

Echtzeit und Differenz

Das beginnt bei der Form des Sammlungsgegenstandes, sofern man im Digitalen den Sammlungsbegriff überhaupt noch sinnvoll bemühen kann. Besonders kennzeichnend für das Digitale ist bekanntlich, dass es nicht mehr um die geschlossene Einheit des Dokuments geht, sondern um die Veränderungen von Inhalten, also Webseiten, die in einem Verfahren gesichert werden, das man Incremental Harvesting nennt. Bei diesem werden nur die Daten für die Archivierung neu erfasst, die sich im Vergleich zur Vorversion, also der bestehenden Archivkopie eines Datenobjektes, verändert haben. Für Ernst folgt daraus, dass die klassische Aussage als Bezugsgröße durch die „Differenz als Information“ abgelöst wird.

Interessant an seinem Text ist zudem, dass er die Institution Bibliothek und insbesondere die Nationalbibliothek mit ihrem nationalen Sammelauftrag als „die Gejagten des Internets“ sieht, deren digitales Sammelgut sich wie auch ihr „territorialer Bezugsrahmen“ sich permanent verändern. Wo sich Zusammenhänge heterotopisch und chronotopisch verändern, muss die Bibliothek dynamisch gedacht werden und, so könnte man vielleicht ergänzen, als digitale Bibliothek womöglich utopisch, d.h. also – auch vom Konzept der Derrida’schen Différance her – als permanente Verschiebung. Die damit zu verknüpfende bibliothekarische bzw. webarchivistische Sammeltätigkeit lässt sich nicht weniger von inhaltlichen bzw. semantischen Auswahl her denken, sondern als intervall-basiertes Sampling. Das Zeitmaß der digitalen Kultur ist die Echtzeit.

Wissen und seine Aktualisierung

Die konsequente Verflüssigung harmoniert ganz gut mit der Idee des Wissens, die es auch schon in der Druckkultur gab: „Wissen an sich war immer schon notwendig instabil.“ Die Fixierung auf Trägermedien markierte dabei Gültigkeitsintervalle und mit der nächsten Auflage wurde es dann manifest aktualisiert. Dies verdichtet sich für Ernst im Konzept der nie endgültigen Einträge in der Wikipedia. Diese Wissenskultur setzt auf die „Zeitform der beständigen Aktualisierung“. Archivierbar sind daher keine geschlossenen Einheiten sondern allein Momentaufnahmen, zeitgestempelte Zeugnisse von Zwischen(zu)ständen, erfasst nach der numerus currens die der Veröffentlichungszeit entspricht. Die Zugangskanäle in diese Datenarchive sind noch zu entwickelen, beispielsweise als „stochastische Suche statt bibliothekarischer Klassifikation.“

„Das bedeutet, die alte Form der Gedächtnisorganisation nicht auf das neue Medium ab[zu]bilden, sondern die Wissensästhetik des Web selbst zum Ausgangspunkt zu nehmen.“

Indem man dem folgt, lösen sich auch die Trennungen zwischen Archiv und Bibliothek auf. Mehr als zuvor ist nicht mehr ein intellektueller Akteur sammlungsgestaltend sondern die auf Sammlung programmierte Maschine:

„Das neue Gesetz des Sagbaren (das archive im Sinne von Michel Foucault) ist keine menschlich autorisierte Auswahl mehr, sondern die Übersetzbarkeit in den binären Code durch algorithmenbasiertes Sampling […]“

All das harmoniert freilich weniger gut mit der „Eigenzeitlichkeit“ der Gedächtnisinstitutionen, die Echtzeiterfassung nun gerade nicht als ihre Aufgabe sehen. Der Charakter digitaler Kommunikation unterläuft dieses nachträgliche, filternde und damit auch kontrollierbare Erfassen von Kultur:

„Die notwendige Distanz der bisherigen Verwaltungs- und Kulturspeicher Archiv und Bibliothek zur opertiven Gegenwart […] implodiert […]“

Digitalität bedeutet für die Gedächtnisinstitutionen zwangsläufig einen Verlust von Macht und zudem eine Gefährdung, die man gar nicht so vordergründig auf die „Auslieferung an das Hacking“ fokussieren sollte. Bereits das Verschwinden der klaren Grenze zwischen Gegenwart und Archiv, das permanente und vielleicht einzig mögliche Auftreten von Vergangenheit als „augmentierte Gegenwart“, die man in anderen Zusammenhängen als Remixability bezeichnen würde, zwingt uns, bestimmte mit den Gedächtnisinstitutionen verbundene Stabilitäten zu hinterfragen. Es geht kaum mehr um eine „andauernde[…] Archivierung“. Die Funktion der Webarchive ist in gewisser Weise auf die Reaktivierbarkeit oder auch nach Nachnutzbarkeit von Gewesenen gerichtet (bzw. wie Ernst schreibt: „kurzfristige[…] Mobilisierung von Datenformaten“).

Die Bibliothek als Labor

Was folgt nun für die Bibliotheken? Eine Rolle könnte die Invertierung dessen sein, was derzeit oft unter dem Schlagwort Digital Humanities verhandelt wird, nämlich das Eindringen von Big-Data-Analytik in die Geisteswissenschaften. Ernst schreibt von der„Verteidigung der klassischen geisteswissenschaftlichen Überlieferungshermeneutik“ im Sinne einer „Humanities of the Digital“ (im Anschluss Jan Claas van Treeck), was vermutlich einer Anpassung und Anwendung tradierter Deutungsverfahren auf digitale Kulturphänomene entspräche. (vgl. dazu u.a. auch Ben Kaden (2015) Zur Epistemologie digitaler Methoden in den Geisteswissenschaften. (im Druck)) Die Bibliothek hielte dabei Kulturspuren als Forschungsdaten vor, so wie sie es bereits seit langer Zeit tut. Hier behielte Sammlung im Sinne einer – sicher mit Algorithmen unterstützten – intellektuellen Auswahl und Kuratierung ihre Funktion. Die Bibliothek verwandelte sich jedoch explizierter vom Bewahrungsort zum Labor. Ernst fasst dies so:

„Zum Zweck der Bereitstellung von Big Data als Zeitzeugnis obliegt es Gedächtnisinstitutionen weiterhin, wohldefinierte Datenbanken anzubieten.“

Die Bibliothek als Gegenarchiv

Andererseits, oder besser wohl: darüberhinaus, lassen sich Bibliotheken oder ähnliche Kulturakteure auch als etwas denken, dass Ernst als „taktische Zwischenarchive“ beschreibt. Diese werden:

„zu entscheidenden Faktoren einer ganz anderen Gedächtniskultur, die auf Löschung zielt, sobald sich ihre analytische Funktion erschöpft hat.“

Es wäre eine Art subversive Gegenarchivierung, wie sie auch im Zusammenhang mit den Snowden-Leaks (als Snowden-Commons) diskutiert wurde. (vgl. LIBREAS, 2015) Dieses sehr progressive Verständnis von Kulturbewahrung richtete sich auf exakt die Inhalte, Dokumente und Datenströme, die gerade nicht archiviert werden sollen. Die NSA, so informiert Ernst, verzichtet beispielsweise auf die Bewahrung in der Langfristperspektive:

„Eine solche Staatsmacht verlangt keine Archive auf Ewigkeit mehr. An die Stelle der Langzeitspeicherung tritt vielmehr eine kurzfristige Datenpufferung als Interferenz von Rück- und Vorratsdatenspeicherung für predictive analytics, um aus dieser Knowledge Base der Gegenwart (r)echtzeitig künftige Profile und Regeln zu extrahieren.“

Sie erstellen damit Pro-Archive als Basis proaktiver Handlungen. Das ist jedoch nur eine Fassung des Verschwindens der Stabilität des Archivs. Die Kulturdaten-Hubs der Gegenwart, also die Social-Media-Anbieter und der Echtzeitjournalismus, verzichten erkennbar auf systematische Archivstrategien, mutmaßlich in der Annahme einer mangelnden Relevanz des Gewesenen. Dieses taucht eher zufällig auf: die Kommunikationen werden gen Jahresende rein auf Aktivitäts- und andere Kennzahlen verdichtet als einer Art Bilanzgimmick vermeldet.

Dies zu adressieren wäre ebenfalls Gegenstand einer von Ernst angemahnten „algorithmisierten Archivkritik“. Ausschnittsarchive mit solchen Webinhalten, die im besten Fall auch die Kontexte der jeweiligen Kommunikationen systematisch dokumentieren, ermöglichten dieser Archiv- und Kulturkritik immerhin, die jeweiligen Bedingungen der digitalen Kommunikation und Kulturproduktion zu einem bestimmten Zeitpunkt an exemplarischen Ausschnitten nachvollziehbar zu halten. Daher sind Twitter-Archive durchaus relevant und umso relevanter, je mehr die Anbieter die Zugänge zu solchen Daten erschweren. Darüberhinaus sind das Neue und Besondere des Digitalen gar nicht so sehr die spezifischen Inhalte einzelner Webseiten. Neu an den digitalen Netzen ist das explizite und nachvollziehbare Vernetzsein, also, dass sichtbar wird, welche Quelle und welcher Akteur über wie viele Stufen mit welcher anderen Quelle und welchem anderen Akteur zu welchem Zeitpunkt in Beziehung gesetzt wird. Man kann und sollte möglichweise Webarchivierung primär vor dem Hintergrund der Herausforderung denken, wie sich dieses Beziehungsnetzwerke, möglicherweise sogar mit pragmatischen Beschreibungsdaten, archivieren und zugänglich machen lassen.

Skripting als Perspektive

Das vieles aus der Kultur- und Diskursproduktion verschwinden wird, ist ein Kennzeichen von jeder Kultur, ebenso wie eine gewisse Zufälligkeit der Auswahl des Bewahrten, allen systematischen Ansätzen aus Bibliothek und Bibliothekswissenschaft zum Trotz. Etwas zu bewahren, was künftig Rückschlüsse auf die jeweiligen medialen Gegenwarten zulässt, steht dessen ungeachtet als sinnvolle und zweckmäßige Möglichkeit für Gedächtnisinstitutionen auch unter digitalen Bedingungen im Raum. Und letztlich muss man die Echtzeitfixierung und -analytik nicht ganz so unentrinnbar interpretieren, wie es Ernst offenbar unternimmt. Man sollte nicht vergessen, dass die digitale Kultur auf vom Menschen entwickelten Modellen und geschriebenen Code (Skriptionen) aufsetzt. Madeline Akrich beschreibt diese Praxis in ihrem klassischen Text zur De-Scription of Technical Objects:

„A large part of the work of innovators is that of „inscribing“ this vision of (or prediction about) the world in the technical content of the new object. I will call the end product of this work a „script“ or a „scenario.““

Es spricht nichts dagegen, zu überlegen, wie wir die Dimension der Historizität als unsere Vorstellung von Welt in die Bedingungen digitaler Technologie miteinschreiben.

Akrich, Madeleine (1992): The De-scription of Technical Objects. In W. E. Bijker & J. Law (Eds.): Shaping Technology/Building Society: Studies in Sociotechnical Change. S. 205–224. Cambridge: MIT Press

Ernst, Wolfgang (2015): Memorisierung des »Web« – Von der emphatischen Archivierung zur Zwischenarchivierung der Gegenwart. In: ZfBB 62 (3-4), S. 144–152. DOI: 10.3196/1864295015623424.

LIBREAS, N.N. (2015): From the Snowden Files to the Snowden Commons: The Library as a Civic Hub. LIBREAS. Library Ideas, 26 (2014). http://libreas.eu/ausgabe26/08anonym/

Lizenz

Icon für Creative Commons Namensnennung-Weitergabe unter gleichen Bedinungen 4.0 International

Das Fu-PusH-Weblog von Ben Kaden & Michael Kleineberg wird unter Creative Commons Namensnennung-Weitergabe unter gleichen Bedinungen 4.0 International lizenziert, sofern nichts anderes angegeben ist.

Dieses Buch teilen

Rückmeldung/Errata

Kommentare sind gesperrt