Langzeitarchivierung und digitales Vergessen
Ihr Benutzername: Besucher
Wer ist gerade online? - 3
aktive User.
Erstellt/bearbeitet: 18-Sep-2005/07-Feb-06
Systemzeit: Donnerstag, 24.07.2008, 16:22:14.
Home : Fotografie : Digital : Archivierung : Langzeitarchivierung
Übersicht
Als Langzeitarchivierung bezeichnet man die Erfassung und
langfristige Aufbewahrung von Informationen. Vor allem bei der
Langzeitarchivierung digital vorliegenden Informationen (Digital
Preservation) stellen sich neue Probleme.
Während physikalische Objekte seit langer Zeit u.a. in Archiven, Museen
und Bibliotheken aufbewahrt und erhalten werden, stellen sich bei
Elektronischen Publikationen ganz neue Herausforderungen. Daten, die auf
digitalen Datenträgern gespeichert sind, können in relativ kurzer Zeit
nicht mehr lesbar sein (»digitales Vergessen«). Die Ursachen für
diesen Informationsverlust liegen vor allem in der begrenzten
Haltbarkeit der Trägermedien und dem schnellen technischen Medien- und
Systemwandel. Bei der Umgehung dieser Schranken bereiten unter anderem
proprietäre Formate und urheberrechtliche Beschränkungen Probleme.
Probleme
Haltbarkeit der Trägermedien
Während beispielsweise altes Pergament und Papier bei guter Lagerung
viele hundert Jahre haltbar sind, trifft dies auf neue Speichermedien
nicht zu. Die meisten Publikationen aus der ersten Hälfte des 20.
Jahrhunderts sind auf Papier gedruckt, das sich durch Säurefraß
zersetzt. Bei älteren Druckwerken und Handschriften stellen sich andere
Probleme: Wurde eisenhaltige Tinte bei der Herstellung verwendet, können
die Buchstaben durch Feuchtigkeitseinwirkung einfach wegrosten und
Löcher in den Seiten zurücklassen. Feuchtigkeits- und
Temperaturschwankungen können auch Pergamenthandschriften zusetzen, weil
durch Dehnung und Kontraktion die aufgetragene Schrift abplatzen kann.
Auch Filme, Fotos und Magnetbänder haben nur eine begrenzte Haltbarkeit.
Noch kürzer ist die Lebensdauer digitaler Speichermedien wie Disketten
und CDs. Datenträger verlieren ihre Informationen durch Umwelteinflüsse
(z. B. durch Magnetfelder in der Nähe von Disketten oder Magnetbändern)
oder sie werden durch chemische oder physikalische Einwirkungen so stark
verändert, dass sie keine Informationen mehr speichern können oder nicht
mehr auslesbar sind (z. B. UV-Strahlung auf CD-ROMs). Oft scheitert die
Lesbarkeit auch nur daran, daß zu einem späteren Zeitpunkt die passenden
Geräte und Programme nicht mehr vorhanden sind.
Tabelle: Lebensdauer einiger Datenträger.
| |
Medium |
Erwartete Lebensdauer (*) |
| • |
Steintafeln und Steinmalereien |
mehrere tausend Jahre |
| • |
Bücher und Handschriften |
aus säurefreiem Papier und mit säurefreier und nicht
eisenhaltiger Tinte |
mehrere hundert Jahre |
|
aus säurehaltigem Papier (insbesondere Druckwerke des 19. und
frühen 20. Jahrhunderts) |
70 - 100 Jahre |
| • |
Herkömmliche
Bücher |
100-200
Jahre |
| • |
Mikrofilm |
rund 500 Jahre (teilweise weniger als 50
Jahre) |
| • |
Filme auf Zelluloid |
mehrere hundert Jahre (oft nur 50 bis 70
Jahre) |
| • |
Optische Speichermedien |
CD-ROM und
DVD-ROM |
25 - 100 Jahre |
| CD-R/-RW und
DVD-R/-RW |
Zum Teil weniger
als 5 Jahre |
| • |
Zeitungspapier |
10 - 50 Jahre |
| • |
Disketten |
5 - 10 Jahre |
| • |
Magnetbänder |
Bis zu 30 Jahre,
teilweise weniger als zehn Jahre |
(*) Angaben laut Hersteller/ tatsächlich nutzbare Zeit.
Schneller Medien- und Systemwandel
Veraltete Datenformate
Da die Informationen nicht unmittelbar zugänglich vorliegen, sondern
binär codiert sind, ist nur möglich, die Informationen zu lesen, wenn ein
Programm und ein Betriebssystem vorliegt, das den Inhalt einer Datei
"versteht". Da viele Betriebssysteme und Programme ein eigenes
(proprietäres) Verfahren einsetzen, um die Daten zu codieren, ist eine
Lesbarkeit von Daten nicht mehr gegeben, wenn ein Betriebssystem oder ein
Programm nicht weiterentwickelt wird. Verschärft wird dieses Problem durch
die Politik vieler Softwarehersteller, neue Programmversionen mit
veränderten Datenformaten zu veröffentlichen, die ältere Datenformate des
gleichen Programms nicht vollständig nutzen können.
Veraltete Datenträger und Dateisysteme
Ähnlich wie bei den Datenformaten ist die Situation bei den
Trägerformaten. Eine Datei, die vollständig und in einem noch lesbaren
Dateiformat vorliegt, kann von fast allen Computerbenutzern nicht mehr
gelesen werden, wenn sie auf einer 5,25"-Diskette liegt. Waren Laufwerke,
die dieses Format lesen konnten, bis weit in die 1990er Jahre üblich, so
sind heute kaum noch welche zu finden.
Weitere Beschränkungen
Proprietäre Systeme und urheberrechtliche Beschränkungen erschweren das
zur Langzeitarchivierung notwendige Umkopieren und Migrieren von Daten, weil
die dafür notwendigen Schritte nicht bekannt bzw. erlaubt sind. Vor allem
die Einführung von Digitalem Rechtemanagement (DRM) wird das Problem in
Zukunft noch verstärken.
Wiederfinden von Informationen
Es nützt nichts, Daten zu kopieren, man muß sie auch wiederfinden können.
Daher müssen sie in Kataloge eingetragen werden, was bei größeren
Datenmengen sehr aufwändig werden kann.
Datenkonsistenz
Ein oft übersehenes Problem bei der Langzeitarchivierung wie auch bei der
Kurzzeitarchivierung ist die Überprüfung der Fehlerfreiheit der Daten. Daten
können absichtlich modifiziert werden, aber auch durch Systemfehler ohne
Alarm zerstört werden.
Verfahren
Grundsätzlich lassen sich bei der elektronischen Archivierung Methoden
der Migration/Konversion und der Emulation unterscheiden.
Durch den Einsatz von offenen Standards wie z.B. Grafikformaten (TIFF,
PNG, JPEG) oder freien Dokumentenformaten (XML), die als relativ langlebig
betrachtet werden und deren Aufbau öffentlich bekannt ist, sind die Zyklen,
nach denen eine Information umformatiert werden muss, länger. Die
Wahrscheinlichkeit, dass es in einigen Jahren noch Systeme und Programme
gibt, die die Daten lesen können, ist deutlich höher.
Um den Verlust von Daten durch die Alterung von Datenträgern zu
verhindern, müssen die Daten regelmäßig innerhalb der garantierten
Datensicherheitsdauer eines Mediums auf neue Datenträger kopiert werden.
Dadurch kann auch auf ein neues Trägerformat gewechselt werden, wenn das
bisher genutzte durch die technische Weiterentwicklung obsolet geworden ist.
Die hohen Kosten, die durch diese Pflege der Datenbestände entstehen,
haben allerdings zur Folge, dass nur die wichtigsten Daten derart
konserviert werden können. Die Informationsflut, die nicht zuletzt durch die
neuen digitalen Datenverarbeitungssysteme entsteht, verschärft das Problem
zusätzlich. Der Anteil der langfristig gespeicherten Daten wird
notwendigerweise relativ gering sein, was an die Auswahl der gesicherten
Informationen hohe Anforderungen stellt. Ein zusätzliches Problem entsteht
durch das Auseinanderdriften des Verhältnisses zwischen Datenvolumens und
Bandbreite. Das Volumen wächst deutlich schneller als die nötige Bandbreite
um Daten von einem Medium auf ein anderes zu überspielen.
Dies betrifft nicht nur die Daten im staatlichen und kommerziellen
Bereich, sondern auch im Privatbereich werden herkömmliche, oftmals
langfristig lagerfähige Medien durch leichter handhabbare digitale Medien
ersetzt (Photographien und Negative durch digitale Bilder auf einer CD-ROM).
Für die Langzeitarchivierung sind in Deutschland die
Pflichtexemplarbibliotheken und die Archive zuständig.
Siehe auch
- Archiv
- Bergwerk
- Barbarastollen (Zentraler Bergungsort der Bundesrepublik
Deutschland)
- Datenrettung
- Digitalisierung
- Dokumentenmanagement
- Elektronische Archivierung
- kulturelles Erbe
- Netzpublikation
- Mikroform
- Stein von Rosetta
- LifeLog
- Restaurierung
- Internet Archive
- Retrodigitalisierung
Literatur
Borghoff, Rödig, Scheffczyk, Schmitz: Langzeitarchivierung. Dpunkt
Verlag, 2003 ISBN 3-89864245-3
Netmarks
NESTOR Kompetenznetzwerk zur Langzeitarchivierung digitaler Quellen in
Deutschland,
www.langzeitarchivierung.de.
Internet Archive (Archive.org),
www.archive.org.
Glossar Bestandserhaltung,
www.bestandserhaltungsglossar.de.
Calimera Guidelines on Digital Preservation,
www.calimera.org/Lists/Guidelines/Digital_preservation.htm.
Langzeitarchivierung industrieller IT-Prozesse,
www.heise.de/tp/deutsch/inhalt/te/16567/1.html.
NDR Prisma Dokumentation Hilfe, wir verschwinden - Das digitale Desaster,
www.ndr.de/tv/prisma/archiv/20031111.html.
Electronic Resource Preservation and Access Network (ERPANET),
www.erpanet.org.
Digital Preservation Coalition (DPC),
www.dpconline.org.
DLM Forum der europäischen Nationalarchive,
www.dlm-network.org.
Ralf Blittkowsky: Archivieren der Berechnungsformeln?. In Telepolis.
Heise-Verlag 14. Februar 2004,
www.heise.de/tp/deutsch/inhalt/te/16566/1.html.
Georg Hohmann: Digitale Ewigkeit und virtuelle Museen. In: Telepolis.
Heise-Verlag 30. Oktober 2003,
www.heise.de/tp/deutsch/inhalt/konf/15955/1.html.
Roy Rosenzweig: Scarcity or Abundance? Preserving the Past in a Digital
Era. In: American Historical Review 108, 3 Juni 2003, S. 735-762,
chnm.gmu.edu/assets/historyessays/scarcity.html.
Florian Rötzer: Wider das digitale Vergessen,
www.heise.de/tp/deutsch/inhalt/te/14211/1.html.
Guidelines for the Preservation of Digital Heritage. UNESCO, March 2003.
unesdoc.unesco.org/images/0013/001300/130071e.pdf (PDF-Datei).
Digital Preservation Tutorial. Cornell.
www.library.cornell.edu/iris/tutorial/dpm (PDF-Datei).
Quelle und Lizenz
Anmerkungen
|