Das Digitale Desaster

1983 war ein historisches Jahr. In diesem Jahr kam erstmals ein Produkt auf den Markt, das die Welt revolutioniert hat: Die CD, Compact Disk, eine Scheibe aus Kunststoff. Mit einer nur wenige Mikrometer dicken Goldschicht, die bis dahin unvorstellbare Mengen von digitalen Daten speichern konnte.

Die CD, eine Erfindung der Firmen Sony und Phillips, hat zunächst nur die Schallplatte abgelöst, begann aber bald danach den Siegeszug im Computer. Mit 700 Megabyte Fassungsvermögen war sie eine Revolution und löste bald die Disketten damaliger Zeit ab.

Das Problem

Doch was ist nun das Digitale Desaster ? Mit diesem Begriff wird das Phänomen bezeichnet, daß wir Gefahr laufen, durch zunehmender Digitalisierung von Daten in der Geschichte der Menschheit einen schwarzen Fleck zu hinterlassen. Denn die Überspielung von Daten von herkömmlicher analoger und die digitale Form birgt ein großes, nicht zu unterschätzendes Problem: Die Entwicklung der Computertechnik läuft in so rasanter Geschwindigkeit, dass die Programme, die einst die Datenträger bespielten, so schnell veralten, dass unsere Enkel die Daten nicht mehr lesen können.

Denn Daten setzen immer Programme voraus, die sie wieder entschlüsseln. Ein einfacher Satz in deutscher Sprache ist für einen Computer nichts anderes als eine Folge von Zahlen. Um aus den Zahlen wieder einen lesbaren Satz zu machen, ist wieder ein Programm nötig. Beispielsweise ist das Wort "Hallo" in maschineller Repräsentation die Folge folgender Zahlen: 72 97 108 108 111. Geht nun aber das Wissen über die Bedeutung der Zahlen im Laufe der Jahrhunderte verloren, gehen damit letztlich auch die  Daten verloren, genauer gesagt: Die Daten sind noch da, aber wir können sie mich mehr lesen. Ganz so wie die Entschlüsselung jahrtausende alter Hieroglyphen.

Alte Ägyptische Keilschriften oder von Mönchen handgeschriebene Bücher aus dem Mittelalter sind heute teiilweise noch gut erhalten und problemlos lesbar. Eine Datei heutiger Zeit wird es vermutlich in 500 Jahren nicht mehr sein.

 

Haltbarkeit

Ein ganz anderes Problem ist ein rein technisches: Wie lange heutige Datenträger wirklich halten, ist völlig unbekannt. Stuart Brand von der "Long now foundation" beispielsweise sagt hierzu: "Wie lange eine CD wirklich hält, ist ungewiß", "Tests zur Haltbarkeit sind bloße Rechenexempel".

Was bekannt ist, UV-Strahlung und Sonnenlicht schädigen die CD, auch bestimmte Schimmelpilze schädigen den Kunststoff, aus dem alle CDs gefertigt werden. Der Pilz, der hierzu in der Lage ist, braucht zum Wachstum tropisches Klima, allerdings gibt es gute Bedingungen für sein Wachstum auch am Bodensee.

Aber nicht nur die schlichte Haltbarbeit der Medien ist besorgniserregend, auch die rasante Entwicklung der Computertechnik: Benutzen unsere Väter vor 20 Jahren noch die 5 1/4 Zoll große "Floppy Disk", so hat die heute gebräuchliche CD jene Medien vollständig verdrängt und die Industrie stellt keine Lesegeräte mehr her. Selbst wenn die Medien die Zeit überdauern, sind sie ohne die Lesegeräte Wertlos. Alle früheren Überlieferungen von Wissen waren direkt "menschenlesbar": Zunächst die mündlichen Überlieferungen, dann Keilschriften, später dann Bücher.

Wir haben es also mit mindestens drei Problemen zu tun, der physikalischen und der "inhaltlichen" Haltbarkeit unserer Daten und der Verfügbarkeit von Lesegeräten.Wer weiss, wie lange die Daten auf den digitalen Datenträgern halten werden und ob spätere Generationen die Inhalte von heute noch lesen und interpretieren können ? Viele Experten, die sich mit diesem Thema beschäftigen, befürchten, dass wir ein großes digitales Loch in der Geschichte hinterlassen.

Stuart Brand von der Long now Foundation kritisiert das atemberaubende Tempo der Internet-Entwicklung: "Ein säurefreies Buch hält deutlich länger als eine CD-Rom". Auch Angestellte einer in Norwegen ansässigen Firma zur Datenrettung befürchten:

                        "Wir stürzen in ein dunkles, digitales Zeitalter"

Chris Minsky vom Palo Alto Research Center kümmert sich um altertümliche Computer. Dort beherbergt er ein riesiges Lager von alten, nicht mehr hergestellten Computern. Jede Computertechnologie dauerte im Schnitt nur 18 Monate, dies besagt das Moorsche Gesetz.

Jeder Internet-Nutzer hat heutzutage Zugang zu viel mehr Informationen als Generationen davor. "Die Digitale Technik ist vergleichbar mit der Erfindung des Buchdrucks."

 

Digitalisierung

Trotzdem vertrauen wir unsere Fotos, Musik, Texte bedenkenlos den digitalen Medien an. Jeff Rothenberg sagt hierzu: "Langfristige Speicherung mit digitaler Technik wird immer zum Verlust der Daten führen". Digitale Daten sind schneller vergänglich als herkömmliche Medien. Archivare stehen der Digitalisierung skeptisch gegenüber. Einerseits zersetzen sich z.B.Filmrollen mitzunehmendem Alter, doch ist schon bekannt, dass einfache Zelluloidfilme auch in 500 Jahren noch gesehen werden können, digitale CDRoms wegen der digitalen Filmkodierung höchstwahrscheinlich nicht mehr.

 

Migration

Aber was sollen wir tun ? Ein Mittel, um das Problem der Lesegeräte zu lösen, wird mit dem Wort Migration beschrieben. Sobald Medien veralten und die Lesegeräte knapp werden, müssen die Daten umkopiert werden. Migration bedeutet noch mehr: Es bedeutet auch die Umkodierung der Daten in ein neues Format. Also die Überführung der Daten von alten in ein neues Kodierungsschema, das aktuelle Computer verstehen.

 

Emulation

Eine weitere Möglichkeit, Daten lesbar zu halten, ist die Verwendung von sogenannten Emulatoren: Ein Emulator ist ein Computerprogramm, dass auf einem (aktuellen) Computer läuft und eine (alten) Computer nachahmt. In diesem Emulator kann man also Programme benutzen, die einst für den emulierten Computer geschrieben wurden. Und das, obwohl der Computer garnicht mehr existiert.

Jeff Rohtenberg sagt hierzu: "Wir brauchen Emulatoren, um die alten Maschinen nicht zu verlieren und die Daten zu migrieren. "Emulation ist also auch ein Mittel, um gegen das digitale Desaster an zu kämpfen und das Problem der Interpretation der Daten zu lösen. Dies als Digitale Lücke bezeichnet Problem heißt also folgendes: Die Daten sind da, aber nicht mehr lesbar.

 

Zivilisation

Die frei übersetzt "Das lange Jetzt" bedeutende "The long now Foundation" um Stuart Brand beschäftigt sich mit der Erhaltung digitaler Daten für die nachfolgenden Generationen. Sie konstruierten unter anderem eine Uhr für die Ewigkeit, genauer gesagt für die nächsten 10000 Jahre. Der aktuelle Prototyp muß alle 2 Jahre aufgezogen werden.

Um diese Uhr herum wollen sie im "Great Bays National Park" in Amerika in einem alten Silberbergwerks-Stollen eine Bibliothek für 10000 Jahre konstruieren. Und dort Zeitdokumente unserer heutigen Gesellschaft archivieren. Sie beschäftigen sich mit der Frage, wie man dem digitalen Desaster entgegenwirkt.

In Deutschland hätte es den Absturz in das digitale Desaster beinahe schon gegeben: Die Datenbank der DDR-Stasi, gespeichert auf Robotron-Rechnern. Jetzt sind Experten dabei, die Daten auf den Magnetbändern zu entschlüsseln.

 

Die Rosetta Disk

In Anlehnung an den Rosetta-Stein, eine Steintafel in drei Sprachen, hat Jim Mason von der Long Now Foundation die digitale "Rosetta-Disk" entworfen. Ein Datenträger, der 1000 Jahre halten soll. Eine Scheibe liegt flach in einer Kugel, die Kugel gibt vor, wie die Scheibe gelesen werden soll. Außen beginnt die Schrift, für das Auge lesbar ist und die Benutzung erklärt. Die Schrift verläuft in einer Spirale nach innen und wird immer kleiner. Letztendlich ist es eine Art Mikrofilm: Die Daten sind analog gespeichert: Jeder kann die Rosetta Disk mit einem Mikroskop lesen. Es ist also kein digitales Lesegerät notwendig.

            "Wenn man an lange Haltbarkeit denkt, muß man Flexibilität opfern."

 

Lösungen

Viele Leute gehen davon aus, dass die Industrie das Problem der Datenspeicherung lösen wird. Experten sind da skeptisch, da die Industrie nicht an der der langfristigen Speicherung der Daten interessiert ist.

        "Wenn eine Gesellschaft ihre Kultur und ihr Gedächtnis verliert, verliert sie Ihre Identität."

Kann es uns gleichgültig sein, wie viel von unserer Epoche überliefert wird ? Ich meine Nein, denn das Gedächtnis einer Gesellschaft besteht gerade in der Überlieferung gemeinsamer Ereignisse und gemeinsamen Wissens.

 

Bleibt die Computertechnik ?

Die zentrale Frage zur digitalen Lücke ist folgende: Überdauert die Digitaltechnik und damit die gesamte heutige Computertechnik die Jahrtausende ? Anders formuliert: Werden zukünftige Generationen in 1000 oder mehr Jahren Computer nutzen (können) ? Werden zukünftige Computer binäre Daten verarbeiten können ?

Meine Antwort ist: Sehr wahrscheinlich ja.

Das Know-How zur Computertechnik wird dann verloren gehen, wenn die gesamte menschliche Zivilisation verloren geht. Dies kann meines Erachtens nur durch eine Naturkatastrophe immensen Ausmaßes geschehen, beispielsweise ein Einschlag eines großen Himmelskörpers oder der Kollaps der Atmosphäre unseres Planeten. Da in der heutigen Zeit schon Überlegungen zur Besiedelung anderer Planeten, insbesondere des Mars, anlaufen ("Terra forming") und da es bereits eine Raumstation außerhalb unserer Erdatmosphäre gibt, ist es sehr wahrscheinlich, daß es die Menschheit es geschafft haben wird, außerhalb der Erde eine weitere Zivilisation aufzubauen, noch bevor eine große Naturkatastrophe eintritt.

Ich bin also anders ausgedrückt der Meinung, dass die Computertechnik die nächsten 1000 Jahre überlebt. In 1000 Jahren wird das Problem, das ich hier gerade diskutiere vermutlich lächerlich sein.

 

Meine persönliche Einschätzung

Unsere heutige Gesellschaft, und damit nicht nur Wissenschaft, sondern auch Kunstbetrieb, Unterhaltungsindustrie und Politik produzieren so große Mengen an Daten, die nur durch Digitalisierung noch handhabbar bleiben. Das Problem des digitalen Desasters muß aktiv angegangen werden und nicht dadurch, daß man die Digitalisierung vermeidet.

Die Hinauszögerung der Digitalisierung in den großen Archiven der Welt ist momentan der einzige Weg, den Verlust digitaler Daten zu vermeiden. Parallel dazu muß die Wissenschaft geeignete Lösungen finden, um eine persistente (dauerhafte) Digitalisierung unserer Daten zu ermöglichen.

Ich möchte die Teilbereiche des digitalen Desasters noch einmal einzeln diskutieren:

 

Menschheits-Aufgabe 1: Das Medien-Haltbarkeits-Problem

Ein erfreuliches Phänomen, das Moore´sche Gesetz, kommt der Lösung des Medien-Haltbarkeits-Problems entgegen. Bisher hat sich die Leistung von Computersystemen ca. alle 18 Monate verdoppelt. Dies konnte man bisher auch auf die Speicherkapazitäten von digitalen Medien anwenden.

Wenn man annimmt, daß die Computertechnik im Laufe der Weiterentwicklung unserer Zivilisation nicht verlorengeht (siehe oben), ist anzunehmen, dass die Kapazitäten von digitalen Medien im Laufe von Jahrtausenden ebenfalls steigen werden. Wenn auch mit Sicherheit nicht in gleichbleibendem Tempo.

Das Haltbarkeitsproblem ist ein vorübergehendes Problem. Es ist mit der verlustlosen digitalen Kopie vergleichbar. Die Computertechnik hat durch die Digitalisierung von Musik die bisherigen Verluste beim Kopieren ad acta gelegt. Das Haltbarkeitsproblem ist ein chemisches Problem. Analog zur Digitalkopie ist die chemische Wissenschaft aufgefordert, die Suche nach geeigneten Materialien voranzutreiben. Das Problem ist übrigens nicht neu: Von den Anfängen der Buchdruckerei im 15.Jahrhundert hat es auch bis zum 20.Jahrhundert gedauert, bis säurefreies Papier entwickelt wurde,dass sich nicht selbst zersetzt. Die Computertechnik ist gerade mal ein halbes Jahrhundert alt, also ist die Lösung des Haltbarkeitsproblems zu erwarten.

Ich schätze, dass die Chemie in spätestens 200 Jahren eine Lösung des Haltbarkeitsproblems gefunden haben wird.

 

Menschheits-Aufgabe 2: Das Lesegeräte-Problem

Das Lesegeräteproblem läßt sich durch Konservatismus und ein internationales Gremium entschärfen. Die Archivierungstechnik darf sich nicht an der zu rasanten Entwicklung der Computertechnik anlehnen, da diese nur vom Profitdenken der Industrie geprägt ist. Die Lebensdauer von heutigen Produkten im Bereich der Speichermedien ist viel zu kurz, um die Ansprüche der Archivare zu befriedigen. Hier ist ein längerfristig erhältliches und gefertigtes Speichermedium gefragt

Aber dies wird kommen. Dadurch, dass die Computertechnik noch viel zu neu ist, bilden sich ständig neue Quasi-Standards um die gleiche Technologie. Dieses Wirrwarr wird in ähnlicher Form in den Anfängen des Buchdrucks im 15. und 16.Jahrhundert ebenfalls vorhanden gewesen sein.

Ich stelle mir ein internationales Archivierungs-Gremium vor, dass beispielsweise bei der ISO angesiedelt ist und allgemein von den Nationen akzeptiert ist. Es diskutiert regelmäßig die Belange der dauerhaften Archivierung von Daten und gibt Richtlinien, mindestens aber Empfehlungen an die Nationen, welche Medien zur Archivierung verwendet werden sollen. Bei Bedarf entscheidet man über die Migration der Daten auf ein neues Medium. Eine Migration auf neue Medien wird nur dann durchgeführt, wenn die bisherigen Medien entweder nachweislich Haltbarkeitsmängel haben oder wenn ein neues Medium wesentlich höhere Speicherdichten oder wesentlich höheren Kapazitäten bietet.

Robotersystem

Die Archivierungstechnik muß außerdem Sicherungsmaßnahmen entwickeln, um Ausreißer bei den Medien zu erkennen und auszusondern. Ausreißer können durch Fertigungstoleranzen bei Medien immer vorkommen. Es muß hierzu für Staatsarchive ein Robotersystem entwickelt werden, das regelmäßig alle Medien auf Lesbarkeit überprüft. Dieses System wird, einmal installiert, kontinuierlich alle digitalen Medien des Archivs nach festgelegten Ruhezeiten dem Archiv entnehmen und komplett auslesen. Jeder Medientyp des Archivs hat eine festgelegte, maximal zu tolerierende Fehlerrate. Beim Auslesen des Mediums wird die Fehlerrate also die Anzahl der Fehler, die korrigiert werden müssen, gemessen. Übersteigt die Fehlerrate des Mediums den Schwellwert, wird es ausgesondert, indem automatisch ein neues, frisches Medium mit den Daten bespielt wird.

Das Robotersystem muß einem internationalen Standard folgen und so konstruiert sein, dass es mit verschiendenen Medien hantieren kann (Multimedienfähigkeit) und dass anzunehmen ist, dass es auch alle zukünftigen Medien handhaben kann. Die Migration auf ein neues Speichermedium muß einfach nachrüstbar sein. Eine solche Konstruktion scheint mir durchaus möglich.

Zur Migration auf neue Medien muß zusätzlich noch ein einheitliches Dateisystem entwickelt werden, doch dazu mehr im nächsten Abschnitt.

 

Menschheits-Aufgabe 3: Das Kodierungs-Problem

Das Kodierungsproblem läßt sich wiederum in drei Gruppen einteilen: Dateiformate, Kompression und Dateisysteme.

Dateiformate und Konverter

Die ständige Neuentwicklung von Dateiformaten ist der Tod jeder Archivierung. Als Dateiformat bezeichnet man die Übereinkunft, also den Standard, welche Zahl in einer Datei was bedeutet. Hierzu zwei kurze Beispiele, was ein Dateiformat ist:

Beispiel 1: Das ASCII-Dateiformat für Textdateien

Eines der ersten Dateiformate war der ASCII-Code, der neben dem EBCDIC-Code seit Anbeginn der Computertechnik verwendet wird. Der Code wird zur Speicherung von Texten verwendet und äußert sich heutzutage meinst durch die Dateiendungen TXT, TEXT, ASC oder DOC. Der Code gibt an, welche Zahl in einer Textdatei für welchen Buchstaben steht. Hierbei sind die Großbuchstaben als Zahlenwerte ab 65, die Kleinbuchstaben ab 97 kodiert. 65 steht also für das große A, 66 für B usw. Beispielsweise ist das Wort "Hallo" in maschineller Repräsentation die Folge der folgenden Zahlen: 72 97 108 108 111.

Beispiel 2: Das BMP-Dateiformat für Bilder

Hierbei handelt es sich um ein im Betriebssystem Windows verbreitetes Dateiformat für Bilddateien. Ich greife eine Ausprägung von Bilddateien heraus: Bilder mit einer "Farbtiefe" von 32 Bit. Dies bedeutet, dass jeder Bildpunkt mit einer Genauigkeit von 32 Bits gespeichert ist. Jedes digitale Bild besteht bekanntermaßen aus einzelnen Bildpunkten, Pixeln genannt. Diese sind in Zeilen und Spalten angeordnet. Eine Bilddatei eine heute handelsüblichen Digitalkamera besteht aus 768 Zeilen und 1024 Spalten. Hierbei werden immer zunächst alle Pixel einer Zeile gespeichert, und dann die Punkte der nächsten Zeile usw. Jeder Bildpunkt hat eine bestimmte Helligkeit und Farbe. Beim BMP-Dateiformat werden diese Daten in drei Zahlen gespeichert: Dem Rot, dem Blau und dem Grünanteil des Bildpunkts. Die Zahlenkombination 0,0,0 bedeut Schwarz, 255,255,255 hellstes Weiß, und beispielsweise 0,255,0 sattes grün. Die Bilddatei enthält also bei einem Bild von 768 Zeilen und 1024 Spalten drei mal 1024 Zahlen für die erste Spalte, dann wieder 3x1024 Zahlen für die zweite Spalte usw.

 

                        - Es ist notwendig, das die Weltgemeinschaft einen "Earth Code" entwickelt -

Das Problem bei den Dateiformaten ist nicht, daß sie mitunter sehr kompliziert sind, sondern dass das Wissen über die Entschlüsselung überliefert werden muß. Hierzu muß folgendes getan werden:

 

Kompression

Kompression ist ein ernst zu nehmendes Thema bei der Archivierung für spätere Generationen. Kompression ist die Reduktion von Inhalten, um sie platzsparend auf digitalen Medien zu speichern. Man muß hierbei unterscheiden zwischen verlustfreier und verlustbehafteter Kompression. Letztere reduziert die Datenmenge drastisch, vernichtet aber kleine Details. Ein Beispiel hierfür ist das JPEG (JPG)-Datenformat, der mit dem Aufkommen der Digitalfotografie sehr populär wurde.

Verlustbehaftete Kompression ist für die Langzeit-Archivierung nicht zu gebrauchen, da man davon ausgehen muß, dass spätere Generationen die Dateien noch vielfach in neue Formate umwandeln werden. Da jeder Umwandlungsvorgang in ein neues Format wieder einen Qualitätsverlust bedeutet, sollten Daten, die bereits in einem verlustbehafteten Format vorliegen, wieder in ein anderes Format ohne Verluste umgewandelt werden.

 

Verschlüsselung

Verschlüsselung ist ein K.O.-Kriterium für Langzeitarchivierung und daher nicht brauchbar. Ich meine damit nicht, daß Verschlüsselung oder Kryptographie allgemein eine schlechte Sache sind, vielmehr muß eine friedliche Koexistenz zwischen Kryptographie (in der Wirtschaft und im Privatleben) und unverschlüsselten Inhalten (in den Archivierung) entstehen.

 

Dateisysteme

Die Dateisysteme heutiger Zeit sind spezialisierte Systeme, die teilweise zueinander inkompatibel sind. Für die Langzeitarchivierung brauchen wir ein Dateisystem, dass alle Dateien von heutigen Systemen speichern kann.

Hier zwei Beispiele:

 

Anforderungen an ein Langzeitdateisystem

Langfristige Archivierung braucht folgendes:

 

- Ein Artikel von Oliver Abraham, März 2005, www.oliver-abraham.de -

EMail-Adresse: Zum Schutz gegen maschinelle Adressensammler veröffentliche ich die Email-Adresse nicht im genauen Wortlaut. Schreiben Sie das Wort "mail", das At-Zeichen und oliver-abraham.de (oder siehe www.oliver-abraham.de).

 

Umfrage

Wie findest Du den Artikel ?
Wählen! Ihre Meinung
Stimme zu
Stimme nicht zu
Hab ich nicht verstanden
Hab ihn nur überflogen
Ihr Name:

Kommentar:
Admin