c't 8/2017
S. 110
Praxis
Digitales Vermächtnis: Software und Dateiformate
Aufmacherbild

Für die Nachwelt erhalten

Das persönliche digitale Archiv gestalten und weitergeben

Die silberne Taschenuhr, eine Sporturkunde, ein altes Foto – bei einer Haushaltsauflösung fallen viele Gegenstände von persönlichem Wert in die Hände. Ein PC gibt seine Schätze nicht so leicht preis. Am besten sammelt man schon zu Lebzeiten die wichtigsten Fotos, Videos und Dokumente und gibt sie als Archiv an die Erben weiter.

Am Ende bleibt wenig von einem Leben übrig. Möbel, Geschirr und Bettwäsche des verstorbenen Menschen gehen an die flügge gewordenen Enkel oder ins Sozialkaufhaus. Erinnerungswert besitzt nur weniges wie das Fotoalbum der Italienrundreise ’82 oder der Gedenkteller zur Silbernen Hochzeit.

Die Suche nach Erhaltenswertem kann man seinen Nachkommen nur zu Lebzeiten ersparen, indem man ein persönliches digitales Archiv anlegt. So wird man zum Autor der Erinnerung, denn wer kennt die erzählenswerten Geschichten besser als man selbst? Der Schlüssel liegt in kluger Selbstbeschränkung statt in Vollständigkeit. Das Archiv sollte weder einen Ordner mit 15.000 privaten Fotos enthalten noch die gehortete Materialsammlung für 25 Jahre c’t-Artikel.

Vielmehr geht es darum, die wichtigsten Stationen des Lebenswegs zu dokumentieren. Klassiker sind Fotos von Ereignissen wie Taufe, Hochzeit und runden Jubiläen – alles, wo man zur Feier des Tages einen Fotografen bestellt. Darüber hinaus sind vielleicht Ereignisse wichtig wie das Richtfest des Eigenheims, die Geburt der Kinder, der sportliche Triumph, die Taufe des Hausboots, die Reise um die Welt.

Insgesamt kann so ein Archiv 200 bis 300 Fotos plus private Videofilme und Audiomitschnitte umfassen. Hinzu kommen etwa Dokumente wie das Abschlusszeugnis der Schule, das Hochschuldiplom, wichtige Briefe oder die Ergebnisse genealogischer Forschungen zum Familienstammbaum. Je älter das Archiv, desto interessanter ist es für die Nachfahren. Welche Dateiformate in 25 Jahren noch aktuell sind, kann zwar keiner voraussagen. Gute Richtwerte sind aber ISO-Standards, quelloffene Codecs und Betrachter, weite Verbreitung sowie lange Nutzungsdauer.

Fotos

Bei der Wahl des Fotoformats fällt der erste Blick ins Web. Dort sind Bilder vor allem als GIF, JPEG und PNG zu finden. Seit 2006 hat PNG das ältere GIF praktisch abgelöst. Letzteres ist nur noch in Nischen relevant. Für JPEG gibt es seit 1992 eine Norm (ISO/IEC 10918-1) und seit dem Siegeszug des WWW besteht kein Zweifel, dass es das Foto-Austauschformat Nummer eins ist. Es überlebte bereits technisch bessere Alternativen wie JPEG2000. Was seit 25 Jahren als Standard gilt, wird wahrscheinlich auch in 25 Jahren noch verbreitet und lesbar sein.

Ein Foto trägt viele Datumsangaben. Der ExifTool-Befehl „alldates“ ändert die meisten auf einen Wunschwert – auch weit vor 1970.

Eine ebenso gut abgehangene Alternative ist TIF. Die neueste Spezifikation stammt ebenfalls aus dem Jahr 1992 und ist öffentlich zugänglich. Das Containerformat bietet viele Möglichkeiten. Für Zukunftssicherheit sollte man keine Kompression verwenden, auf mehrseitige TIFs verzichten und bei 8 Bit Farbtiefe pro Kanal bleiben.

Metadaten wie Ortsnamen, Zeitstempel und Namen der abgebildeten Personen sollte man im ISO-Standard XMP einbetten. Als Begleitdatei ist der XML-Dialekt im Klartext lesbar, kann aber verlorengehen. Das Kommandozeilenprogramm ExifTool setzt ein beliebiges Aufnahmedatum. Einige Programme, zum Beispiel der Betrachter XnView, gehen nicht weiter als 1970 zurück.

Im Test stellte das ExifTool Aufnahme-, Erstellungs- und Änderungsdatum der Exif-Daten auf einen gewählten Tag im Jahr 1964. Das Datei-Erstellungsdatum landete unter Windows kurioserweise auf 2064; Missverständnisse dürften aber ausbleiben. Eingebettete Metadaten werden leicht übersehen. Sicher gehen Sie mit aussagekräftigen Dateinamen nach dem Muster „1995-05-16_Abiturentlassung-Andre-Kramer.JPG“. Folgender Befehl setzt mit dem ExifTool alle verfügbaren Datumsangaben einer Datei auf den 1. Juni 1964 um 12 Uhr:

exiftool -alldates="1964:06:01 12:00:00"

Dokumente

Der Quasi-Standard für Office-Dokumente sind die Formate von Microsoft Office; in 20 oder 50 Jahren kann das ganz anders aussehen. Wer zum Beispiel seine Diplomarbeit in den 1980er Jahren mit Word für DOS geschrieben hat, kann diese schon heute in neueren Versionen nicht mehr öffnen. Bestenfalls kann man versuchen, solche Dateien in LibreOffice Writer zu importieren, das immerhin einen Import-Filter für dieses Format mitbringt. Das Problem könnte in Zukunft auch die seit Office 2007 veralteten Binärformate betreffen, die durch ein Dateiformat auf XML-Basis ersetzt wurden.

Word öffnet DOC-Dateien schon jetzt nur noch im Kompatibilitätsmodus. Für die Nachwelt sollte man sie in XML-Standardformate oder ins Langzeitarchivformat PDF/A konvertieren.

Dieses „Office Open XML“ (OOXML) ist von der ISO als Standardformat anerkannt und speichert alle Bestandteile eines Dokuments wie Text, Grafiken und Bilder in einer Container-Datei im ZIP-Format. Notfalls lässt sich der Text aus dem ZIP-Archiv extrahieren und mit einem einfachen Texteditor öffnen. Dazu muss man die Dateien in Word im DOCX-Format und in Excel als XLSX-Datei speichern. Schon vor Microsofts OOXML hat die ISO das in Open- und LibreOffice verwendete OpenDocument Format (ODF) als offenen Standard zertifiziert. Auch ODF speichert alle Bestandteile des Dokuments innerhalb eines ZIP-Archivs.

Spezialfälle wie den Stammbaum aus der Genealogie-Software wird zukünftig kaum jemand im proprietären Format lesen können. Solche Dokumente archiviert man am besten im Portable Document Format. Erstens lässt sich so ziemlich alles von Office- über Layout- bis hin zu CAD-Dateien ins PDF konvertieren, zweitens pflegt die ISO mit PDF/A einen Standardfür die Langzeitarchivierung.

PDF ist ein Container-Format, das Text, Grafik, Bilder und anderes enthalten kann. PDF/A schränkt die Freiheiten drastisch ein. Der Standard verbietet Videos und Skripte, zwingt zum Einbetten von Schriften und erlaubt nur zukunftssichere, nicht patentbehaftete Bildkompressionsverfahren. Die ersten Teile des Standards PDF/A-1 und PDF/A-2 sind sehr restriktiv und frieren das Dokument in seinem Ist-Zustand ein, während PDF/A-3 auch Attachments erlaubt. Die Archivtauglichkeit dieser Anhänge wiederum wird vom Standard nicht geregelt. Für die Langzeitarchivierung wählen Sie also bevorzugt PDF/A-1 oder A-2.

Microsoft Office, OpenOffice und PDF Creator exportieren Inhalte als PDF/A. OpenOffice und Microsoft Office erzeugen die ursprüngliche Variante PDF/A-1a (a steht für „accessible“). In OpenOffice rufen Sie dazu „Datei/Als PDF exportieren“ auf, im Datei/Speichern-Dialog von Microsoft Office wählen Sie als Format PDF und unter Optionen die passenden Konvertierungseinstellungen. Berechnungsskripte in Formularen oder multimediale Elemente gehen dabei verloren. Wer überprüfen möchte, ob ein PDF den Anforderungen genügt, kann den Open-Source-PDF/A-Validierer veraPDF nutzen (verapdf.org). Vor wenigen Wochen hat ihn die pdfa Association auf Java-Basis für Linux, Windows und macOS veröffentlicht.

Audio

An Tonbändern und Musikkassetten nagt der Zahn der Zeit. Um private Aufnahmen zu retten, kann man einen Kassettenrecorder mit USB-Anschluss anschaffen, bessere Qualität liefert ein altes Tape-Deck eines Markenherstellers, das man mit den Ausgängen an ein billiges Audio-Interface anschließt (zum Beispiel Behringer UMC202HD für 66 Euro).

Zur Archivierung sollte man ein Format wählen, das die Aufnahmen verlustfrei speichert, weit verbreitet und wenn möglich Open Source ist – Finger weg von exotischen oder DRM-geschützten Formaten. Dateien im Wav-Format lassen sich unabhängig vom Betriebssystem überall abspielen. Für digitalisierte Analogaufnahmen genügt eine Wortbreite von 16 Bit bei einer Abtastrate von 44,1 kHz, da Schallplatten und Musikkassetten einen geringen Dynamikumfang haben. 24 Bit Wortbreite und 96 kHz Abtastrate sind nur für professionelle Aufnahmen nötig.

Das Wav-Format benötigt vergleichsweise viel Speicherplatz und speichert keine Meta-Tags, die Aufschluss über den Titel, Künstler und Komponisten geben. Dateien im Format FLAC hingegen sind nur etwa halb so groß. Es speichert ebenfalls verlustfrei, lässt sich mit Meta-Tags beschriften und ist Open Source. Allerdings werden FLAC-Dateien nicht von jedem Abspielgerät ohne Weiteres wiedergegeben.

Um die Wiedergabe zu vereinfachen, bietet sich eine zusätzliche Kopie als MP3 an. MP3 kann von nahezu jedem Gerät wiedergegeben werden und benötigt wenig Platz. Für professionelle Aufnahmen ist es allerdings ungeeignet, da speziell die Höhen unter der verlustbehafteten Kompression leiden. Um die Einbußen zu verringern, sollte man eine Bitrate von 256 kBit/s nicht unterschreiten. Das Open-Source-Programm Audacity exportiert WAV-Dateien. Mit dem freien MP3-Codec Lame lassen sich auch MP3s ausgeben. FLAC-Tools finden sich auf xiph.org.

Video

Der auf Video dokumentierte Bühnenauftritt und der selbst gedrehte Urlaubsfilm sind oft auf VHS-Kassetten, Super-8-Filmen oder digital erhalten. Im ersten Anlauf sollte man differenzieren zwischen analogen Video-Kassetten und Bewegtbildern auf DVD, Blu-ray-Disc, als Datei oder auf DV-Kassette.

Preisgünstige, aber kommerzielle Videoschnittprogramme wie Premiere Elements bringen die nötigen Codecs mit, um Videomaterial in MPEG-2-Dateien zu konvertieren.

Analoge Aufnahmen sollten Sie zunächst digitalisieren – entweder selbst oder durch Auftrag an einen Dienstleister, der in der Regel eine Video-DVD zurückliefert. Hier reicht die Auflösung von 720 × 576 Pixeln und als Format ein MPEG-2-Datenstrom. Das Resultat entspricht der „Standard Definition“ (SD) genannten Auflösung, in der auch MPEG-2-kodierte Filme auf DVD gespeichert sind. Auf Grund der weiten Verbreitung von Video-DVDs lassen sich solche Filme auch in Zukunft noch wiedergeben.

Um aus einer DVD nur einen Teil herauszuschneiden, empfiehlt sich eine preisgünstige, aber kommerzielle Software; das erspart Schwierigkeiten mit Codecs, da viele Verfahren patentrechtlich geschützt sind. In Frage kommen etwa Video deluxe von Magix, PowerDirector von CyberLink oder Premiere Elements von Adobe. Mit diesen Programmen lässt sich das gewünschte Material importieren, schneiden und als MPEG-2-Datei exportieren.

Aufnahmen von einer Action-Cam in 1280 × 720 (HD, 720p) oder 1920 × 1080 Pixel (1080p, Full HD) liegen in der Regel im Videoformat MPEG-4 H.264 AVC vor, auch AVC-HD genannt. In diesem sind die meisten Filme auf Blu-ray kodiert. Dieses Format werden handelsübliche Blu-ray-Player sicher noch länger als MPEG-2 wiedergeben können.

Das letzte Backup

Händler in Babylon und Uruk schrieben vor über 5000 Jahren flüchtige Rechnungsdaten in feuchten Ton. Durch Feuer wurden diese Tafeln zum ersten dauerhaft fixierten Medium. Auf Tierhäute oder Papyrus geschriebene Lyrik ging hingegen verloren. Welches Medium die Zeiten überdauert, kann niemand vorhersagen. Vielleicht ist es das digitale Archiv, vielleicht ein Fotobuch aus Papier. Wer auf verschiedene Medien setzt, hat bessere Chancen, der Zerstörungskraft der Zeit zu trotzen. (akr@ct.de)