Erhalt planen und sichern
Kernaufgabe der digitalen Langzeitarchivierung von ZB MED ist es, die nachhaltige Wiederverwendbarkeit und Nutzbarkeit der digitalen Informationsobjekte sicherzustellen.
Dafür werden die Risiken für digitale Objekte bewertet, mögliche Erhaltungsmaßnahmen (Erhaltungsplanung, Preservation Planning) im Archivierungssystem hinterlegt und bei Bedarf Maßnahmen durchgeführt.
Die Wiederverwendbarkeit eines digitalen Objekts ist abhängig von:
- einer einwandfreien technischen Zusammensetzung (auch technische Integrität des Objekts genannt, der Erhalt auf technischer Ebene ist die Bitstream Preservation),
- dem Dateiformat des Objekts (bei gefährdeten Dateiformaten werden Maßnahmen zur Formatmigration notwendig, Logical Preservation),
- ausreichend beschreibenden und technischen Metadaten (Semantic Preservation).
In der Preservation Policy von ZB MED werden die Prinzipien der Langzeitarchivierung (Absatz 5.1 - 5.12) im Detail formuliert. Auf deren Grundlage werden die Integrität, Authentizität und Interpretierbarkeit der Inhalts- und Metadaten der archivierten Objekte bei ZB MED garantiert.
Übernahme in das dLZA-Archiv
Bei proprietären und speziellen Formaten ist die Möglichkeit einer digitalen Langzeitarchivierung begrenzt. Entsprechend der Richtlinien von ZB MED werden jedoch grundsätzlich alle Formate in das Langzeitarchiv übernommen. Die Digitale Langzeitarchivierung von ZB MED empfiehlt allerdings die Verwendung von weit verbreiteten, normierten und offenen Formaten bei der Veröffentlichung über GMS, PUBLISSO – Plattform Gold oder das PUBLISSO - Fachrepositorium Lebenswissenschaften.
Die Rechte zur Langzeitarchivierung werden zwischen den Datenproduzierenden und den Verantwortlichen für die Veröffentlichungsplattformen wie PUBLISSO oder von den Lizenzstellen von ZB MED geregelt. Sie beinhalten das Recht, im Zuge der digitalen Langzeitarchivierung Kopien zu erstellen und die digitalen Inhalte in ein anderes Datenformat zu konvertieren. Die jeweiligen Rechtseinräumungen werden im Archiv in den Metadaten hinterlegt und bei der Erhaltungsplanung beachtet.
Sollten von den Verantwortlichen Inhalte an das Archiv geliefert werden, die nicht migriert werden können – weil z.B. Rechte fehlen – kann ZB MED lediglich die technische Zusammensetzung der Daten, den Bitstream, erhalten (Ebene Bitstream Preservation).
Wahl geeigneter Erhaltungsmaßnahmen
Die Entscheidung für geeignete Erhaltungsmaßnahmen wird durch automatisierte Prozesse in der Langzeitarchivierungssoftware sowie Qualitätssicherung durch Mitarbeiter:innen unterstützt:
- Extraktion technischer Metadaten (z.B. Dateiformat, Checksumme): ermöglicht die Qualitätssicherung bereits während der Übernahme und daran anschließend im Archiv
- Formaterkennung mit dem Plugin DROID: ermöglicht die Zuordnung von Format-spezifischen Risiken zu den einzelnen Objekten
- Formatvalidierung mit dem Plugin JHOVE: erkennt Objekte, die nicht den Formatvorgaben entsprechen
- Bearbeitung der Informationspakete durch Mitarbeiter:innen dient der Qualitätssicherung und Vervollständigung der Metadaten
Wird ein Objekt während der Übernahme in das Archiv als fehlerhaft oder als nicht-valide erkannt, wird ein intaktes Objekt bei dem oder der Datenproduzierenden angefragt. Das fehlerhafte Objekt wird durch dieses ersetzt. Ist das nicht möglich, werden Reparaturmaßnahmen angestrebt.
Die von der ZB MED verwendete Langzeitarchivierungssoftware Rosetta verfügt über ein eigenes Modul für das Preservation Planning.
Kern des Moduls ist die in Rosetta integrierte Format Library, eine nutzerbetriebene globale Knowledge Base für Rosetta Anwender mit Informationen zu Datenformaten. Sie basiert primär auf der Formatdatenbank PRONOM, an der die internationale Langzeitarchivierungs-Community ebenso beteiligt ist.
Auf institutioneller Ebene werden in der Format Library pro Dateiformat Risikofaktoren definiert, wodurch Risikoanalysen und entsprechende Erhaltungsmaßnahmen, wie z. B. eine Migration, durchgeführt werden können. Tools zur Migration können bei Bedarf als Plug-Ins eingebunden werden.
Alle Erhaltungsmaßnahmen werden an einer Kopie des digitalen Objekts vorgenommen und vom System in den technischen und administrativen Metadaten erfasst und dokumentiert.
Preservation Watch
Basis für eine langfristige Erhaltungsplanung an ZB MED ist nicht nur die Beobachtung der rechtlichen und gesellschaftlichen Rahmenbedingungen, wie aktuellen Entwicklungen im Kontext von Open Science (z. B. Plan S) und FAIR-Prinzipien. Ebenso wichtig ist auch die Einbeziehung von Anforderungen und Erwartungen der Zielgruppen (Community Watch) und der Veränderungen in der Technik (Technology Watch). Diese werden unter dem Begriff der „Preservation Watch“ zusammengefasst.
Im Rahmen von Preservation Watch werden Formaterkennung und Formatrisiken speziell berücksichtigt. In diesem Kontext ist ZB MED in der nestor-AG Formaterkennung aktiv und Mitglied der Open Preservation Foundation. Dadurch werden Kompetenzen bzgl. der verwendeten Formate aufgebaut.
Kontakt
Dr. Katharina Markus
Leitung Digitale Langzeitarchivierung
Tel: +49 (0)221 478-78955
E-Mail senden
Weiterführende Links
Preservation Policy von ZB MED
Plan S
FAIR Prinzipien
Partner der digitalen Langzeitarchivierung