Menü

Metadaten in der Langzeitarchivierung

Metadaten  gehören zu den essentiellen Komponenten einer digitalen Langzeitarchivierung (dLZA), da sie die archivierten Objekte und ihre Eigenschaften beschreiben. Durch die Verwendung und Definition von Metadaten wird ermöglicht, digitale Objekte im Langzeitarchiv zu identifizieren und zu lokalisieren, sie zugänglich zu machen sowie sie verstehen und weiterverwenden zu können. Sie dienen der Sicherung von Integrität und Authentizität der digitalen Ressourcen.
Metadaten der dLZA bilden einen Querschnitt durch alle Metadatenklassen. Dabei können folgende Klassen an Metadaten unterschieden werden:

Deskriptive Metadaten

Deskriptive Metadaten beschreiben primär den Inhalt einer digitalen Ressource und dienen dazu, sie in ihren inhaltlichen Kontext zu setzen, ihre Wiederauffindbarkeit langfristig zu gewährleisten und sie in Zukunft verstehen zu können. Für die Langzeitverfügbarkeit muss die Inhaltsbeschreibung einer Ressource (z. B. Autor, Titel, herausgebende Institution, Veröffentlichungsdatum) in Form von Metadaten innerhalb eines Informationspakets möglichst vollständig erhalten bleiben. 

Das von ZB MED als technische Infrastruktur genutzte Langzeitarchivierungssystem Rosetta verwendet zur Inhaltsbeschreibung das weit verbreitete und allgemein für Internet-Ressourcen anerkannte Metadatenschema Dublin Core.
Die dLZA an ZB MED greift im Wesentlichen mittels zweier Methoden auf Metadatenquellen zu; dabei werden Quellen mit für die Sammlungen ausreichenden und verwendbaren Metadaten genutzt.

Die Bibliotheksteams von ZB MED erfassen bei der Katalogisierung der Bestände umfangreiche bibliographische Metadaten zu den Objekten im hbz-Verbundkatalog. Bei der Überführung in den permanenten Archivspeicher werden die digitalen Objekte mit den Metadaten aus dem Verbundkatalog, als erste Methode, angereichert. Dabei werden die Aleph-Felder aus dem Verbundkatalog auf Dublin-Core-Elemente gemappt (d.h. zugeordnet).

Die zweite Methode ist die Übernahme von Dublin-Core-Metadaten, die über OAI-Schnittstellen der Publikationsplattformen, wie dem Portal German Medical Sciences (ZB MED/BfArM) geliefert werden. Die jeweilige Metadatenquelle wird entsprechend den Ansprüchen des digitalen Langzeitarchivs und der zu archivierenden Sammlung ausgewählt.

Technische Metadaten

Technische Details der Erstellung, Konvertierung und Formatierung im Erhaltungsprozess digitaler Objekte werden in den technischen Metadaten abgebildet. Sie sind für die Sicherstellung der technischen Integrität, Unversehrtheit und langfristigen Lesbarkeit von digitalen Objekten essentiell und Grundlage eines erfolgreichen Erhaltungsmanagements (Preservation Management). Zu ihnen gehören:

  • Dateiname
  • Originalpfad
  • Dateigröße
  • Dateiformat 
  • Dateiwohlgeformtheit, Dateivalidität
  • Checksummen
  • Ergebnisse der Virusprüfung.

Bereits während der Übernahme in das Archiv (Ingest) werden technische Metadaten automatisiert erhoben, extrahiert und im Informationspaket dokumentiert. Fehlende Angaben werden vom System erkannt und bei Bedarf vom Fachpersonal manuell ergänzt. 

Strukturelle Metadaten

Strukturelle Metadaten dienen dazu, den Gesamtzusammenhang des archivierten Informationsobjektes transparent darzustellen, damit es rekonstruiert und für eine Nutzung bereitgestellt werden kann. 

Um die logische Struktur (Hierarchie, Original, Versionen) der Metadaten und der digitalen Objekte abzubilden, werden die Daten und Metadaten einer Informationseinheit (Intellektuellen Einheit) miteinander und untereinander verknüpft. Der Standard für strukturelle Metadaten METS (Metadata Encoding & Transmission Standard) enthält verschiedene Sektionen, in denen unterschiedliche Metadatentypen abgelegt werden können. Zu den METS-Sektionen gehören z. B. die Sektion deskriptive Metadaten und die Sektion administrative Metadaten. 

Administrative Metadaten

Administrative Metadaten dokumentieren über die Zeit hinweg und nachvollziehbar alle internen Prozesse im Zusammenhang mit digitalen Objekten innerhalb einer Institution.

Sie beschreiben  

  • Herkunft der digitalen Objekte (Entstehung, Erwerbung), 
  • angewandte Erhaltungsmaßnahmen (Software, Logs, Methoden, Bearbeiter*in), 
  • Persistente Identifier, 
  • Vertragsvereinbarungen zur Archivierung, 
  • Rechteinformationen. 

Durch Rechteinformationen wird in den Metadaten kenntlich gemacht, welche Zugangsbeschränkungen vorliegen oder ob die Objekte frei zugänglich sind. 

Bevor Daten in die Verantwortung des Langzeitarchivs übergehen, muss der rechtliche Status für die digitalen Objekte bekannt und als Information in den erzeugten Daten vermerkt sein.

Nicht nur die gewährten Nutzungsrechte, auch das generelle Archivierungsrecht (Recht auf redundante Speicherung und Transformation/Migration in andere Formate) wird als Vermerk in den Metadaten hinterlegt.

Kontakt

Dr. Katharina Markus
Leitung Digitale Langzeitarchivierung

Tel: +49 (0)221 478-78955
E-Mail senden

Weiterführende Links

Metadatenklassen
Metadatenschema Dublin core
PREMIS
METS
German Medical Science
books.PUBLISSO