Lektion X

4 minute read

Aktuelle Datenmodelle für Metadaten

So, der letzte Termin BAIN in diesem Semester ist da. Heute steht nicht mehr viel Neues auf der Agenda. Neben den üblichen Kommentaren zu den Lerntagebüchern sowie der Besprechung der äusserst positiv ausgefallenen Unterrichtsbeurteilung besprechen wir aber noch zwei neuere Metadatenstandards für Bibliotheken und Archive, die die bestehenden Standards – die doch schon etwas in die Jahre gekommen sind – ablösen sollen. Dabei handelt es sich um BIBFRAME für Bibliotheken und Records in Context (RiC) für Archive. Nachdem wir während dem Semester immer wieder von diesen beiden Standards gehört haben, aber nie wirklich detailliert darauf eingehen konnten, begrüsse ich persönlich diese Einführung. Ich werde deshalb in diesem Eintrag nochmals kurz die wichtigsten Punkte der beiden Standards zusammenfassen, wobei ich etwas detaillierter auf BIBFRAME eingehen will, da mein Interesse eindeutig im Bibiotheksbereich liegt.

BIBFRAME

BIBFRAME ist das “Nachfolgemodell” für den Bibliotheksmetadatestandard MARC. Auch dieser Standard ist auf die Library of Congress zurückzuführen, auf deren Initiative BIBFRAME seit 2012 entwickelt wird.

Als Grundlage für BIBFRAME gelten die Functional Requirements for Bibliographic Records (FRBR) sowie das Regelwerk Resource Description and Access (RDA). FRBR (oder auf deutsch ‚Funktionale Anforderungen an bibliographische Datensätze‘) ist eine heute weit verbreitete theoretische Grundlage für die Erstellung von bibliothekarischen Regelwerken, wie z.B. auch RDA. Dabei bietet FRBR ein Datenmodell für bibliographische Metadaten in Form einer Ontologie, die auf dem Entity-Relationship-Modell basiert. Für die Katalogisierung wichtige Konzepte wie „Werk“, „Ausgabe“ und „Exemplar“ werden genau definiert und in Beziehung zueinander gesetzt. Und RDA ist ein Katalogiserungsregelwerk, das sich in Bibliotheken mitterweile stark verbreitet hat. Das RDA-Regelwerk folgt aus den jahrelangen Bemühungen der Fachwelt, bibliothekarische Daten zu vereinheitlichen, um den Datenaustausch zu vereinfachen.

BIBFRAME basiert also auf FRBR und RDA, geht aber auch ein bisschen seinen eigenen Weg, denn nicht alles wird 1:1 umgesetzt. BIBFRAME besteht aus dem BIBFRAME Model sowie dem BIBFRAME Vocabulary. Das Datenmodell ist in der Abbildung, die wir auch im Unterricht angeschaut haben, veranschaulicht.

BIBFRAME

Im Datenmodell sind also die Begriffe “Work”, “Instance” und “Item” zentral. Der Werkbegriff ist dabei sehr abstarkt und meint die Idee bzw. die Schöpfung einer Veröffentlichung – beispielsweise also die Welt von Harry Potter. Die Instanz ist dann z.B. “Harry Potter und der Feuerkelch”, ein Buch mit einer Autorin, einem Verleger usw. Das Exemplar ist dann das physische Buch, das die Bibliothek im Bestand hat, das eine Mediennummer, eine Signatur, einen Standort, etc. hat. All diese Konzepte sind dem Datenmodell entnommen.

Das Vokabular dient dann dazu, die Konzepte und deren Eigenschaften zur Beschreibung der oben genannten Entitäten, welche das Datenmodell vorgibt, zu beschreiben. Das passiert mithilfe einer Ontologie, die aus Klassen und deren Propertys besteht. Die darin verwendeten Konzepte wurden von RDA übernommen.

Unterschied zu MARC21

Wie den FAQs zu BIBFRAME der LoC zu entnehmen ist, sind MARC-Datensätze grundätzlich unabhängig von anderen Datensätzen verständlich, da in einem Datensatz alle relevanten Informationen zu einem Werk vorhanden sind (Personennamen, Schlagworte, Publikationsinformation usw.). BIBFRAME dagegen ist stark von den Relationen zwischen den einzelnen Ressourcen abhängig und verwendet dazu Identifiers für ALLES (Personen, Orte, Sprachen, usw.). MARC verwendet zwar schon DInge wie etwa Sprachcodes, aber dieses Prinzip der kontrollierten Identifiers ist in BIBFRAME eine Grundvoraussetzung, um die Relationen zwischen den Ressourcen aufrecht zu erhalten.

Sehen wir uns ein Beispiel an. Dieses ist von der LoC bereitgestellt und hier in seiner Gänze anschaubar, wir schauen uns hier nur einen kleinen Ausschnitt an. Anhand der Verfasserangabe in BIBFRAME und MARC21 isch schon klar ersichtlich, wie unterschiedlich die beiden Metadatenstandards sind.

Das ist die Verfasserangabe in MARC:

<marc:datafield tag="100" ind1="1" ind2=" " >
  <marc:subfield code="a" >London, Kaye.</marc:subfield>
  <marc:subfield code="4" >http://id.loc.gov/vocabulary/relators/ctb</marc:subfield>
</marc:datafield> 

Im gewohnten Format wird zuerst das Datenfeld identifiziert (wie immer wird das 100er-Feld für die Verfasserangabe verwendet). Im Unterfeld a wird der Name des Verfassers genannt, die URL im Subfield 4 weisst diesen als Contributor aus. Und damit ist die Verfasserangabe in MARC komplett.

Dem gegenüber stehen die gleichen Angaben in BIBFRAME:

<bf:contribution >
  <bf:Contribution >
    <rdf:type rdf:resource="http://id.loc.gov/ontologies/bflc/PrimaryContribution" />
    <bf:agent >
      <bf:Agent rdf:about="http://bibframe.example.org/20674836#Agent100-12" >
        <rdf:type rdf:resource="http://id.loc.gov/ontologies/bibframe/Person" />
        <bflc:name00MatchKey >London, Kaye.</bflc:name00MatchKey>
        <bflc:primaryContributorName00MatchKey >London, Kaye.</bflc:primaryContributorName00MatchKey>
        <bflc:name00MarcKey >1001 $aLondon, Kaye.</bflc:name00MarcKey>
        <rdfs:label >London, Kaye.</rdfs:label>
      </bf:Agent>
    </bf:agent>
    <bf:role >
      <bf:Role rdf:about="http://id.loc.gov/vocabulary/relators/ctb" />
     </bf:role>
  </bf:Contribution>
</bf:contribution> 

Hier wird die Verfasserangabe in einem Tag “Contribution” gemacht. Diese wird via RDF gleich als Primary Contribution gekennzeichnet. Der Contributor selbst wird als Agent gekennzeichnet und ebenfalls mit einer RDF-Relation als solcher ausgeweisen. Der Agent ist hier eine natürliche Person, was durch die Verlinkung zum Konzept “Person” bewerkstelligt wird. Erst jetzt kommt der Name des Verfassers, einmal in einem <bflc:name00MatchKey>-Tag sowie einem <bflc:primaryContributorName00MatchKey>-Tag, die hier wohl als Identifier verwendet werden. Zusätzlich wird nich ein <bflc:name00MarcKey>-Tag verwendet, der hier auch noch das zugehörige MARC-Feld, wie wir es im ersten Beispiel gesehen haben, zuweist. Und auch das RDFs-Label zum Namen darf nicht fehlen. Zusätzlich zum Agent-Tag ist hier auch noch der Rollen-Tag zu sehen, der parallel zum BIBFRAME-Tag läuft und wie auch im MARC-Beispiel hier die Rolle Contributor verlinkt.

BIBFRAME ist also etwas umfangreicher und komplexer als MARC, macht es aber durch die Verwendung von RDF/RDFs möglich, Linked Data Paradigmen zu folgen.

Records in Context (RiC)

RiC ist sozusagen das Pendent zu BIBFRAME, einfach für die Archivwelt, denn auch hier liegt der Fokus auf Linked Data. Die vier bestehenden Standards (ISAD(G), ISAAR(CPF), ISDF und ISDIAH) sollen dabei “harmonisiert, integriert und weiterentwickelt” werden und Entitäten sollen neu durch Relationen verbunden werden. Dabei wird die traditionelle archivische Erschliessung etwas umgedacht, denn das traditionell hierarchische Erschliessen des Archivguts weicht – ermöglicht durch die Verwendung von RDF, wie wir es auch bei BIBFRAME gesehen haben – parallele und auch plurale Relationen zwischen Ressourcen, was die Darstellung von komplexen Zusammenhängen vereinfacht.

Mit diesem doch sehr kurz gehaltenen Info zu RiC (Archive wecken wirklich wneiger Interesse in mir als Bibliotheken…) schliesse ich diesen letzten Lerntagebuchartikel. Jetzt bleibt nur noch der Abschlussartikel zu schreiben…

Lektion X

Aktuelle Datenmodelle für Metadaten

BIBFRAME

Unterschied zu MARC21

Records in Context (RiC)

You May Also Enjoy

Und tschüss!

Lektion IX

Lektion VIII

Exkurs zu OpenRefine