Jurst-Görlach, Denise; jurst-goerlach@em.uni-frankfurt.de
Die Verzeichnung der in einem Text genannten Entitäten wie Personen, Körperschaften, Orten u.ä. gehört zum editorischen Standard sowohl gedruckter als auch Digitaler Editionen. Während es in Printeditionen kaum möglich ist, in einem Register Informationen bereitzustellen, die über die bloße Erwähnung einer Entität an einer bestimmten Stelle hinausgehen, kann die digitale Edition zusätzlich maschinenlesbare semantische Aussagen über Relationen festhalten, die zwischen diesen Entitäten bestehen. Diese Beziehungen können in XML-TEI erfasst werden und für die Analyse und Darstellung in andere Formate exportiert werden, was vor allem für die Auswertung großer Textkorpora neue Zugänge verspricht und einen Beitrag zur Entwicklung des Semantic Web und der Vernetzung von Editionen leistet. Stefan Dumont hat diesen Ansatz des „semantischen Kommentierens“ vor allem für die Edition von Briefen und Tagebüchern stark gemacht (Dumont 2019; Dumont 2020), das Konzept lässt sich im Prinzip jedoch auf alle Arten von digitalen Editionen anwenden.
Anders als in gedruckten Ausgaben steht in der Digitalen Edition meist nicht der Name einer Person, eines Ortes etc. im Zentrum, sondern eine ID, die diese Entität eindeutig und im Idealfall über die Projektgrenzen hinaus identifizierbar macht (z. B. GND, Geonames, Wikidata, s. dazu ausführlich Normdaten). Diese Verknüpfung von Entitäten ermöglicht es, zusätzliche Informationen – etwa Lebensdaten bei Personen oder Geokoordinaten bei Orten – an zentraler Stelle innerhalb des Projekts zu führen oder von außerhalb zu integrieren. Sie gibt jedoch keine Auskunft darüber, in welcher Rolle und in welchem Verhältnis eine Entität in dem edierten Text vorkommt.
Die Guidelines der TEI sehen für solche Fälle das Element
<relation> vor, in dem in einer
tuple-artigen Struktur (@active – @name / @ref – @passive) Aussagen über verschiedene, für den Text relevante Relationen
zwischen den Entitäten getroffen werden können (s. TEI 13.3.2.3 Personal
Relationships). Die Werte in @active und @passive (oder @mutual, wenn es sich um eine nicht-gerichtete Relation handelt)
entsprechen dabei den für die Entitäten vergebenen IDs.
<listRelation>
<relation active="person1" name="recommends" passive="person2" />
<relation mutual="person1 person2" name="friendOf" />
</listRelation>
Für das Attribut @name können im Prinzip beliebige projektinterne Werte vergeben werden
(s. dazu auch ODD), im Sinne des
Semantic Web und der Nachnutzbarkeit der Daten ist eine
Anbindung an bestehende Ontologien jedoch erstrebenswert. In diesem Fall kann über das Attribut
@ref und entsprechende Namensräume auf vorhandene Vokabulare wie etwa
Dublin Core Metadata Terms
(dcterms), Friend of a Friend (foaf) oder Bibframe (bf) verwiesen werden.
<listRelation>
<relation active="person1" ref="dcterms:contributor" passive="event1" />
<relation active="org1" ref="foaf:member" passive="person1" />
<relation active="topic1" ref="bf:subjectOf" passive="work1" />
</listRelation>
Ein Vorteil der Erfassung von Relationen direkt in XML-TEI ist einerseits die einfache Handhabung für die Editorinnen und Editoren, die bei einmal festgelegtem Vokabular nur einen geringen Mehraufwand bei der Bearbeitung der Dateien darstellt. Andererseits bleiben auch die so getroffenen Aussagen zum Inhalt eines Textes unmittelbarer Teil der Metadaten und werden nicht in andere Dateien oder Datenbanken ausgelagert.
Für die Auswertung der Daten können prinzipiell X-Technologien wie XPath oder XQuery genutzt werden, jedoch bietet sich eine Transformation in andere Formate wie RDF oder eine Überführung in Graphdatenbanken an, da diese über wesentlich differenziertere Möglichkeiten zur Analyse, Austauschbarkeit und Visualisierung der Daten verfügen. „Schlussendlich kann man natürlich auch beide Technologien kombinieren: Graphdatenbanken für die Analyse im eigenen Projektrahmen und RDF als projektübergreifendes Bereitstellungsformat.“ (Dumont 2019, S. 8)
Literatur:
- BIBFRAME 2.0 Vocabulary List. URL: https://id.loc.gov/ontologies/bibframe.html
- DCMI Usage Board. DCMI Metadata Terms. URL: https://www.dublincore.org/specifications/dublin-core/dcmi-terms/
- Dumont, Stefan. 2019. Briefe kommentieren im Semantic Web - Ein Konzept. In: DARIAH-DE Working Papers 33, S. 25.
- Dumont, Stefan. 2020. Kommentieren in digitalen Brief- und Tagebuch-Editionen. In: Annotieren, Kommentieren, Erläutern: Aspekte des Medienwandels. Hrsg. von Wolfgang Lukas und Elke Richter. Berlin, Boston, S. 175-193.
- Brickley, Dan; Miller, Libby. FOAF Vocabulary Specification. URL: http://xmlns.com/foaf/0.1/
- Text Encoding Initiative. TEI 13.3.2.3 Personal Relationships. URL: https://tei-c.org/release/doc/tei-p5-doc/en/html/ND.html#NDPERSREL
- Vogeler, Georg. 2019. The ‘assertive edition’: On the consequences of digital methods in scholarly editing for historians. In: International Journal of Digital Humanities 1, S. 309-322.