Modellierung nach der Text Encoding Initiative

Im GRaF-Projekt gibt es mehrere Typen von TEI-Datenmodellen. Eingegangen werden soll hier auf den Vergleichsstellen-Datenstrom, die Primärtexte, die wissenschaftlichen Begleittexte sowie die Bibliographie. Weitere Informationsseiten sind auch in TEI-XML kodiert, allerdings stehen diese Daten nicht zum Download bereit, weswegen hier auf ihre Struktur nicht weiter eingegangen werden soll. Für alle anderen Dateien findet sich im rechten oberen Bereich neben dem Zitiervorschlag ein TEI-Downloadbutton, über den die Quelldaten zum Download zur Verfügung stehen.

Vergleichsstellen-Datenstrom

Der Vergleichsstellen-Datenstrom enthält, wie alle anderen Datenformate auch, im <teiHeader> eine Auflistung verantwortlicher und beteiligter Personen sowie Informationen zur Herausgabe. In der <sourceDesc> findet sich ein Literaturverzeichnis (<listBibl> ) in der zugrundeliegende Textausgaben als <biblStruct> zitiert sind.

In der <encodingDesc> werden vorkommende Metren in <metDecl> -Elementen aufgeschlüsselt. In der <profileDesc> findet sich unter <particDesc> eine Personenliste (<listPerson> ), die ein Glossar in den Vergleichsstellen vorkommender antiker Autoren beinhaltet.

Der Textkörper des Vergleichsstellen-Datenstroms enthält pro Vergleichstext ein <div type=”text”> -Element. Der <span type=”Vergleichsidentität”> beinhaltet die Referenz auf die betreffende Textstelle. <p xml:lang=”la/el”> -Elemente enthalten den zitierten Text, falls es sich um Prosa handelt. Im Falle von metrischen Versen wurden diese nach dem Schema <l met=”#metrum” xml:lang=”grc/la”> kodiert. Ein <div type=”translation”> enthält eine im Projekt erarbeitete Übersetzung.

Der <span type=”Textgrundlage”> beinhaltet die Referenz auf die verwendete Textgrundlage, die sich in der bereits erwähnten <listBibl> im Header zitiert findet. In <span ana=”keyword”> -Elementen wurden Keywords bzw. in den Vergleichsstellen vorkommende Themen getaggt. <span ana=”Akteur”> -Elemente weisen auf vorkommende Akteure hin.

Primärtexte

Die TEI-Daten der Primärtexte beinhalten im <teiHeader> den Titel des behandelten Primärtextes sowie detaillierte Angaben zu an der Bearbeitung und Herausgabe beteiligten Verantwortlichen im <respStmt> . Auch wird dort angegeben, welche Schulklasse für die Ausarbeitung des Texts zuständig war und in welchen Zeiträumen welche Arbeiten getätigt wurden.

Neben Informationen zur Herausgabe enthält hier das <publicationStmt> auch die PID-Nr., dem Schema “o:graf.0000” folgend. In der <sourceDesc> befinden sich mehrere unterschiedliche <listBibl> , die durch ihr@type -Attribut entweder als “Textgrundlage” oder “Sekundärliteratur” ausgewiesen werden. Das als “Textgrundlage” verzeichnete <biblStruct> enthält die Angaben zu der als Basis für die Ausarbeitung verwendeten textkritischen Ausgabe. Im Zuge des GRaF-Projektes ging es nicht darum, eine kritische Textausgabe zu erstellen.

Daneben werden in <listBibl type=”Vergleichsstellen”> Kurzzitate zu den herangezogenen Vergleichsstellen angegeben, die mit den unter “Vergleichsidentität” verzeichneten Textstellen-IDs verbunden sind. In der Web-Anzeige werden diese Vergleichsstellen im Vergleichsstellen-Reiter aus dem Vergleichsstellen-Datenstrom bezogen und dargestellt. Dort werden auch die zugeordneten Lehrplanmodule sowie thematischen Schlagwörter referenziert.

Die <encodingDesc> enthält unter anderem <metDecl> -Elemente, die vorkommende Metren und ihre Kodierung in den Daten aufschlüsseln. Im Haupttext ist für jede Zeile metrischen Texts die metrische Analyse nach dem vorgegebenen Schema angegeben. In der Anzeige-Ansicht werden die verwendeten Platzhalter dann in Zeichen für Längen und Kürzen konvertiert. Das @real -Attribut enthält dabei die Referenz auf die <metDecl> -Elemente, die das Idealschema des jeweiligen Metrums enthalten, während @met die Umsetzung an der konkreten Textstelle beschreibt.

In der <profileDesc> sind in <listPerson> -Elementen die im Fabeltext vorkommenden Akteure aufgeschlüsselt. Dabei kann es sich um Menschen handeln, doch die Mehrzahl der Einträge machen die Fabeltiere aus. Ob es sich um Mensch oder Tier handelt, ist jeweils im @ana -Attribut des <person> -Elements angegeben (@ana=”animal” oder @ana=”person” ).

Der Textkörper (<text> ) enthält im <body> zunächst ein <div> -Element, dessen@decls -Attribut das Kurzzitat des vorliegenden Textes beinhaltet. Im <div type=”originaltext”> findet sich der Primärtext in Originalsprache. Sinneinheiten sind dort als <div type=”Abschnitt/Sinneinheit”> geordnet, wovon jedes ein <head n=”Gliederung”> enthält, in dem eine Benennung der Sinneinheit erfolgt. Dabei wird unterschieden in <seg type=”Struktur”> , worin Angaben wie ‘Exposition’ verzeichnet sind, im <seg type=”Inhalt”> hingegen finden sich ausschließlich inhaltlich bedingte Untergliederungen.

Innerhalb dieses Orginaltexts befinden sich <p> - oder <l> -Elemente, deren Sprache jeweils mit einem@xml:lang -Attribut angegeben ist. <hi rend=”Vokabel”> -Elemente markieren Wörter, zu denen eine Vokabelangabe vorhanden ist, diese findet sich im darin verschachtelten <note> -Element. Angaben gibt es vom Typ “Vokabel”, “Grammatik” und “Sacherklärung”.

Lateinische oder griechische Begriffe werden inline mit <seg xml:lang=”la/grc”> angegeben.

Das <div type=”translation”> enthält die im Projekt angefertigte deutsche Übersetzung zum Originaltext; ihre <p> -Elemente sind mit @rend=”translation” angegeben.

Auf die Übersetzung folgt das <div type=”interpretation"> , worin mehrere <div type=”interpretationsfrage”> geschachtelt sind. Diese wiederum enthalten ein <head> -Element mit der Interpretationsfrage sowie <p n=”Fließtext-Antwort” rend=”Erwartungshorizont”> und <table subtype="Vergleichstabelle" type="Erwartungshorizont"> . Deren <cell> -Elemente enthalten die Inhalte der Vergleichstabelle, die durch ein @rend=”inhaltlich” oder @rend=”formal” näher beschrieben werden.

Der Umstand, dass die <div> -Elemente für Originaltext, Übersetzung und Arbeitsaufträge in derselben Verschachtelungstiefe nebeneinander liegen, stellt eine bewusste Kodierungsentscheidung dar. Dadurch sollte deutlich gemacht werden, dass die Übersetzung nicht etwa selbstverständlich zum Originaltext gehört, denn es könnte viele unterschiedliche Übersetzungen geben, die alle ihre Berechtigung haben. Durch das Nebeneinanderlegen der <div> -Elemente soll angezeigt werden, dass die Übersetzung nicht einen Teil des Originaltexts, sondern vielmehr einen Text für sich darstellt. Selbiges gilt für die Arbeitsaufträge: Im Projekt wurden gewisse Arbeitsaufträge an den Originaltext herangetragen, man hätte sich aber auch für völlig andere entscheiden können. Daher befinden sich Originaltext, Übersetzung und Arbeitsaufträge als gleichberechtigte Elemente auf einer Ebene.

Die Quelldaten stehen in TEI-XML zum Download zur Verfügung, daneben gibt es im Portal deren Web-Repräsentation in HTML, in der JavaScript-Wippets eine gewisse Interaktivität (Zu- und Wegschalten von Angaben) erlauben und eine mithilfe von LaTeX generierte PDF-Version, die ebenfalls heruntergeladen werden kann.

Bibliographie

Die Bibliographie ist im Stil der TEI-Vorgaben als <listBibl> mit <biblStruct> -Elementen modelliert. Sie wurde bis 2020 inhaltlich ergänzt und für die Web-Darstellung semantisch angereichert, z.B. mit Schlagwörtern zur besseren thematischen Findbarkeit.

Die wissenschaftlichen Begleittexte

Die wissenschaftlichen Begleittexte sind Born-digital-Dokumente und liegen auch als TEI-Daten vor. Wie auch im Fall der Primärtexte stehen sie über den TEI-Button als Quelldaten in TEI-XML zum Download bereit, doch gibt es zusätzlich zu ihrer Web-Darstellung in HTML auch ein mithilfe von LaTeX generiertes PDF-Dokument, das ebenfalls heruntergeladen werden kann.

Im <teiHeader> finden sich neben dem Titel des Beitrags und Namen der VerfasserInnen zusätzlich Verantwortlichkeiten im <respStmt> , so etwa die Herausgabe und das Encoding der Artikel. Daneben sind im <publicationStmt> die herausgebenden Institutionen sowie das Erscheinungsjahr genannt.

Im <text> - bzw. <body> -Element finden sich <div> -Elemente für die einzelnen Abschnitte des wissenschaftlichen Beitrags, in denen sich Überschriften (<head> ) und Absätze (<p> ) befinden. Die Tiefe der Überschriften wurde im@rend -Attribut angegeben.

Fußnoten (<note> ) enthalten Referenzen zu zitierter Literatur im Autor-Jahr-Stil nach dem Muster <ref target=”#Autor2000”> Autor 2000</ref> . Um Probleme bei der Transformation nach LaTeX zu vermeiden wurden alle griechischen Buchstaben im Text als <seg xml:lang=”el”/> kodiert; lateinische hingegen werden aus Konvention zur Darstellung als <hi rend=”italic”> . Bei längeren Zitaten wurde das Format <cit xml:lang=”la”> gewählt, wobei Absätze als <q> -Elemente kodiert sind.

Im Fall von Referenzen auf andere wissenschaftliche Begleittexte innerhalb des Textportals wurden die @target -Attribute mit dem Präfix “Einleitung:” oder "Glossar:" versehen (<ref target=”#Einleitung:Avian”> ).

Literaturangaben wurden aus pragmatischen Gründen nicht als <biblStruct> im <teiHeader> angeführt, sondern befinden sich im letzten <div> -Element des <body> als weiter unstrukturierte <bibl> -Elemente. Das Literaturverzeichnis ist in Primärtexte und Sekundärliteratur geteilt. Im @n -Attribut der <bibl> -Elemente findet sich das Autor-Jahr-Zitat; im @xml:id -Attribut die XML-ID, über die die Intext-Referenzen mit dem Literaturverzeichnis verbunden sind.