Editionsrichtlinien

Hörspieledition

Die exemplarischen Hörspieleditionen zu Werner Koflers »Der dramtisierte Schundroman« und »Unruhe« entstanden aus der Zusammenarbeit mit dem Institut für Signalverarbeitung und Sprachkommunikation der TU Graz (Barbara Schuppler, Martin Hagmüller, Lucija Krusic, Vlad-Andrei Dumitru), wo mit diesem Projekt das Ziel verfolgt wurde, ein Korpus für die automatische Spracherkennung österreichischen Deutschs zu erweitern. Am Zentrum für Informationsmodellierung wurde an der digitalen Edition gearbeitet (u.a. Datenmodellierung, Webpräsentation, Archivierung). Das Ziel der Hörspieledition ist es, Lesetext, Typoskript und Renotat mit der Audioaufzeichnung zu verknüpfen und das Hörspiel über unterschiedliche Interfaces zugänglich zu machen.

Makrostruktur

Für die Makrostruktur wurden neben den default TEI Strukturelementen die Module 7 (Performance Text) und 8 (Transcription of Speech) verwendet. Für die Grundstruktur der Edition wurde das Modul 7 herangezogen mit den Elementen: <front> und <body>.

Im <front>-Element befinden sich alle Vorbemerkungen:

Titel, Untertitel und Beschreibung im <head>-Element mit Element <title> und den unterschiedlichen @type-Attribut-Werten: full, main, sub, desc.

Im Element <performance> sind die Stimmen zusammengefasst, diese werden mit dem Element <castList> und den Kindelementen <head> und <castItem> dargestellt. Das <castItem>-Element wird noch untergliedert in <role> und <roleDesc>. Die <castList> ist unterteilt in 'typoscript_weiblich', 'typoscript_zusatz_editor', 'typoscript_maennlich' und 'transcript_stimmen' als Werte des @xml:id-Attributs. Da sich die 'transcript_stimmen' von jenen des Lesetexts unterscheiden, wurden diese über @corresp mit dem @xml:id-Wert des jeweiligen <castItem> verknüpft. Die 'typoscript_zusatz_editor'-Liste entspricht allen Zusatzstimmen, die im Lesetext verwendet werden, aber nicht in der Liste der Stimmen aufscheinen.

Das Element <prologue> mit den Kindelementen <head> und <p> ist für etwaige Zusatzinformationen wie Prologtexte oder den Einsatz von Musik gedacht.

Im <body>-Element sind die drei Textfassungen des Hörspiels zusammengefasst. Dafür wurde das Textabschnittselement <div> verwendet. Mit dem @type-Attribut wird ausgedrückt, um welche Textfassung es sich handelt.

Segmentierung

Die Audiodatei des Hörspiels »Der dramtisierte Schundroman« wurde aus technischen Gründen für die automatische Transkription in 20 bis zu fünf Minuten lange Teile unterteilt. Diese 20 Teile des Renotats der Audiodatei spiegeln sich auch als Einheiten im Lesetext wieder, im Typoskript jedoch nicht.

Die Audiodatei des Hörspiels »Unruhe« wurde nicht unterteilt, sondern wird als ein Teil weiterverarbeitet.

Die Sprechsegmente im Renotat der Audiodatei wurden in Utterances mit Start- und End-Tag unterteilt. Die Utterances wurden im Lesetext mithilfe von Segmenten annotiert. Diese Segmente sind die Kindelemente der Sprecheinheiten einzelner Sprecher.

Die Unterteilung der unterschiedlichen Textfassungen wurde ebenfalls mit dem <div>-Element vorgenommen. Dieses bekommt im Renotat das Attribut @xml:id mit der ID des jeweiligen Audio-Teils als Wert. Diese ID korreliert in der Lesefassung mit den <div>-Elementen, wofür das Attribut @corresp verwendet wird. Entgegen dem TEI-Leitsatz, dass eine Dissemination nicht in die Annotation hineingedacht werden sollte, wird im Lesetext zusätzlich zu jedem <div> das Element <anchor> als Kindelement mit Attr. @corresp hinzugefügt, um in der Dissemination an gewünschter Stelle ein Audioplayerelement zu können.

Die Typoskript Struktur (Seiten, gekennzeichnet mit Page beginning <pb>) ist im Lesetext und im Renotat in Form von Milestones <milestone> abgebildet. Diese werden mit den Attributen @unit mit dem Wert 'page', @n mit der Seitenzahl als Wert und @corresp mit der ID des Facsimile erweitert.

Typoskript

Seitenumbrüche werden mit dem Element <pb> und den Attributen @xml:id, @n (Seitenzahl) modelliert. Für Zeilenumbrüche wird das Element <lb> mit dem Attribut @n (Zeilennummer) verwendet.

Um Revisionen zu modellieren werden die Elemente <add>, <note> und <del> verwendet.

Um eine Texthervorhebung abzubilden wird das Elemente <hi> mit dem Attribut @rend und dem Wert 'underlined;' verwendet.

Lesetext

Der Lesetext wird mit Hilfe folgender Elemente modelliert:

<anchor>: Verwendung siehe oben.

<stage>: Regieanweisugen

<sp>: einzelne Sprechakte

Kindelemente von <sp>:

  • <speaker>: Sprecher, Sprecherin
  • <stage>: Regieanweisung
  • <p>, in Segmente <seg> unterteilt. Diese Segmente werden verwendet, um mit @corresp Verknüpfungen zu den mit IDs versehenen <incident> (Geräsche, Musik) und <u> (Sprechakt) Elementen aus dem Renotat zu ermöglichen. Das <seg>-Element mit dem Attribut @type mit dem Wert 'commentary' wird auch für die Modellierung von Phrasen, die einen Kommentareintrag haben, verwendet. Die Verknüpfung mit dem Kommentareintrag erfolgt über das Attribut @n, der Wert ist die ID des Kommentars.

Zusätzlich wird wie oben beschrieben <milestone> zur Verknüpfung mit dem Seitenumbruch des Typoskripts an unterschiedlichen Stellen verwendet.

Renotat

Das Renotat wurde von der TU Graz Institut für Signalverarbeitung mit Hilfe der Software Praat erstellt am Zentrum für Informationsmodellierung wurden die Praat-Daten in TEI transformiert.

Utterances <u> werden verwendet, um Geräusche und Sprechsequenzen zu modellieren.

Mögliche Attribute:

  • @start: Startzeitpunkt der Sequenz in Sekunden
  • @end: Endzeitpunkt in Sekunden
  • @trans: steht für transition und wird für alle <u> verwendet, die einen time overlap (= Attributwert mit einem anderen) haben
  • @who: um Sprecherin/Sprecher zu modellieren
  • @xml:id: zufällige ID zur Verknüpfung mit <sp> im Lesetext

<u> kann folgende Kindelemente enthalten:

  • <pause>: wenn ein Sprecher oder ein Geräusch unterbrochen ist
  • <anchor>: wenn es parallel mit einem anderen <u>-Element stattfindet
  • <span>: für Wörter in anderen Sprachen mit dem Attr. @xml:lang
  • <vocal>: mit dem Kindelement <desc> als Beschreibung für nicht-lexikale Sequenzen eines Sprechers
  • <writing>: wenn etwas Geschriebenes vorgelesen wird

Neben <u> wird das Element <incident> für lange Pausen oder Musikstücke verwendet, diese werden im Kindelement <desc> näher beschrieben.

Mögliche Attribute:

  • @start: Startzeitpunkt der Sequenz in Sekunden
  • @end: Endzeitpunkt in Sekunden
  • @type: um auszudrücken, welche Art von 'incident' (Pause, Musik, radioanstellung, radiogeräusche, radioabdrehen, umblaettern, türgeräusch, arbeitslärm etc.) es sich handelt.
  • @xml:id: zufällige ID zur Verknüpfung mit <sp> im Lesetext

Zusätzlich wird, wie oben beschrieben, das <milestone>-Element zur Verknüpfung mit dem Seitenumbruch des Typoskripts verwendet.

Zitiervorschlag:

Raunig, Elisabeth; Klug Helmut W.: Editionsrichtinien - Hörspieledition. In: Werner Kofler: Forschungsplattform. Hrsg. v. Wolfgang Straub und Claudia Dürr. hdl.handle.net/11471/1050.10 , 2022-09.