[Kofler](info:fedora/context:kofler)
[Kofler Hörspieledition](info:fedora/context:kofler.audio-edition)
Diese Hörspieledition entstand im Projekt Kofler Intermedial. Das Projekt
behandelt haupsächlich den Werkkommentar zu den Hörspielen von Werner Kofler.
Die exemplarische Hörspieledition ist ein Zusatz zum Projekt und entstand aus
der Zusammenarbeit zwischen der TU Graz dem Institut für Signalverarbeitung und
Sprachkommunikation, deren Ziel es ist einen Korpus für automatische
Spracherkennung von österreichischem Deutsch zu erstellen. Dafür dienen die
Hörspiele von Werner Kofler als Grundlage um den Korpus aufzubauen. Das Zentrum
für Informationsmodellierung ist für die Digitalen Methoden wie Webpräsentation
der Daten und Datenmodellierung zuständig. Das Ziel dieser Hörspieledition ist
es Lesetext Skript und Transkript mit den Zeitmarken der Audiodatei zu
verknüpfen.
Institutionelle und Personale Rollen taxonomie
Datums Taxonomie
Die Transkription wurde mit praat erstellt und von TU Graz Institut für
Signalverarbeitung und Sprachkommunikation zur Verfügung gestellt. und wurde von
Elisabeth Raunig in TEI umgesetzt.
Hörspieledition
Die exemplarischen Hörspieleditionen zu Werner Koflers »Der dramtisierte Schundroman« und »Unruhe« entstanden aus der Zusammenarbeit mit dem Institut für [Signalverarbeitung und Sprachkommunikation der TU Graz](https://www.spsc.tugraz.at/)
(Barbara Schuppler, Martin Hagmüller, Lucija Krusic, Vlad-Andrei Dumitru), wo mit diesem Projekt das Ziel verfolgt wurde, ein Korpus für die automatische Spracherkennung österreichischen Deutschs zu erweitern.
Am Zentrum für Informationsmodellierung wurde an der digitalen Edition gearbeitet (u.a. Datenmodellierung, Webpräsentation, Archivierung).
Das Ziel der Hörspieledition ist es, Lesetext, Typoskript und Renotat mit der Audioaufzeichnung zu verknüpfen und das Hörspiel über unterschiedliche Interfaces zugänglich zu machen.
Makrostruktur
Für die Makrostruktur wurden neben den default TEI Strukturelementen die Module 7 ([Performance Text](https://tei-c.org/release/doc/tei-p5-doc/en/html/DR.html)) und 8 ([Transcription of Speech](https://tei-c.org/release/doc/tei-p5-doc/en/html/TS.html)) verwendet.
Für die Grundstruktur der Edition wurde das Modul 7 herangezogen mit den Elementen: front und body.
Im front-Element befinden sich alle Vorbemerkungen:
Titel, Untertitel und Beschreibung im head-Element mit Element title und den unterschiedlichen
type-Attribut-Werten: full, main, sub, desc.
Im Element performance sind die Stimmen zusammengefasst, diese werden mit dem Element castList und den Kindelementen head und castItem dargestellt.
Das castItem-Element wird noch untergliedert in role und roleDesc.
Die castList ist unterteilt in 'typoscript_weiblich',
'typoscript_zusatz_editor', 'typoscript_maennlich' und 'transcript_stimmen' als Werte des xml:id-Attributs.
Da sich die 'transcript_stimmen' von jenen des Lesetexts unterscheiden,
wurden diese über corresp mit dem xml:id-Wert des jeweiligen castItem verknüpft.
Die 'typoscript_zusatz_editor'-Liste entspricht allen Zusatzstimmen, die im Lesetext verwendet werden,
aber nicht in der Liste der Stimmen aufscheinen.
Das Element prologue mit den Kindelementen head und p ist
für etwaige Zusatzinformationen wie Prologtexte oder den Einsatz von Musik gedacht.
Im body-Element sind die drei Textfassungen des Hörspiels zusammengefasst. Dafür wurde das Textabschnittselement div
verwendet. Mit dem type-Attribut wird ausgedrückt, um welche Textfassung es sich handelt.
Segmentierung
Die Audiodatei des Hörspiels »Der dramtisierte Schundroman« wurde aus technischen Gründen für die automatische
Transkription in 20 bis zu fünf Minuten lange Teile unterteilt.
Diese 20 Teile des Renotats der Audiodatei spiegeln sich auch als Einheiten im Lesetext wieder, im Typoskript jedoch nicht.
Die Audiodatei des Hörspiels »Unruhe« wurde nicht unterteilt, sondern wird als ein Teil weiterverarbeitet.
Die Sprechsegmente im Renotat der Audiodatei wurden in Utterances mit Start- und End-Tag unterteilt.
Die Utterances wurden im Lesetext mithilfe von Segmenten annotiert.
Diese Segmente sind die Kindelemente der Sprecheinheiten einzelner Sprecher.
Die Unterteilung der unterschiedlichen Textfassungen wurde ebenfalls mit dem div-Element vorgenommen.
Dieses bekommt im Renotat das Attribut xml:id mit der ID des jeweiligen Audio-Teils als Wert. Diese ID korreliert in der
Lesefassung mit den div-Elementen, wofür das Attribut corresp verwendet wird.
Entgegen dem TEI-Leitsatz, dass eine Dissemination nicht in die Annotation hineingedacht werden sollte,
wird im Lesetext zusätzlich zu jedem div das Element anchor als Kindelement mit Attr. corresp hinzugefügt,
um in der Dissemination an gewünschter Stelle ein Audioplayerelement zu können.
Die Typoskript Struktur (Seiten, gekennzeichnet mit Page beginning pb) ist im Lesetext und im Renotat
in Form von Milestones milestone abgebildet.
Diese werden mit den Attributen unit mit dem Wert 'page', n mit der Seitenzahl als Wert und corresp
mit der ID des Facsimile erweitert.
Typoskript
Seitenumbrüche werden mit dem Element pb und den Attributen xml:id, n (Seitenzahl) modelliert.
Für Zeilenumbrüche wird das Element lb mit dem Attribut n (Zeilennummer) verwendet.
Um Revisionen zu modellieren werden die Elemente
add, note und del verwendet.
Um eine Texthervorhebung abzubilden wird das Elemente hi mit dem Attribut rend und dem Wert 'underlined;' verwendet.
Lesetext
Der Lesetext wird mit Hilfe folgender Elemente modelliert:
anchor: Verwendung siehe oben.
stage: Regieanweisugen
sp: einzelne Sprechakte
Kindelemente von sp:
-
speaker: Sprecher, Sprecherin
-
stage: Regieanweisung
-
p, in Segmente seg unterteilt. Diese Segmente werden verwendet, um mit corresp
Verknüpfungen zu den mit IDs versehenen incident (Geräsche, Musik) und u (Sprechakt) Elementen aus dem Renotat
zu ermöglichen.
Das seg-Element mit dem Attribut type mit dem Wert 'commentary' wird auch für die Modellierung von Phrasen, die einen Kommentareintrag haben, verwendet. Die Verknüpfung mit dem Kommentareintrag erfolgt über das Attribut n, der Wert ist die ID des Kommentars.
Zusätzlich wird wie oben beschrieben milestone zur Verknüpfung mit dem Seitenumbruch des
Typoskripts an unterschiedlichen Stellen verwendet.
Renotat
Das Renotat wurde von der TU Graz Institut für Signalverarbeitung mit Hilfe der Software Praat erstellt
am Zentrum für Informationsmodellierung wurden die Praat-Daten in TEI transformiert.
Utterances u werden verwendet, um Geräusche und Sprechsequenzen zu modellieren.
Mögliche Attribute:
-
start:
Startzeitpunkt der Sequenz in Sekunden
-
end:
Endzeitpunkt in Sekunden
-
trans:
steht für transition und wird für alle u verwendet, die einen time overlap (= Attributwert mit einem anderen) haben
-
who:
um Sprecherin/Sprecher zu modellieren
-
xml:id:
zufällige ID zur Verknüpfung mit sp im Lesetext
u kann folgende Kindelemente enthalten:
-
pause: wenn ein Sprecher oder ein Geräusch unterbrochen ist
-
anchor: wenn es parallel mit einem anderen u-Element stattfindet
-
span: für Wörter in anderen Sprachen mit dem Attr. xml:lang
-
vocal: mit dem Kindelement desc als Beschreibung für nicht-lexikale Sequenzen eines Sprechers
-
writing: wenn etwas Geschriebenes vorgelesen wird
Neben u wird das Element incident für lange Pausen oder Musikstücke verwendet, diese werden im Kindelement desc näher beschrieben.
Mögliche Attribute:
-
start:
Startzeitpunkt der Sequenz in Sekunden
-
end:
Endzeitpunkt in Sekunden
-
type:
um auszudrücken, welche Art von 'incident' (Pause, Musik, radioanstellung, radiogeräusche, radioabdrehen, umblaettern, türgeräusch, arbeitslärm etc.) es sich handelt.
-
xml:id:
zufällige ID zur Verknüpfung mit sp im Lesetext
Zusätzlich wird, wie oben beschrieben, das milestone-Element zur Verknüpfung mit dem Seitenumbruch des Typoskripts verwendet.
Zitiervorschlag:
Raunig, Elisabeth; Klug Helmut W.: Editionsrichtinien - Hörspieledition. In: Werner Kofler: Forschungsplattform. Hrsg. v. Wolfgang Straub und Claudia Dürr. hdl.handle.net/11471/1050.10 , 2022-09.