Dokumentation
Migrationsprojekt
Das Projekt verfügt über eine lange Geschichte und ist als Pionier der elektronischen Publikation einzustufen (siehe auch die Informationen zur Projektgeschichte). Die dafür nötige Infrastruktur wurde am Institut für Sprachwissenschaft der Universität Graz über die Jahre von unterschiedlichen Techniker*innen aufgebaut und weiterentwickelt. Im Laufe der Zeit wurde deutlich, dass die dauerhafte Wartung dieser Infrastruktur auf Grund der über Jahrzehnte gewachsenen Softwarelandschaft nicht mehr zu bewältigen war. Mit finanzieller Unterstützung der Geisteswissenschaftlichen Fakultät wurde daher in den Jahren 2018-2019 ein Projekt ins Leben gerufen, dass die Migration des Datenbestands in das Repositorium Geisteswissenschaftliches Asset Management System (GAMS) des Instituts Zentrum für Informationsmodellierung zum Ziel hatte. Diese Migration beinhaltete notwendigerweise eine komplette Reorganisation des Datenbestandes, wobei gewisse Strukturen (URIs, Permalinks) zu erhalten waren. Im Juni 2022 konnte die Migration mit dem Relaunch der neuen Webpräsentation erfolgreich abgeschlossen werden.
Technische Infrastruktur
GAMS ist ein OAIS-konformes Asset-Management-System zur Verwaltung, Publikation und Langzeitarchivierung digitaler Ressourcen aus allen geisteswissenschaftlichen Fächern. GAMS basiert auf dem Open-Source-Projekt Fedora (Flexible Extensible Digital Object Repository Architecture) und wird im Rahmen von Kooperationsprojekten laufend weiterentwickelt um auf spezifische Forschungsinteressen Rücksicht zu nehmen. Seit 2019 ist das Repositorium mit dem CoreTrustSeal als trusted digital repository zertifiziert. GAMS ist auch bei der Registry of Research Data Repositories registriert. Weitere Informationen zum Repositorium finden Sie hier.
Persistente Identifikation
Im Repositorium werden alle digitalen Objekte unter einem persistenten Identifikator
(PID) in Form eines projektspezifischen Permalinks gespeichert (für dieses Projekt
o:hsa.*). Zusätzlich inkludiert die GAMS-Infrastruktur einen Handle-Server, sodass die digitalen Objekte noch
einen extern registrierten Identifikator aufweisen (für dieses Projekt
11471/518.10.*).
Durch den Migrationskontext des Projektes war es notwendig,
bereits vorhandene URIs aus der alten Infrastruktur systematisch in die neue zu
überführen. Alle Objekte sind auch unter ihren bisher verwendeten Identifikatoren
erreichbar.
Beispiele:
Brief: http://schuchardt.uni-graz.at/id/letter/1133 -->
https://gams.uni-graz.at/o:hsa.letter.1133
Person:
http://schuchardt.uni-graz.at/id/person/1012 -->
https://gams.uni-graz.at/o:hsa.persons#P.1012
Werk:
http://schuchardt.uni-graz.at/id/publication/181 -->
https://gams.uni-graz.at/o:hsa.bibliography#BIBL.181
Standards und Datenmodellierung
Die Briefe sind im XML-Format unter Berücksichtigung der Richtlinien der Text Encoding Initiative
(TEI) modelliert. Die Umsetzung orientiert sich am DTA-Basisformat, ediarum und der CorrespDesc-SIG (siehe ODD oder Relax-NG). Eine Besonderheit ergibt sich beim Element hi: Da in der Datenerfassung die Art der Hervorhebung häufig nicht gekennzeichnet
wurde, wird meist @rend="unknown" verwendet, die Ausgabe erfolgt kursiv. Die Verwendung
zeigt daher nur an, dass sich der gekennzeichnete Text vom umgebenden Text
unterscheidet, jedoch nicht in welcher Form.
Personen- und Ortsregister sowie die
Bibliographie wurden ebenfalls als TEI modelliert, die Umsetzung der Register orientiert
sich hier ebenfalls an ediarum bzw. der Humboldt-Edition. Als Normdateien wurden viaf.org und GeoNames verwendet.
Der Schlagwort- und der Sprachthesaurus wurden als
SKOS modelliert. Sprachen wurden
zusätzlich auf lexvo
gemappt.
Zusätzlich werden beim Upload ins Repositorium automatisch und
regelbasiert RDF-Daten aus dem TEI
extrahiert (RDF-S anzeigen) und in den Triplestore
geschrieben. Diese Datenbasis wird über die allgemeine Suche abgefragt und ermöglicht
die Vernetzung der Ressourcen untereinander.
Nachnutzung der Daten
Mit Hinblick auf die gespeicherten Daten orientieren wir uns an den FAIR-Datenprinzipien: „data should be Findable, Accessible,
Interoperable, and Re-usable“.
Sämtliche XML-Daten und Digitalisate aus der
Universitätsbibliothek Graz sind unter der Lizenz Creative
Commons BY-NC lizensiert. Abweichungen ergeben sich nur bei Digitalisaten
von Fremdinstitutionen, hier sind die abweichenden Nutzungsinformationen in der
Bildanzeige zu beachten.
Alle Bilddateien im Repositorium können auch über den IIIF-kompatiblen Image Server ausgeliefert werden.
Hierfür muss die folgende Syntax verwendet werden:
https://gams.uni-graz.at/iiif/{object PID}/{image PID}/{IIIF query}
Beispiel: https://gams.uni-graz.at/iiif/o%3Ahsa.letter.1779%2FIMG.1/300,500,600,200/full/0/default.png.
Um Daten systematisch zu ‚harvesten‘ oder in eigene Kontexte zu
integrieren kann die OAI-PMH-Schnittstelle unter https://gams.uni-graz.at/oaiprovider verwendet und nach den Regeln des PMH
abgefragt werden.
Die Korrespondenzdaten werden zusätzlich an das Aggregationsservice CorrespSearch (zum
CMIF-File).
Benutzung der Weboberfläche
Das Herzstück des Projektes ist neben der Zurverfügungstellung von Primär- und
Sekundärliteratur sowie Kontextinformationen zu Schuchardt die Aufarbeitung seiner
umfangreichen Korrespondenz. Diese liegt zu einem großen Teil bereits als edierter
Volltext mit Faksimiles vor. Die Briefe werden dabei mit Informationen zu Personen,
Orten, Werken, Schlagwörtern und Sprachen angereichert. Der Zugang zu den Briefen kann
über die Vollansicht des jeweiligen Briefwechsels, die strukturierte Briefsuche oder die
allgemeine Suche erfolgen; zusätzlich bieten die Register unter dem Punkt Themenportal einen weiteren Einsprungspunkt zu den Daten.
Die
Quelldaten im TEI bzw. SKOS-Format sind in der Darstellung jeweils verlinkt und können
dort angesehen oder heruntergeladen werden.
Kontakt
Für Fragen zur technischen Umsetzung des Projektes kontaktieren Sie Elisabeth Steiner (elisabeth.steiner@uni-graz.at).