Dokumentation
Migrationsprojekt
Das Projekt verfügt über eine lange Geschichte und ist als Pionier der elektronischen Publikation einzustufen (siehe auch die Informationen zur Projektgeschichte). Die dafür nötige Infrastruktur wurde am Institut für Sprachwissenschaft der Universität Graz über die Jahre von unterschiedlichen Techniker*innen aufgebaut und weiterentwickelt. Im Laufe der Zeit wurde deutlich, dass die dauerhafte Wartung dieser Infrastruktur auf Grund der über Jahrzehnte gewachsenen Softwarelandschaft nicht mehr zu bewältigen war. Mit finanzieller Unterstützung der Geisteswissenschaftlichen Fakultät wurde daher in den Jahren 2018-2019 ein Projekt ins Leben gerufen, dass die Migration des Datenbestands in das Repositorium Geisteswissenschaftliches Asset Management System (GAMS) des Instituts Zentrum für Informationsmodellierung zum Ziel hatte. Diese Migration beinhaltete notwendigerweise eine komplette Reorganisation des Datenbestandes, wobei gewisse Strukturen (URIs, Permalinks) zu erhalten waren. Im Juni 2022 konnte die Migration mit dem Relaunch der neuen Webpräsentation erfolgreich abgeschlossen werden.
Technische Infrastruktur
GAMS ist ein OAIS-konformes Asset-Management-System zur Verwaltung, Publikation und Langzeitarchivierung digitaler Ressourcen aus allen geisteswissenschaftlichen Fächern. GAMS basiert auf dem Open-Source-Projekt Fedora (Flexible Extensible Digital Object Repository Architecture) und wird im Rahmen von Kooperationsprojekten laufend weiterentwickelt um auf spezifische Forschungsinteressen Rücksicht zu nehmen. Seit 2019 ist das Repositorium mit dem CoreTrustSeal als trusted digital repository zertifiziert. GAMS ist auch bei der Registry of Research Data Repositories registriert. Weitere Informationen zum Repositorium finden Sie hier.
Persistente Identifikation
Im Repositorium werden alle digitalen Objekte unter einem persistenten Identifikator (PID)
in Form eines projektspezifischen Permalinks gespeichert (für dieses Projekt o:hsa.*).
Zusätzlich inkludiert die GAMS-Infrastruktur einen Handle-Server, sodass die digitalen Objekte noch einen extern registrierten
Identifikator aufweisen (für dieses Projekt 11471/518.10.*).
Durch den
Migrationskontext des Projektes war es notwendig, bereits vorhandene URIs aus der
alten Infrastruktur systematisch in die neue zu überführen. Alle Objekte sind auch
unter ihren bisher verwendeten Identifikatoren erreichbar.
Beispiele:
Brief: http://schuchardt.uni-graz.at/id/letter/1133 --> https://gams.uni-graz.at/o:hsa.letter.1133
Person: http://schuchardt.uni-graz.at/id/person/1012 --> https://gams.uni-graz.at/o:hsa.persons#P.1012
Werk: http://schuchardt.uni-graz.at/id/publication/181 --> https://gams.uni-graz.at/o:hsa.bibliography#BIBL.181
Standards und Datenmodellierung
Die Briefe sind im XML-Format unter Berücksichtigung der Richtlinien der Text Encoding Initiative (TEI) modelliert. Die Umsetzung
orientiert sich am DTA-Basisformat, ediarum und der CorrespDesc-SIG (siehe ODD oder Relax-NG). Eine
Besonderheit ergibt sich beim Element hi: Da in der Datenerfassung die Art der
Hervorhebung häufig nicht gekennzeichnet wurde, wird meist @rend="unknown" verwendet,
die Ausgabe erfolgt kursiv. Die Verwendung zeigt daher nur an, dass sich der
gekennzeichnete Text vom umgebenden Text unterscheidet, jedoch nicht in welcher Form.
Personen- und Ortsregister sowie die Bibliographie wurden ebenfalls als TEI
modelliert, die Umsetzung der Register orientiert sich hier ebenfalls an ediarum bzw.
der Humboldt-Edition. Als Normdateien wurden viaf.org und GeoNames verwendet.
Der Schlagwort- und der Sprachthesaurus wurden als SKOS modelliert. Sprachen wurden
zusätzlich auf lexvo gemappt.
Zusätzlich werden
beim Upload ins Repositorium automatisch und regelbasiert RDF-Daten aus dem TEI extrahiert (RDF-S anzeigen) und in den Triplestore geschrieben.
Diese Datenbasis wird über die allgemeine Suche abgefragt und ermöglicht die Vernetzung
der Ressourcen untereinander.
Nachnutzung der Daten
Mit Hinblick auf die gespeicherten Daten orientieren wir uns an den FAIR-Datenprinzipien: „data should be Findable, Accessible, Interoperable, and
Re-usable“.
Sämtliche XML-Daten und Digitalisate aus der Universitätsbibliothek
Graz sind unter der Lizenz Creative Commons BY-NC lizensiert. Abweichungen ergeben sich nur bei
Digitalisaten von Fremdinstitutionen, hier sind die abweichenden Nutzungsinformationen in
der Bildanzeige zu beachten.
Alle Bilddateien im Repositorium können auch über den
IIIF-kompatiblen Image Server ausgeliefert
werden. Hierfür muss die folgende Syntax verwendet werden:
http://gams.uni-graz.at/iiif/{object PID}/{image PID}/{IIIF
query}
Beispiel: https://gams.uni-graz.at/iiif/o%3Ahsa.letter.1779%2FIMG.1/300,500,600,200/full/0/default.png.
Um Daten systematisch zu ‚harvesten‘ oder in eigene
Kontexte zu integrieren kann die OAI-PMH-Schnittstelle unter http://gams.uni-graz.at/oaiprovider verwendet und
nach den Regeln des PMH abgefragt werden.
Die Korrespondenzdaten werden zusätzlich an das Aggregationsservice CorrespSearch (zum
CMIF-File).
Benutzung der Weboberfläche
Das Herzstück des Projektes ist neben der Zurverfügungstellung von Primär- und
Sekundärliteratur sowie Kontextinformationen zu Schuchardt die Aufarbeitung seiner
umfangreichen Korrespondenz. Diese liegt zu einem großen Teil bereits als edierter
Volltext mit Faksimiles vor. Die Briefe werden dabei mit Informationen zu Personen,
Orten, Werken, Schlagwörtern und Sprachen angereichert. Der Zugang zu den Briefen kann
über die Vollansicht des jeweiligen Briefwechsels, die strukturierte Briefsuche oder die
allgemeine Suche erfolgen; zusätzlich bieten die Register unter dem Punkt Themenportal
einen weiteren Einsprungspunkt zu den Daten.
Die Quelldaten im TEI bzw. SKOS-Format
sind in der Darstellung jeweils verlinkt und können dort angesehen oder heruntergeladen
werden.
Kontakt
Für Fragen zur technischen Umsetzung des Projektes kontaktieren Sie Elisabeth Steiner (elisabeth.steiner@uni-graz.at).