Dokumentation

Migrationsprojekt

Das Projekt verfügt über eine lange Geschichte und ist als Pionier der elektronischen Publikation einzustufen (siehe auch die Informationen zur Projektgeschichte). Die dafür nötige Infrastruktur wurde am Institut für Sprachwissenschaft der Universität Graz über die Jahre von unterschiedlichen Techniker*innen aufgebaut und weiterentwickelt. Im Laufe der Zeit wurde deutlich, dass die dauerhafte Wartung dieser Infrastruktur auf Grund der über Jahrzehnte gewachsenen Softwarelandschaft nicht mehr zu bewältigen war. Mit finanzieller Unterstützung der Geisteswissenschaftlichen Fakultät wurde daher in den Jahren 2018-2019 ein Projekt ins Leben gerufen, dass die Migration des Datenbestands in das Repositorium Geisteswissenschaftliches Asset Management System (GAMS) des Instituts Zentrum für Informationsmodellierung zum Ziel hatte. Diese Migration beinhaltete notwendigerweise eine komplette Reorganisation des Datenbestandes, wobei gewisse Strukturen (URIs, Permalinks) zu erhalten waren. Im Juni 2022 konnte die Migration mit dem Relaunch der neuen Webpräsentation erfolgreich abgeschlossen werden.

Technische Infrastruktur

GAMS ist ein OAIS-konformes Asset-Management-System zur Verwaltung, Publikation und Langzeitarchivierung digitaler Ressourcen aus allen geisteswissenschaftlichen Fächern. GAMS basiert auf dem Open-Source-Projekt Fedora (Flexible Extensible Digital Object Repository Architecture) und wird im Rahmen von Kooperationsprojekten laufend weiterentwickelt um auf spezifische Forschungsinteressen Rücksicht zu nehmen. Seit 2019 ist das Repositorium mit dem CoreTrustSeal als trusted digital repository zertifiziert. GAMS ist auch bei der Registry of Research Data Repositories registriert. Weitere Informationen zum Repositorium finden Sie hier.

Persistente Identifikation

Im Repositorium werden alle digitalen Objekte unter einem persistenten Identifikator (PID) in Form eines projektspezifischen Permalinks gespeichert (für dieses Projekt o:hsa.*). Zusätzlich inkludiert die GAMS-Infrastruktur einen Handle-Server, sodass die digitalen Objekte noch einen extern registrierten Identifikator aufweisen (für dieses Projekt 11471/518.10.*).
Durch den Migrationskontext des Projektes war es notwendig, bereits vorhandene URIs aus der alten Infrastruktur systematisch in die neue zu überführen. Alle Objekte sind auch unter ihren bisher verwendeten Identifikatoren erreichbar.

Beispiele:
Brief: http://schuchardt.uni-graz.at/id/letter/1133 --> https://gams.uni-graz.at/o:hsa.letter.1133
Person: http://schuchardt.uni-graz.at/id/person/1012 --> https://gams.uni-graz.at/o:hsa.persons#P.1012
Werk: http://schuchardt.uni-graz.at/id/publication/181 --> https://gams.uni-graz.at/o:hsa.bibliography#BIBL.181

Standards und Datenmodellierung

Die Briefe sind im XML-Format unter Berücksichtigung der Richtlinien der Text Encoding Initiative (TEI) modelliert. Die Umsetzung orientiert sich am DTA-Basisformat, ediarum und der CorrespDesc-SIG (siehe ODD oder Relax-NG). Eine Besonderheit ergibt sich beim Element hi: Da in der Datenerfassung die Art der Hervorhebung häufig nicht gekennzeichnet wurde, wird meist @rend="unknown" verwendet, die Ausgabe erfolgt kursiv. Die Verwendung zeigt daher nur an, dass sich der gekennzeichnete Text vom umgebenden Text unterscheidet, jedoch nicht in welcher Form.
Personen- und Ortsregister sowie die Bibliographie wurden ebenfalls als TEI modelliert, die Umsetzung der Register orientiert sich hier ebenfalls an ediarum bzw. der Humboldt-Edition. Als Normdateien wurden viaf.org und GeoNames verwendet.
Der Schlagwort- und der Sprachthesaurus wurden als SKOS modelliert. Sprachen wurden zusätzlich auf lexvo gemappt.
Zusätzlich werden beim Upload ins Repositorium automatisch und regelbasiert RDF-Daten aus dem TEI extrahiert (RDF-S anzeigen) und in den Triplestore geschrieben. Diese Datenbasis wird über die allgemeine Suche abgefragt und ermöglicht die Vernetzung der Ressourcen untereinander.

Nachnutzung der Daten

Mit Hinblick auf die gespeicherten Daten orientieren wir uns an den FAIR-Datenprinzipien: „data should be Findable, Accessible, Interoperable, and Re-usable“.
Sämtliche XML-Daten und Digitalisate aus der Universitätsbibliothek Graz sind unter der Lizenz Creative Commons BY-NC lizensiert. Abweichungen ergeben sich nur bei Digitalisaten von Fremdinstitutionen, hier sind die abweichenden Nutzungsinformationen in der Bildanzeige zu beachten.
Alle Bilddateien im Repositorium können auch über den IIIF-kompatiblen Image Server ausgeliefert werden. Hierfür muss die folgende Syntax verwendet werden:
https://gams.uni-graz.at/iiif/{object PID}/{image PID}/{IIIF query}
Beispiel: https://gams.uni-graz.at/iiif/o%3Ahsa.letter.1779%2FIMG.1/300,500,600,200/full/0/default.png.
Um Daten systematisch zu ‚harvesten‘ oder in eigene Kontexte zu integrieren kann die OAI-PMH-Schnittstelle unter https://gams.uni-graz.at/oaiprovider verwendet und nach den Regeln des PMH abgefragt werden.
Die Korrespondenzdaten werden zusätzlich an das Aggregationsservice CorrespSearch (zum CMIF-File).

Benutzung der Weboberfläche

Das Herzstück des Projektes ist neben der Zurverfügungstellung von Primär- und Sekundärliteratur sowie Kontextinformationen zu Schuchardt die Aufarbeitung seiner umfangreichen Korrespondenz. Diese liegt zu einem großen Teil bereits als edierter Volltext mit Faksimiles vor. Die Briefe werden dabei mit Informationen zu Personen, Orten, Werken, Schlagwörtern und Sprachen angereichert. Der Zugang zu den Briefen kann über die Vollansicht des jeweiligen Briefwechsels, die strukturierte Briefsuche oder die allgemeine Suche erfolgen; zusätzlich bieten die Register unter dem Punkt Themenportal einen weiteren Einsprungspunkt zu den Daten.
Die Quelldaten im TEI bzw. SKOS-Format sind in der Darstellung jeweils verlinkt und können dort angesehen oder heruntergeladen werden.

Kontakt

Für Fragen zur technischen Umsetzung des Projektes kontaktieren Sie Elisabeth Steiner (elisabeth.steiner@uni-graz.at).