About
Was ist GAMS?
GAMS ist ein OAIS-konformes Asset Management System zur Verwaltung, Publikation und
Langzeitarchivierung digitaler Ressourcen aus allen geisteswissenschaftlichen Fächern.
Es bietet MitarbeiterInnen aus Forschung und Lehre, aber auch Studierenden in Projekten
die Möglichkeit, diese Ressourcen zitabel und mit Metadaten versehen zu verwalten und zu
veröffentlichen.
Geplant und entwickelt wurde GAMS am Institut für Digitale Geisteswissenschaften (vormals Zentrum für
Informationsmodellierung) im Rahmen einer Vielzahl von Kooperationsprojekten mit inner-
und außeruniversitären PartnerInnen, in Auseinandersetzung mit den konkreten
Erfordernissen universitärer Forschung.
Das Repositorium ist komplett OAIS(Open Archival
Information System)-konform und deckt den gesamten Lebenszyklus von digitalen Objekten
vom Erhalt des SIP (submission information package), speichern des AIP (archival
information package) und Zurverfügungstellung des DIP (dissemination information
package) für die Öffentlichkeit ab.
Mit Hinblick auf die gespeicherten Daten
orientieren wir uns an den FAIR-Datenprinzipien: "data should be Findable, Accessible, Interoperable,
and Re-usable".
Welche Technologien werden verwendet?
GAMS basiert auf dem Open Source Projekt Fedora (Flexible Extensible Digital Object Repository Architecture) und wird im
Rahmen von Kooperationsprojekten laufend weiterentwickelt um auf spezifische
Forschungsinteressen Rücksicht zu nehmen. Für das Objektmanagement und die
Datenkuratierung wurde eine eigene Java Applikation entwickelt. Dieser Cirilo Client
bietet Funktionalitäten, die besonders für große Mengen an Objekten relevant sind, z.B.
Ingest oder Ersetzungsoperationen. Er übernimmt auch zahlreiche Aufgaben bei der
Anreicherung der Metadaten und der Qualitätskontrolle der Ressourcen.
Weitere
wesentliche Bestandteile der Infrastruktur basieren auf Apache Cocoon, Blazegraph, Apache Lucene, Apache Solr, PostgreSQL und Loris IIIF image server.
Besonderes Augenmerk liegt auf der Plattformunabhängigkeit und der Open Source Policy
der einzelnen Softwarekomponenten.
Welche Datenformate werden akzeptiert?
GAMS setzt auf eine XML-(eXtensible Markup Language)basierte Datenarchivierung und
-präsentation. Wenn die Daten nicht in einem anerkannten XML-basierten Standard
vorliegen, implementiert das Repositorium in Abstimmung mit den Projektpartnern einen
Konvertierungsablauf.
Das Hauptaugenmerk bei der Datensammlung liegt auf
textuellen Ressourcen, das bevorzugte Format dafür ist XML. Für textbasierten Inhalt und
Metadaten werden unter anderem die folgenden Standards verwendet: TEI (Text Encoding Initiative), LIDO (Lightweight Information Describing Objects), DC (Dublin Core), METS/MODS (Metadata Encoding and
Transmission Standard/Metadata Object Description Scheme), RDF (Resource Description Framework), SKOS (Simple Knowledge Organization
System). Diese Liste von bevorzugten Formaten spiegelt sich auch in der Verwendung von
dafür vorgesehenden spezifischen Content Models. Der Cirilo
Client prüft die Daten auf Wohlgeformtheit und validiert gegen das jeweils zu
verwendende Schema.
Als Formate für Bilder werden die Standards JPEG, JPEG2000
(Joint Photographic Experts Group), PNG (Portable Network Graphics) und TIFF (Tagged
Image File Format) akzeptiert, für die Langzeitarchivierung bevorzugt werden
verlustfreie Formate. Die Auswahl des Formats, der notwendigen Qualität und der
enthaltenen Metadaten für das jeweilige Projekt wird in Absprache zwischen Repositorium
und Depositor:in getroffen. Bei Bedarf kann das Repositorium eine Konvertierung
durchführen bzw. zu einer solchen beraten.
Wir sind der Überzeugung, dass nur
durch die Verwendung einer begrenzten Anzahl von Formaten und Technologien und die
Anwendung standardisierter Arbeitsabläufe ein Repository über einen langen Zeitraum
gepflegt werden und die Verantwortung für die Langzeitarchivierung von Ressourcen
übernehmen kann. Durch die streng begrenzte Auswahl an akzeptierten Formaten, die auf
Kriterien wie Offenheit, Menschen- und Maschinenlesbarkeit und Langzeitfähigkeit beruht,
sind risikobehaftete Prozesse wie notwendige Formatmigration minimierbar.
Nichtsdestotrotz werden technische Entwicklungen, die die Veraltung oder
sicherheitsrelevante Veränderungen von verwendeten Formaten zur Folge haben können, im
Zuge der Erhaltungsplanung genau verfolgt und bei Bedarf eine Konvertierung in ein
besser geeignetes Archivformat vorgenommen.
Wie können Daten abgegeben werden, welche Daten werden gesammelt?
Daten können hauptsächlich im Rahmen eines Kooperationsprojektes ins Repositorium
eingebracht werden. Jedes Projekt wird während der gesamten Laufzeit von einem/einer
Metadatenmanager/in begleitet, der/die den Arbeitsablauf, die Datenmodellierung, den
Ingest und die Publikation betreut. Dieser Zugang garantiert hohe Datenqualität, die
sowohl für die Publikation wie auch für die Langzeitarchivierung geeignet ist.
Gleichzeitig werden durch die kontinuierliche Betreuung von der Erfassung bis zur
Publikation viele Fallen vermieden. Idealerweise werden alle wichtigen Punkte zu Beginn
des Kooperationsprojektes bereits im Datenmanagementplan festgelegt.
Die
Forschungsdaten kommen dabei aus allen geisteswissenschaftlichen Disziplinen. Besonderer
Schwerpunkt und Expertise liegt im Themenbereich Digitale Edition auf Basis von XML/TEI
und entsprechender Visualisierung und Weiterverarbeitung, also dem Quellenmaterial
“Text” in jeder Form.
Möchte man neue entstehende Daten in GAMS ablegen, ist der
logische Weg also ein gemeinsames Förderansuchen mit dem Institut für Digitale Geisteswissenschaften. Für die Übernahme bereits bestehender Daten können bei
entsprechender Expertise am Institut eine Aufwands- und damit Kostenschätzung vorgenommen
werden, um die Daten integrieren zu können.
Muster Deposition Agreement (Englisch)
Muster Datenmanagementplan (Englisch)
Wie werden Daten dauerhaft kuratiert und erhalten?
Die abgelegten Forschungsdaten werden im Einklang mit der Forschungsdatenpolicy der Uni Graz und den Vorgaben der meisten Fördergeber
zumindest für 10 Jahre gesichert. Durch die Begleitung der Datenerstellung wird
normalerweise ein sehr hohes Level an Datenkuratierung erreicht. Alle Daten unterliegen
den gleichen Bestimmungen für die Langzeitarchivierung.
Die Entwicklung und Wartung
der projektspezifischen Weboberflächen zur Präsentation und Analyse der Daten ist auf
jeden Fall für die Dauer der Kooperation gesichert. Wir bemühen uns bereits in der
Entwicklung zu berücksichtigen, dass diese auch nach Ende der Förderperiode noch
dauerhaft verfüg- und benutzbar bleiben und erzielen hier derzeit gute Ergebnisse.
Allerdings können in der sich schnell verändernden Webentwicklung und bei
Sicherheitsproblemen keine weitergehenden Garantien übernommen werden. Dies betrifft
jedoch nur die projektspezifischen Weboberflächen; die Daten selbst bleiben davon
unberührt und auf jeden Fall verfügbar.
Für die Ergänzung oder Überarbeitung von
bestehenden Daten und Interfaces muss individuell eine spezifische Aufwandsschätzung
durchgeführt werden.
Weitere Informationen zur langfristigen Erhaltung der Daten
können dem Preservation Plan entnommen
werden.
Bekenntnis zu Open Access
Wir unterstützen den offenen Zugang zu Quellen des menschlichen Wissens und des
kulturellen Erbes (vgl. Berliner Erklärung und Open
Access Policy der Universität Graz). Um die Vision einer globalen und
zugänglichen Darstellung des Wissens zu verwirklichen, muss dieses nachhaltig,
interaktiv, transparent und offen zugänglich sein. Daher werden die über GAMS
verfügbaren Daten - in Abstimmung mit den Depositor:innen - unter möglichst offenen Creative Commons Lizenzen (CC-BY oder
CC-BY-NC) veröffentlicht. Die abgeleiteten Dublin Core Metadaten stehen unter der Lizenz
CC0.
Sofern es sich bei den Forschungsdaten um sensible Daten (wie z.B.
persönliche Daten) handelt, gewährleistet das Repositorium, dass solche Datensätze nicht
oder nur mit geeigneten Schutzmaßnahmen (z.B. Anonymisierung) zugänglich sind (vgl. Datenschutzerklärung der
Universität Graz).
Sollte das Repositorium von einer Verletzung von
Verwertungs- oder Persönlichkeitsrechten im Kontext der zur Verfügung gestellten Daten
Kenntnis erlangen, wird der Zugang zu den betroffenen Datensätzen umgehend gesperrt und
die Depositor:innen verständigt um angemessene Schritte zu setzen.
Wie kann auf die Daten zugegriffen werden?
Für BenutzerInnen ist der erste Zugriffspunkt normalerweise die grafische
Benutzeroberfläche des jeweiligen Projektes. Diese bietet zugeschnittene und
vorstrukturierte Zugangswege um mit den Ressourcen zu interagieren. Zusätzlich kann das
Fedora backend unter https://gams.uni-graz.at/archive/search abgefragt werden.
Um
Daten systematisch zu harvesten oder in eigene Kontexte zu integrieren kann die OAI-PMH Schnittstelle unter
https://gams.uni-graz.at/oaiprovider verwendet und nach den Regeln des PMH abgefragt
werden (vgl. die Dokumentation hier). Zur
Zeit werden folgende Metadatenpräfixe unterstützt: oai_dc (Dublin Core), oai_openaire
(OpenAIRE
Guidelines), oai_edm (Europeana Data Model)
und oai_tei_cmdi (Component Metadata).
Alle Bilddateien im Repositorium können auch über den
IIIF-kompatiblen Image Server ausgeliefert werden.
Hierfür muss die folgende Syntax verwendet werden: https://gams.uni-graz.at/iiif/{object
PID}/{image PID}/{IIIF query}, z.B.: https://gams.uni-graz.at/iiif/o:sis.2-10%2FIMAGE.1/100,1000,2880,2000/pct:15/0/default.jpg.
In Absprache mit den Projektpartnern können die Daten auch an verschiedene
Aggregationsprojekte geliefert werden, beispielsweise Europeana, CorrespSearch, Pelagios, Nomisma, CLARIN VLO
oder OpenAIRE. Mögliche rechtliche Fragen zu den verwendeten Inhalten werden im
Projektverlauf mit den Partnern geklärt; normalerweise werden alle Resourcen unter einer
nicht-kommerziellen Creative Commons Lizenz geführt (Creative Commons BY-NC
4.0). Das Institut bietet dabei auch Consulting und Unterstützung in den
Bereichen Urheberrecht und Lizensierung.
Wie können Datenobjekte persistent adressiert werden?
Intern werden Datenobjekte unter einem persistent identifier (PID) in Form eines projektspezifischen Permalinks verspeichert. Zusätzlich inkludiert die GAMS-Infrastruktur einen Handle Server, der die Möglichkeit bietet, auch in diesem System einen permanenten Identifikator anzulegen (Präfix 11471).
Wie sieht der Arbeitsablauf und ein Datenlebenszyklus in der GAMS aus?
Die nachfolgende Grafik zeigt den Lebenszyklus von Daten im GAMS Repositorium.
Ist GAMS ein vertrauenswürdiges digitales Archiv (trusted digital repository) und wie ist es zertifiziert?
GAMS wurde 2014 erstmals als vertrauenswürdiges digitales Archiv nach den Richtlinien des Data Seal of Approval zertifiziert. Seit 2019 tragen wir das CoreTrustSeal. Im Jahr 2020 wurde GAMS offiziell als CLARIN B Centre anerkannt. GAMS ist auch bei der Registry of Research Data Repositories und OpenDOAR registriert.
Wo kann ich mehr über die Infrastruktur erfahren?
Eine umfangreiche Dokumentation kann auf dieser Seite unter https://gams.uni-graz.at/docs abgerufen werden (auf Englisch).
Release: 2018
Last Update: 2024-08-05