GAMS

Geisteswissenschaftliches Asset Management System

About

Was ist GAMS?

GAMS ist ein OAIS-konformes Asset Management System zur Verwaltung, Publikation und Langzeitarchivierung digitaler Ressourcen aus allen geisteswissenschaftlichen Fächern. Es bietet MitarbeiterInnen aus Forschung und Lehre, aber auch Studierenden in Projekten die Möglichkeit, diese Ressourcen zitabel und mit Metadaten versehen zu verwalten und zu veröffentlichen.
Geplant und entwickelt wurde GAMS am Institut für Digitale Geisteswissenschaften (vormals Zentrum für Informationsmodellierung) im Rahmen einer Vielzahl von Kooperationsprojekten mit inner- und außeruniversitären PartnerInnen, in Auseinandersetzung mit den konkreten Erfordernissen universitärer Forschung.
Das Repositorium ist komplett OAIS(Open Archival Information System)-konform und deckt den gesamten Lebenszyklus von digitalen Objekten vom Erhalt des SIP (submission information package), speichern des AIP (archival information package) und Zurverfügungstellung des DIP (dissemination information package) für die Öffentlichkeit ab.
Mit Hinblick auf die gespeicherten Daten orientieren wir uns an den FAIR-Datenprinzipien: "data should be Findable, Accessible, Interoperable, and Re-usable".

Welche Technologien werden verwendet?

GAMS basiert auf dem Open Source Projekt Fedora (Flexible Extensible Digital Object Repository Architecture) und wird im Rahmen von Kooperationsprojekten laufend weiterentwickelt um auf spezifische Forschungsinteressen Rücksicht zu nehmen. Für das Objektmanagement und die Datenkuratierung wurde eine eigene Java Applikation entwickelt. Dieser Cirilo Client bietet Funktionalitäten, die besonders für große Mengen an Objekten relevant sind, z.B. Ingest oder Ersetzungsoperationen. Er übernimmt auch zahlreiche Aufgaben bei der Anreicherung der Metadaten und der Qualitätskontrolle der Ressourcen.
Weitere wesentliche Bestandteile der Infrastruktur basieren auf Apache Cocoon, Blazegraph, Apache Lucene, Apache Solr, PostgreSQL und Loris IIIF image server. Besonderes Augenmerk liegt auf der Plattformunabhängigkeit und der Open Source Policy der einzelnen Softwarekomponenten.

Welche Datenformate werden akzeptiert?

GAMS setzt auf eine XML-(eXtensible Markup Language)basierte Datenarchivierung und -präsentation. Wenn die Daten nicht in einem anerkannten XML-basierten Standard vorliegen, implementiert das Repositorium in Abstimmung mit den Projektpartnern einen Konvertierungsablauf.
Das Hauptaugenmerk bei der Datensammlung liegt auf textuellen Ressourcen, das bevorzugte Format dafür ist XML. Für textbasierten Inhalt und Metadaten werden unter anderem die folgenden Standards verwendet: TEI (Text Encoding Initiative), LIDO (Lightweight Information Describing Objects), DC (Dublin Core), METS/MODS (Metadata Encoding and Transmission Standard/Metadata Object Description Scheme), RDF (Resource Description Framework), SKOS (Simple Knowledge Organization System). Diese Liste von bevorzugten Formaten spiegelt sich auch in der Verwendung von dafür vorgesehenden spezifischen Content Models. Der Cirilo Client prüft die Daten auf Wohlgeformtheit und validiert gegen das jeweils zu verwendende Schema.
Als Formate für Bilder werden die Standards JPEG, JPEG2000 (Joint Photographic Experts Group), PNG (Portable Network Graphics) und TIFF (Tagged Image File Format) akzeptiert, für die Langzeitarchivierung bevorzugt werden verlustfreie Formate. Die Auswahl des Formats, der notwendigen Qualität und der enthaltenen Metadaten für das jeweilige Projekt wird in Absprache zwischen Repositorium und Depositor:in getroffen. Bei Bedarf kann das Repositorium eine Konvertierung durchführen bzw. zu einer solchen beraten.
Wir sind der Überzeugung, dass nur durch die Verwendung einer begrenzten Anzahl von Formaten und Technologien und die Anwendung standardisierter Arbeitsabläufe ein Repository über einen langen Zeitraum gepflegt werden und die Verantwortung für die Langzeitarchivierung von Ressourcen übernehmen kann. Durch die streng begrenzte Auswahl an akzeptierten Formaten, die auf Kriterien wie Offenheit, Menschen- und Maschinenlesbarkeit und Langzeitfähigkeit beruht, sind risikobehaftete Prozesse wie notwendige Formatmigration minimierbar. Nichtsdestotrotz werden technische Entwicklungen, die die Veraltung oder sicherheitsrelevante Veränderungen von verwendeten Formaten zur Folge haben können, im Zuge der Erhaltungsplanung genau verfolgt und bei Bedarf eine Konvertierung in ein besser geeignetes Archivformat vorgenommen.

Wie können Daten abgegeben werden, welche Daten werden gesammelt?

Daten können hauptsächlich im Rahmen eines Kooperationsprojektes ins Repositorium eingebracht werden. Jedes Projekt wird während der gesamten Laufzeit von einem/einer Metadatenmanager/in begleitet, der/die den Arbeitsablauf, die Datenmodellierung, den Ingest und die Publikation betreut. Dieser Zugang garantiert hohe Datenqualität, die sowohl für die Publikation wie auch für die Langzeitarchivierung geeignet ist. Gleichzeitig werden durch die kontinuierliche Betreuung von der Erfassung bis zur Publikation viele Fallen vermieden. Idealerweise werden alle wichtigen Punkte zu Beginn des Kooperationsprojektes bereits im Datenmanagementplan festgelegt.
Die Forschungsdaten kommen dabei aus allen geisteswissenschaftlichen Disziplinen. Besonderer Schwerpunkt und Expertise liegt im Themenbereich Digitale Edition auf Basis von XML/TEI und entsprechender Visualisierung und Weiterverarbeitung, also dem Quellenmaterial “Text” in jeder Form.
Möchte man neue entstehende Daten in GAMS ablegen, ist der logische Weg also ein gemeinsames Förderansuchen mit dem Institut für Digitale Geisteswissenschaften. Für die Übernahme bereits bestehender Daten können bei entsprechender Expertise am Institut eine Aufwands- und damit Kostenschätzung vorgenommen werden, um die Daten integrieren zu können.
Muster Deposition Agreement (Englisch)
Muster Datenmanagementplan (Englisch)

Wie werden Daten dauerhaft kuratiert und erhalten?

Die abgelegten Forschungsdaten werden im Einklang mit der Forschungsdatenpolicy der Uni Graz und den Vorgaben der meisten Fördergeber zumindest für 10 Jahre gesichert. Durch die Begleitung der Datenerstellung wird normalerweise ein sehr hohes Level an Datenkuratierung erreicht. Alle Daten unterliegen den gleichen Bestimmungen für die Langzeitarchivierung.
Die Entwicklung und Wartung der projektspezifischen Weboberflächen zur Präsentation und Analyse der Daten ist auf jeden Fall für die Dauer der Kooperation gesichert. Wir bemühen uns bereits in der Entwicklung zu berücksichtigen, dass diese auch nach Ende der Förderperiode noch dauerhaft verfüg- und benutzbar bleiben und erzielen hier derzeit gute Ergebnisse. Allerdings können in der sich schnell verändernden Webentwicklung und bei Sicherheitsproblemen keine weitergehenden Garantien übernommen werden. Dies betrifft jedoch nur die projektspezifischen Weboberflächen; die Daten selbst bleiben davon unberührt und auf jeden Fall verfügbar.
Für die Ergänzung oder Überarbeitung von bestehenden Daten und Interfaces muss individuell eine spezifische Aufwandsschätzung durchgeführt werden.
Weitere Informationen zur langfristigen Erhaltung der Daten können dem Preservation Plan entnommen werden.

Bekenntnis zu Open Access

Wir unterstützen den offenen Zugang zu Quellen des menschlichen Wissens und des kulturellen Erbes (vgl. Berliner Erklärung und Open Access Policy der Universität Graz). Um die Vision einer globalen und zugänglichen Darstellung des Wissens zu verwirklichen, muss dieses nachhaltig, interaktiv, transparent und offen zugänglich sein. Daher werden die über GAMS verfügbaren Daten - in Abstimmung mit den Depositor:innen - unter möglichst offenen Creative Commons Lizenzen (CC-BY oder CC-BY-NC) veröffentlicht. Die abgeleiteten Dublin Core Metadaten stehen unter der Lizenz CC0.
Sofern es sich bei den Forschungsdaten um sensible Daten (wie z.B. persönliche Daten) handelt, gewährleistet das Repositorium, dass solche Datensätze nicht oder nur mit geeigneten Schutzmaßnahmen (z.B. Anonymisierung) zugänglich sind (vgl. Datenschutzerklärung der Universität Graz).
Sollte das Repositorium von einer Verletzung von Verwertungs- oder Persönlichkeitsrechten im Kontext der zur Verfügung gestellten Daten Kenntnis erlangen, wird der Zugang zu den betroffenen Datensätzen umgehend gesperrt und die Depositor:innen verständigt um angemessene Schritte zu setzen.

Wie kann auf die Daten zugegriffen werden?

Für BenutzerInnen ist der erste Zugriffspunkt normalerweise die grafische Benutzeroberfläche des jeweiligen Projektes. Diese bietet zugeschnittene und vorstrukturierte Zugangswege um mit den Ressourcen zu interagieren. Zusätzlich kann das Fedora backend unter https://gams.uni-graz.at/archive/search abgefragt werden.
Um Daten systematisch zu harvesten oder in eigene Kontexte zu integrieren kann die OAI-PMH Schnittstelle unter https://gams.uni-graz.at/oaiprovider verwendet und nach den Regeln des PMH abgefragt werden (vgl. die Dokumentation hier). Zur Zeit werden folgende Metadatenpräfixe unterstützt: oai_dc (Dublin Core), oai_openaire (OpenAIRE Guidelines), oai_edm (Europeana Data Model) und oai_tei_cmdi (Component Metadata).
Alle Bilddateien im Repositorium können auch über den IIIF-kompatiblen Image Server ausgeliefert werden. Hierfür muss die folgende Syntax verwendet werden: https://gams.uni-graz.at/iiif/{object PID}/{image PID}/{IIIF query}, z.B.: https://gams.uni-graz.at/iiif/o:sis.2-10%2FIMAGE.1/100,1000,2880,2000/pct:15/0/default.jpg.
In Absprache mit den Projektpartnern können die Daten auch an verschiedene Aggregationsprojekte geliefert werden, beispielsweise Europeana, CorrespSearch, Pelagios, Nomisma, CLARIN VLO oder OpenAIRE. Mögliche rechtliche Fragen zu den verwendeten Inhalten werden im Projektverlauf mit den Partnern geklärt; normalerweise werden alle Resourcen unter einer nicht-kommerziellen Creative Commons Lizenz geführt (Creative Commons BY-NC 4.0). Das Institut bietet dabei auch Consulting und Unterstützung in den Bereichen Urheberrecht und Lizensierung.

Wie können Datenobjekte persistent adressiert werden?

Intern werden Datenobjekte unter einem persistent identifier (PID) in Form eines projektspezifischen Permalinks verspeichert. Zusätzlich inkludiert die GAMS-Infrastruktur einen Handle Server, der die Möglichkeit bietet, auch in diesem System einen permanenten Identifikator anzulegen (Präfix 11471).

Wie sieht der Arbeitsablauf und ein Datenlebenszyklus in der GAMS aus?

Die nachfolgende Grafik zeigt den Lebenszyklus von Daten im GAMS Repositorium.

GAMS Workflow und Datenlebenszyklus
GAMS Workflow und Datenlebenszyklus

Ist GAMS ein vertrauenswürdiges digitales Archiv (trusted digital repository) und wie ist es zertifiziert?

GAMS wurde 2014 erstmals als vertrauenswürdiges digitales Archiv nach den Richtlinien des Data Seal of Approval zertifiziert. Seit 2019 tragen wir das CoreTrustSeal. Im Jahr 2020 wurde GAMS offiziell als CLARIN B Centre anerkannt. GAMS ist auch bei der Registry of Research Data Repositories und OpenDOAR registriert.

Wo kann ich mehr über die Infrastruktur erfahren?

Eine umfangreiche Dokumentation kann auf dieser Seite unter https://gams.uni-graz.at/docs abgerufen werden (auf Englisch).

Release: 2018
Last Update: 2024-08-05