Klug, Helmut W.; helmut.klug@uni-graz.at
Die PAGE-XML-Formate werden verwendet, um den Seiteninhalt von Quellendokumenten, die als Bilddigitalisate vorliegen, zu beschreiben und über Bildkoordinaten in den Digitalisaten zu verorten. Die Daten umfassen Layout, Textinhalt und mögliche Informationen zu Bildbearbeitung (dewarping, deskewing) sowie Ground-Truth-Daten, die eine Beurteilung der Ergebnisse von automatisierten Erkennungsroutinen zulassen, bei denen PAGE-XML gerne als Output verwendet wird.