Das Zoning
Das Programm ZOT (ZoningTool) ist ein Segmentierungsprogramm, mit dem spezifische Strukturinformationen in Form von Rahmen auf die Digitalisate digital geschrieben werden. Die Segmentierungskoordinaten und Metadaten werden für die nachfolgende strukturierte Transkription genutzt.
Das ZoningTool ist ein einfach zu bedienendes Werkzeug, mit dessen Hilfe auf jedem Digitalisat verschiedene Zonen definiert werden können. Diese Zonen dienen der Klassifizierung einzelner Textpassagen (z. B. als Prosatext, Kapitelüberschrift, Seitenzahl, Fußnote usw.). Das Digitalisat erhält auf diese Weise Strukturinformationen, die sich bei der Datenerfassung in Form von XML-Tags widerspiegeln. Somit ist eine individuelle Layout-Analyse im Zuge der Datenerfassung nicht notwendig, und die Heterogenität der strukturierten Transkriptionen wird vermieden.
Die so vorbereiteten Bilddateien dienen der manuellen Texterfassung als Vorlage. So kann bereits während der manuellen Erfassung der Text strukturiert werden, indem einfach, die in der Bilddatei aufgetragenen Zonen-Marker (z. B. für Überschriften) übernommen werden. Dieses Vorgehen entlastet den Erfasser von der Aufgabe, die oft nicht einfach zu durchschauende Makrostruktur selbst zu erkennen.
Für die maschinelle Texterfassung kann ebenfalls diese Art der Vorlagen genutzt werden.