DTA-Basisformat

Die folgende Darstellung dokumentiert das DTA-Basisformat, das auf den P5-Richtlinien der Text Encoding Initiative (TEI) basiert. Da das DTA-Basisformat für sämtliche Bedürfnisse eine einheitliche Textaufbereitung von gedruckten Texten im Zeitraum von 1650-1900 anbieten möchte, wurde aus den P5-Richtlinien für die Textstrukturierung im DTA-Korpus eine Tag-Auswahl getroffen. Dieses Tagset ist mit den P5-Richtlinien der TEI vollständig konform; auf Erweiterungen (tei.extensions) durch davon abweichende Elemente wurde verzichtet.

Inhaltsverzeichnis

Das DTA-Basisformat soll im Rahmen der DTA-Richtlinien eine uneingeschränkte Textaufbereitung ermöglichen und dabei gleichzeitig Variationsspielräume bei der Annotation so einschränken, dass die Kohärenz der DTA-Texte untereinander gewährleistet wird. Für dieses Ziel stellt die Ausrichtung des DTA-Korpus in der Diachronie einerseits und die Textsortenvielfalt andererseits eine große Herausforderung dar, resultiert sie doch u. a. in einer strukturellen Variabilität der Vorlagen, der mit dem vorliegenden Annotationstagset Genüge getan werden muss.

Mit der Ausarbeitung des DTA-Basisformats bieten wir einen Vorschlag für einen Standard zur Volltext-Aufbereitung historischer Texte. Damit sollen zum einen Texte, die mit dem Basisformat kompatibel sind, in das DTA einfließen können, zum anderen aber die Verwendung von DTA-Texten in anderen Volltextarchiven erleichtert werden.