DTA

Deutsches Textarchiv

Information

Antragsteller: Professor Dr. Wolfgang Klein
Fachliche Zuordnung: Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung: Förderung von 2007 bis 2017
Projektkennung: Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 37149321
Institution: Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)

Beschreibung

Das Deutsches Textarchiv erschließt, speichert und stellt eine disziplinen- und gattungsübergreifende Sammlung von deutschsprachigen Texten bereit. Im Zentrum steht das Kernkorpus mit rund 1500 Titeln, der die Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache bildet.

Das Besondere am Kernkorpus ist:

  • die ausbalancierte Textauswahl,
  • der Publikationszeitraum umfasst vom 17. Jahrhundert bis zum frühen 20. Jahrhundert,
  • die Volltextdigitaliserung von Erstausgaben,
  • die Transkription erfolgt unter Wahrung des Sprachstandes,
  • die Textstrukturierung auf Basis von DTABf (TEI-XML).

Beispiele

Beispiele aus dem Bestand des Deutschen Textarchives