publications

A collection of publications, arranged in reverse chronological order.

2024

  1. Auf dem Trainingsplatz der OCR, die OCR-D-GT-Guidelines
    Matthias Boenig, Lena Hinrichsen, and Konstantin Baierer
    2024

2023

  1. OCR-D für die Massendigitalisierung: Projektstand und Ausblick
    Lena Hinrichsen, Konstantin Baierer, Clemens Neudecker, and 2 more authors
    2023
  2. Moderne Standards bei der Erstellung und Evaluation von Volltextdaten
    Matthias Boenig, Uwe Hartwig, Michelle Weidling, and 2 more authors
    2023

2022

  1. Massendigitalisierung mit OCR-D: Anwendungsmöglichkeiten für Bibliotheken und Community-Aktivitäten
    Lena Hinrichsen, Konstantin Baierer, and Matthias Boenig
    2022
  2. Dokument, Transkription, Forschungsdatum
    Konstantin Baierer, Matthias Boenig, Elisabeth Engl, and 5 more authors
    2022
  3. Das Deutsche Textarchiv gestern und heute
    Susanne Haaf, Matthias Boenig, and Marius Hug
    Mitteilungen des Deutschen Germanistenverbandes, 2022

2021

  1. Integration von Textdaten aus der Community in bestehende Infrastrukturen
    Matthias Boenig, Marius Hug, and Simon Sendler
    CLARIAH-DE-Arbeitsbericht, 2021
  2. Das DTABf in der Edition: zusammenfassender Evaluationsbericht
    Bernhard Fisseni, Simon Sendler, Daniela Schulz, and 3 more authors
    2021

2020

  1. Volltexte–die Zukunft alter Drucke: Bericht zum Abschlussworkshop des OCR-D-Projekts
    Elisabeth Engl, Konstantin Baierer, Matthias Boenig, and 2 more authors
    o-bib. Das offene Bibliotheksjournal/Herausgeber VDB, 2020
  2. Volltexte für die Frühe Neuzeit
    Elisabeth Engl, Matthias Boenig, Konstantin Baierer, and 2 more authors
    Zeitschrift für Historische Forschung, 2020
  3. OCR-D kompakt: Ergebnisse und Stand der Forschung in der Förderinitiative
    Konstantin Baierer, Matthias Boenig, Elisabeth Engl, and 27 more authors
    2020
  4. OCR-D in the wild: Erfahrungen und Erkenntnisse aus der Praxisphase mit Pilotbibliotheken
    Elisabeth Engl, and Matthias Boenig
    2020

2019

  1. Vom gedruckten Werk zu elektronischem Volltext als Forschungsgrundlage Erstellung von Forschungsdaten mit OCR-Verfahren
    Matthias Boenig, Elisa Herrmann, and Volker Hartmann
    2019
  2. OCR-D: An end-to-end open source OCR framework for historical printed documents
    Clemens Neudecker, Konstantin Baierer, Maria Federbusch, and 4 more authors
    2019
  3. OCR-D in der Praxis: Ein gemeinsamer Ausblick mit Dienstleistern und Anwendern
    Matthias Boenig
    2019
  4. Labelling OCR Ground Truth for Usage in Repositories
    Matthias Boenig, Konstantin Baierer, Volker Hartmann, and 2 more authors
    2019
  5. Aggregating Resources in CLARIN: FAIR Corpora of Historical Newspapers in the German Text Archive (Poster)
    Matthias Boenig, and Susanne Haaf
    CLARIN Annual Conference Leipzig, 2019

2018

  1. Researching, Working and Publishing in the German Text Archive: a Report
    Frank Wiegand, Christian Thomas, Susanne Haaf, and 3 more authors
    ZEITSCHRIFT FUR GERMANISTISCHE LINGUISTIK, 2018
  2. Recherchieren, Arbeiten und Publizieren im Deutschen Textarchiv: ein Praxisbericht
    Frank Wiegand, Christian Thomas, Susanne Haaf, and 3 more authors
    Zeitschrift für germanistische Linguistik, 2018
  3. Ground Truth: Grundwahrheit oder Ad-Hoc-Lösung? Wo stehen die Digital Humanities?
    Matthias Boenig, Maria Federbusch, Elisa Herrmann, and 2 more authors
    2018
  4. Das Deutsche Textarchiv als Forschungsplattform für historische Daten in CLARIN
    Alexander Geyken, Matthias Boenig, Susanne Haaf, and 3 more authors
    2018

2016

  1. Über den Mehrwert der Vernetzung von OCR-Verfahren zur Erfassung von Texten des 17. Jahrhunderts.
    Matthias Boenig, Kay-Michael Würzner, Arne Binder, and 1 more author
    2016

2015

  1. Zeitliche Verlaufskurven in den DTA-und DWDS-Korpora: Wörter und Wortverbindungen über 400 Jahre (1600-2000).
    Alexander Geyken, Matthias Boenig, Susanne Haaf, and 4 more authors
    2015
  2. Standardized Information on historical Proper Names in Digital Full Text Transcriptions. Crowdsourcing ref= s for< placeName> and< persName> tags in the corpora of the German Text Archive/Deutsches Textarchiv*
    Christian Thomas, Matthias Boenig, Alexander Geyken, and 5 more authors
    2015
  3. Mehr als schmutzige OCR’: die Aufwertungen von historischen Volltextdigitalisaten zu Forschungsdaten
    Matthias Boenig, and Alexander Geyken
    2015

2014

  1. Historical newspapers & journals for the DTA
    Susanne Haaf, and Matthias Schulz
    Proceedings of the LREC Workshop on Language Resources and Technologies for Processing and Linking Historical Documents and Archives—Deploying Linked Open Data in Cultural Heritage (LRT4HDA), 2014

2013

  1. Methoden zur effektiven Nachnutzung von Textressourcen aus dem Kontext wissenschaftlicher Projekte und Bibliotheken
    Matthias Schulz, Susanne Haaf, Christian Thomas, and 3 more authors
    2013

2012

  1. TEI und Textkorpora: Fehlerklassifikation und Qualitätskontrolle vor, während und nach der Texterfassung im Deutschen Textarchiv
    Alexander Geyken, Susanne Haaf, Bryan Jurish, and 3 more authors
    Jahrbuch für Computerphilologie, 2012

2011

  1. Das Deutsche Textarchiv: Vom historischen Korpus zum aktiven Archiv
    Alexander Geyken, Susanne Haaf, Bryan Jurish, and 4 more authors
    Digitale Wissenschaft, 2011

2006

  1. Dissertationen und Habilitationsschriften mit Microsoft Word
    Uwe Müller, Karin Schröder, Matthias Schulz, and 1 more author
    2006

2005

  1. ProPrint–Der Print-on-Demand-Service für Dokumentenund Publikationsserver
    Matthias Schulz
    cms-journal, 2005

2004

  1. ProPrint world‐wide print‐on‐demand services for study and research
    Elmar Mittler, and Matthias Schulz
    Library Hi Tech, 2004

2003

  1. Tutorial: Introduction to XML
    Matthias Schulz
    2003
  2. Save as XDiML (DissertationMarkupLanguage), Writing and Converting digital Theses and Dissertations using OpenOffice
    Matthias Schulz, and Sabine Henneberger
    2003

2001

  1. Verlagsbibliothek ProPrint
    Matthias Schulz
    2001
  2. SGML/XML-based electronic theses and dissertations: Existing projects and standards
    Susanne Dobratz, Matthias Schulz, Phil Potter, and 1 more author
    The Internet and higher education, 2001
  3. SGML/XML Tools and the project DiDi
    Susanne Dobratz, and Matthias Schulz
    2001
  4. High quality electronic publishing in universities using XML–the DiDi principle
    Peter Schirmbacher, Susanne Dobratz, and Matthias Schulz
    2001
  5. High quality electronic publishing in universities using XML-the DiDi priciple (Dissertations project at Humboldt-University Berlin)
    Susanne Dobratz, Peter Schirmbacher, and Matthias Schulz
    2001
  6. Digitale Bibliothek. Vom DFG-Projekt „Dissertationen Online “zu DissOnline. de
    Peter Diepold, Norbert Martin, Susanne Dobratz, and 1 more author
    Bibliotheksdienst, 2001

2000

  1. Informationsvermittlung. Elektronisches Publizieren an Universitäten-aktuelle Trends und zwei Tagungen aus bibliothekarischer Sicht
    Susanne Dobratz, and Matthias Schulz
    Bibliotheksdienst, 2000
  2. Elektronisches Publizieren an Universitäten-aktuelle Trends und zwei Tagungen aus bibliothekarischer Sicht.
    S Dobratz, and M Schulz
    Bibliotheksdienst, 2000

1999

  1. Projekt "Digitale Dissertationen" Stand und Entwicklungen
    Matthias Schulz, and Susanne Dobratz
    1999
  2. Dissertation Markup Language (DiML)
    Matthias Schulz
    1999

1998

  1. dissonline.de
    Steffi Dippold, Uwe Müller, Matthias Schulz, and 1 more author
    1998
  2. Word für Windows Dissertationsformatvorlage 1.2
    Matthias Schulz, and Susanne Dobratz
    1998
  3. Bereitstellung von Autorenwerkzeugen
    Matthias Schulz
    1998

1997

  1. Eine kleine Einführung in die Nutzung der eXtensible Markup Language
    Susanne Dobratz, and Matthias Schulz
    1997