OCR-D
Koordinierte Förderinitiative zur Weiterentwicklung von Verfahren der Optical Character Recognition (OCR-D)
Information
Antragsteller: |
|
Fachliche Zuordnung: | Datenmanagement, OCR, Digitalisierung |
Förderung: | Förderung von 2015 bis 2024 |
Projektkennung: | Deutsche Forschungsgemeinschaft (DFG) - Projektnummer: 274863866; 409784275; 460675868 |
Institution: |
|
Beschreibung
Hauptziel des Projekt OCR-D ist die konzeptionelle und technische Vorbereitung der Volltexttransformation der VD. Die Aufgabe der automatischen Volltexterkennung wird in ihre einzelnen Prozessschritte zerlegt, die in der Open Source OCR-D-Software nachvollzogen werden können. Dies ermöglicht es, optimale Workflows für die zu prozessierenden alten Drucke zu erstellen und damit wissenschaftlich verwertbare Volltexte zu generieren.
Das Projekt OCR-D wurde in drei Projektphasen bearbeitet: Konzeptions-, Modul- und Stabilisierungsphase. In der ersten Phase wurden die Entwicklungsbedarfe erhoben, die in der zweiten Phase unter Anleitung des Koordinierungsprojekts von acht Modulprojekten bearbeitet wurden. In der Stabilisierungsphase ab April 2021 wurden die Ergebnisse der Modulprojekte konsolidiert und in einen produktiven Einsatz überführt. So soll die praktische und konzeptionelle Vorbereitung für die automatische Generierung von Volltexten für die Verzeichnisse der im deutschen Sprachraum erschienenen Drucke des 16., 17. und 18. Jahrhunderts realisiert werden.
Das Koordinierungsprojekt bietet:
- eine dauerhafte Betreuung und Weiterentwicklung der OCR-D-Software,
- die Ergebnisse der Implementierungsarbeiten, die stabilen für die Massendigitalisierung einsatzbereite OCR-D-Lösungen erarbeiteten,
- die Vermittlung und Verfügbarkeit der Software für einen breiten Kreis von Nutzerinnen.