Ocropus-Infrastruktur: Ordnersystem und Stapelverarbeitung

Im Normalfall möchte man mehrere Bildseiten erkennen. Für die Stapelverarbeitung ist es von Vorteil eine gewisse Infrastruktur einzurichten, damit möglichst viele Schritte automatisch abgearbeitet werden können. Am Beginn steht eine gleichbleibende Ordnerstruktur, durch die man sich leicht bewegen kann. Manche weiterlesen Ocropus-Infrastruktur: Ordnersystem und Stapelverarbeitung

Die Bedeutung des Preprocessing

Einer der bedeutendsten Schritte bei der Texterkennung ist die Vorbereitung des Materials, das sogenannte Preprocessing. Ziel des Preprocessing ist es, möglichst viele Hürden für die Texterkennung zu entfernen. Die Texterkennung von unbereinigten Bilden liefert häufig schlechte Erkennungsraten aufgrund von kontrastarmen weiterlesen Die Bedeutung des Preprocessing