OCR A/B
Optical Character Recognition (engl.) Type A or B. Optische Zeichenerkennung. Methode zur Umwandlung von Texten im Rasterformat, also nichtkodierte Information, in eine kodierte Information, also in von einem Rechner interpretierbare und weiterverarbeitbare Zeichenfolge.
Texterkennung oder auch Optische Zeichenerkennung (Abkürzung
selten auch: OZE) ist ein Begriff aus dem IT-Bereich und beschreibt die automatische Texterkennung von einer gedruckten Vorlage.
Automatische Texterkennung und OCR werden im deutschen Sprachraum oft synonym verwendet. Diesem Prozess geht eine globale Strukturerkennung voraus, in der zuerst Textblöcken von graphischen Elementen unterschieden, die Zeilenstrukturen erkannt und schließlich Einzelzeichen separiert werden. Diese OCR Ergebnisse können durch nachfolgende Verfahren, in der der Kontext berücksichtigt wird, präzisiert werden.
Klassischer
Einsatzbereich u. a. im Zahlungsverkehr. Ursprünglich wurden zur automatischen Texterkennung eigens entworfene Schriftarten entwickelt, die zum Beispiel für das Bedrucken von Scheckformularen verwendet wurden. Diese Schriftarten waren so gestaltet, dass die einzelnen Zeichen von einem OCR-Lesegerät schnell und ohne großen Rechenaufwand unterschieden werden konnten. So zeichnet sich die Schriftart OCR-A (DIN 66008, ISO 1073-1) durch einander besonders unähnliche Zeichen, besonders bei den Ziffern, aus. OCR-B (ISO 1073-2) ähnelt mehr einer serifenlosen, nicht-proportionalen Schriftart, während OCR-H (DIN 66225) handgeschriebenen Ziffern und Großbuchstaben nachempfunden wurde.



