Hvad er optisk tegngenkendelse?

Selvom det er nemt at tage et dokument på din computer og få en fysisk kopi med en printer, er det generelt sværere at gå den anden vej. Selvom scannere findes og kan gemme scannede dokumenter som et billede, er dette ikke særlig nyttigt, hvis du vil redigere dokumentet. For at kunne redigere et dokument vil du bruge en teknologi kaldet Optical Character Recognition eller OCR.

Hvordan fungerer optisk tegngenkendelse?

OCR bruger en række teknikker til nøjagtigt at læse dokumenter. OCR-software justerer dokumentet og potentielt endda individuelle ord, så de er justeret korrekt. Billedet konverteres til et rent sort/hvid-format, da det er nemmere end at skelne mellem gråtoner. Analyse udføres også for at identificere og fjerne eventuelle ikke-tekstelementer.

Der bruges to hovedtyper af OCR-algoritmer, matrixmatching og feature-ekstraktion. Matrixmatching tager et billede af et enkelt tegn og sammenligner det derefter med de algoritmer, der er konfigureret skrifttyper på en pixel for pixel basis. Denne teknik kræver, at tegnet er korrekt isoleret fra alt andet indhold, og at skrifttypen er inkluderet i OCR-softwaren. Denne type OCR virker heller ikke til at genkende håndskrift.

Funktionsudtrækningsalgoritmer opdeler hver karakter i funktioner, såsom linjer, kurver og linjeskæringer. Denne teknik reducerer væsentligt afhængigheden af, at algoritmen trænes med kendte skrifttyper. Funktionsudtrækning er i stand til at genkende nye skrifttyper og transskribere dem, såvel som noget håndskrift, selvom nøjagtigheden ikke er så god som for kendte skrifttyper.

Noget mere avanceret software bruger konteksten af de omgivende bogstaver til at hjælpe med at identificere bogstaver, der ikke er så tydelige. For eksempel, hvis ordet "hund" udskrives, og OCR-algoritmen ikke kan fortælle med sikkerhed, om "o" er en "a" eller et "o", det kan bruge en ordbog til at se, om en kombination af potentielle tegn gør en kendt ord. I dette tilfælde vil OCR-algoritmen udelukke muligheden for "a", da "dag" ikke er et ord, mens "hund" er det.

Hvor bruges OCR?

En af de vigtigste anvendelser af OCR er i postsystemet. OCR bruges til automatisk at identificere adressen på breve og pakker, en opgave den kan udføre betydeligt hurtigere, end folk kunne. I tilfælde, hvor OCR-systemet ikke er i stand til at læse adressen på etiketten, vil den blive adskilt for et menneske at behandle manuelt i stedet.

OCR er nyttigt som et tilgængelighedsværktøj for personer med synshandicap, når det kombineres med et tekst-til-tale-værktøj. Google translate implementerer også OCR som en del af processen med at oversætte teksten i billeder.