Čo je to optické rozpoznávanie znakov?

click fraud protection

Aj keď je ľahké vziať dokument do počítača a získať fyzickú kópiu pomocou tlačiarne, vo všeobecnosti je ťažšie ísť opačným smerom. Hoci skenery existujú a dokážu uložiť naskenované dokumenty ako obrázok, nie je to obzvlášť užitočné, ak chcete dokument upraviť. Aby ste mohli upravovať dokument, musíte použiť technológiu nazývanú optické rozpoznávanie znakov alebo OCR.

Ako funguje optické rozpoznávanie znakov?

OCR využíva množstvo techník na presné čítanie dokumentov. Softvér OCR upraví dokument a prípadne aj jednotlivé slová tak, aby boli správne zarovnané. Obraz sa prevedie do čisto čiernobieleho formátu, pretože je to jednoduchšie ako rozlišovanie medzi odtieňmi sivej. Analýza sa vykonáva aj na identifikáciu a odstránenie akýchkoľvek netextových položiek.

Používajú sa dva hlavné typy algoritmov OCR, porovnávanie matíc a extrakcia funkcií. Maticové porovnávanie vytvorí obrázok jedného znaku a potom ho porovná s písmami nakonfigurovanými v algoritmoch na báze pixelov. Táto technika vyžaduje, aby bol znak správne izolovaný od všetkého ostatného obsahu a aby bolo písmo zahrnuté do softvéru OCR. Tento typ OCR tiež nefunguje na rozpoznávanie rukopisu.

Algoritmy extrakcie prvkov rozdeľujú každý znak na prvky, ako sú čiary, krivky a priesečníky čiar. Táto technika výrazne znižuje spoliehanie sa na algoritmus trénovaný so známymi fontami. Extrakcia funkcií dokáže rozpoznať nové písma a prepísať ich, ako aj určitý rukopis, hoci presnosť nie je taká dobrá ako v prípade známych písem.

Niektoré pokročilejšie softvéry využívajú kontext okolitých písmen, aby pomohli identifikovať písmená, ktoré nie sú také jasné. Ak je napríklad vytlačené slovo „pes“ a algoritmus OCR nedokáže s istotou zistiť, či je „o“ „a“ alebo „o“, môže použiť slovník, aby zistil, či nejaká kombinácia potenciálnych znakov dáva vedieť slovo. V tomto prípade by algoritmus OCR vylúčil možnosť „a“, pretože „dag“ nie je slovo, zatiaľ čo „pes“ áno.

Kde sa používa OCR?

Jedno z hlavných použití OCR je v poštovom systéme. OCR sa používa na automatickú identifikáciu adresy listov a balíkov, čo je úloha, ktorú zvládne podstatne rýchlejšie ako ľudia. V prípadoch, keď systém OCR nedokáže prečítať adresu štítku, štítok bude oddelený, aby ho mohol človek spracovať manuálne.

OCR je užitočný ako nástroj dostupnosti pre ľudí so zrakovým postihnutím v kombinácii s nástrojom na prevod textu na reč. Google Translate tiež implementuje OCR ako súčasť procesu prekladu textu v obrázkoch.