Što je optičko prepoznavanje znakova?

Iako je lako uzeti dokument na računalo i dobiti fizičku kopiju pomoću pisača, općenito je teže ići drugim putem. Iako skeneri postoje i mogu spremati skenirane dokumente kao sliku, to nije osobito korisno ako želite urediti dokument. Da biste mogli uređivati dokument, želite koristiti tehnologiju koja se zove Optičko prepoznavanje znakova ili OCR.

Kako funkcionira optičko prepoznavanje znakova?

OCR koristi niz tehnika za točno čitanje dokumenata. OCR softver prilagođava dokument, a potencijalno čak i pojedinačne riječi tako da budu ispravno poravnate. Slika se pretvara u čisto crno-bijeli format jer je to lakše nego razlikovati nijanse sive. Analiza se također provodi kako bi se identificirale i uklonile sve stavke koje nisu tekstualne.

Koriste se dvije glavne vrste OCR algoritama, podudaranje matrice i ekstrakcija obilježja. Matrično podudaranje uzima sliku jednog znaka, a zatim je uspoređuje s algoritmima konfiguriranim fontovima na bazi piksel po piksel. Ova tehnika zahtijeva da znak bude ispravno izoliran od svih ostalih sadržaja i da font bude uključen u OCR softver. Ova vrsta OCR-a također ne radi za prepoznavanje rukopisa.

Algoritmi za izdvajanje značajki rastavljaju svaki znak na značajke, kao što su linije, krivulje i križanja linija. Ova tehnika značajno smanjuje oslanjanje na algoritam koji se trenira s poznatim fontovima. Ekstrakcija značajki sposobna je prepoznati nove fontove i prepisati ih, kao i neke rukopise, iako točnost nije tako dobra kao kod poznatih fontova.

Neki napredniji softveri koriste kontekst okolnih slova kako bi lakše identificirali slova koja nisu tako jasna. Na primjer, ako je ispisana riječ "pas" i OCR algoritam ne može sa sigurnošću reći je li "o" “a” ili “o”, može koristiti rječnik da vidi da li bilo koja kombinacija potencijalnih znakova daje do znanja riječ. U ovom slučaju, OCR algoritam bi odbacio mogućnost "a", jer "dag" nije riječ, dok "pas" jest.

Gdje se koristi OCR?

Jedna od glavnih upotreba OCR-a je u poštanskom sustavu. OCR se koristi za automatsku identifikaciju adrese pisama i paketa, što je zadatak koji može obaviti znatno brže nego što bi to ljudi mogli. U slučajevima kada OCR sustav ne može pročitati adresu naljepnice, bit će odvojena da bi je čovjek mogao ručno obraditi.

OCR je koristan kao alat za pristupačnost osobama s oštećenjem vida u kombinaciji s alatom za pretvaranje teksta u govor. Google translate također implementira OCR kao dio procesa prevođenja teksta u slikama.