Kaj je optično prepoznavanje znakov?

Čeprav je enostavno vzeti dokument v računalnik in dobiti fizično kopijo s tiskalnikom, je na splošno težje iti v drugo smer. Čeprav optični bralniki obstajajo in lahko skenirane dokumente shranijo kot sliko, to ni posebej koristno, če želite dokument urediti. Za urejanje dokumenta želite uporabiti tehnologijo, imenovano optično prepoznavanje znakov ali OCR.

Kako deluje optično prepoznavanje znakov?

OCR uporablja vrsto tehnik za natančno branje dokumentov. Programska oprema OCR prilagodi dokument in morda celo posamezne besede, tako da so pravilno poravnane. Slika se pretvori v čisto črno-belo obliko, saj je to lažje kot razlikovati med odtenki sive. Analiza se izvaja tudi za identifikacijo in odstranitev vseh nebesedilnih elementov.

Uporabljata se dve glavni vrsti algoritmov OCR, ujemanje matrik in ekstrakcija lastnosti. Matrično ujemanje zavzame sliko enega samega znaka, nato pa jo primerja z algoritmi, konfiguriranimi pisavami na podlagi slikovnih pik. Ta tehnika zahteva, da je znak pravilno izoliran od vse druge vsebine in da je pisava vključena v programsko opremo OCR. Ta vrsta OCR tudi ne deluje za prepoznavanje rokopisa.

Algoritmi za ekstrakcijo značilnosti razčlenijo vsak znak na značilnosti, kot so črte, krivulje in križišča črt. Ta tehnika znatno zmanjša zanašanje na algoritem, ki se trenira z znanimi pisavami. Ekstrakcija funkcij je sposobna prepoznati nove pisave in jih prepisati, pa tudi nekaj rokopisa, čeprav natančnost ni tako dobra kot pri znanih pisavah.

Nekatera naprednejša programska oprema uporablja kontekst okoliških črk za pomoč pri prepoznavanju črk, ki niso tako jasne. Na primer, če je natisnjena beseda »pes« in algoritem OCR ne more z gotovostjo ugotoviti, ali je »o« "a" ali "o", lahko uporabi slovar, da vidi, ali katera koli kombinacija možnih znakov daje znano beseda. V tem primeru bi algoritem OCR opustil možnost "a", saj "dag" ni beseda, medtem ko "pes" je.

Kje se uporablja OCR?

Ena glavnih uporab OCR je v poštnem sistemu. OCR se uporablja za samodejno prepoznavanje naslova pisem in paketov, kar lahko opravi bistveno hitreje kot ljudje. V primerih, ko sistem OCR ne more prebrati naslova nalepke, bo le-ta ločena, da bi jo človek lahko obdelal ročno.

OCR je uporaben kot orodje za dostopnost za ljudi z okvarami vida v kombinaciji z orodjem za pretvorbo besedila v govor. Google translate izvaja tudi OCR kot del postopka prevajanja besedila v slikah.