Kas ir optiskā rakstzīmju atpazīšana?

Lai gan ir viegli paņemt dokumentu datorā un iegūt fizisku kopiju ar printeri, parasti ir grūtāk izvēlēties citu ceļu. Lai gan pastāv skeneri un tie var saglabāt skenētos dokumentus kā attēlu, tas nav īpaši noderīgi, ja vēlaties rediģēt dokumentu. Lai varētu rediģēt dokumentu, izmantojiet tehnoloģiju, ko sauc par optisko rakstzīmju atpazīšanu vai OCR.

Kā darbojas rakstzīmju optiskā atpazīšana?

OCR izmanto dažādas metodes, lai precīzi nolasītu dokumentus. OCR programmatūra pielāgo dokumentu un, iespējams, pat atsevišķus vārdus, lai tie būtu pareizi līdzināti. Attēls tiek pārveidots tīri melnbaltā formātā, jo tas ir vieglāk, nekā atšķirt pelēkos toņus. Analīze tiek veikta arī, lai identificētu un noņemtu visus neteksta vienumus.

Tiek izmantoti divi galvenie OCR algoritmu veidi: matricas saskaņošana un funkciju iegūšana. Matricas atbilstības noteikšana ņem vienas rakstzīmes attēlu, pēc tam salīdzina to ar algoritmu konfigurētajiem fontiem pa pikseļiem pa pikseļiem. Šis paņēmiens prasa, lai rakstzīme būtu pareizi izolēta no visa pārējā satura un fonts ir jāiekļauj OCR programmatūrā. Šis OCR veids nedarbojas arī rokraksta atpazīšanai.

Iezīmju iegūšanas algoritmi katru rakstzīmi sadala pa elementiem, piemēram, līnijām, līknēm un līniju krustojumiem. Šis paņēmiens ievērojami samazina paļaušanos uz algoritmu, kas tiek apmācīts ar zināmiem fontiem. Funkciju izvilkšana spēj atpazīt un pārrakstīt jaunus fontus, kā arī dažus rokrakstus, lai gan precizitāte nav tik laba kā zināmiem fontiem.

Dažas uzlabotas programmatūras izmanto apkārtējo burtu kontekstu, lai palīdzētu identificēt burtus, kas nav tik skaidri. Piemēram, ja tiek izdrukāts vārds “suns” un OCR algoritms nevar droši noteikt, vai “o” ir “a” vai “o”, tā var izmantot vārdnīcu, lai noskaidrotu, vai kāda potenciālo rakstzīmju kombinācija padara zināmu vārdu. Šajā gadījumā OCR algoritms izslēgtu “a” iespēju, jo “dag” nav vārds, bet “suns” ir.

Kur tiek izmantota OCR?

Viens no galvenajiem OCR lietojumiem ir pasta sistēmā. OCR tiek izmantots, lai automātiski identificētu vēstuļu un paku adreses, un to var paveikt ievērojami ātrāk nekā cilvēki. Gadījumos, kad OCR sistēma nevar nolasīt etiķetes adresi, tā tiks atdalīta, lai cilvēks varētu apstrādāt manuāli.

OCR ir noderīgs kā pieejamības rīks cilvēkiem ar redzes traucējumiem, ja to apvieno ar teksta pārvēršanas runā rīku. Google tulkotājs arī ievieš OCR kā daļu no attēla teksta tulkošanas procesa.