Kas yra optinis simbolių atpažinimas?

click fraud protection

Nors paprasta paimti dokumentą kompiuteryje ir gauti fizinę kopiją naudojant spausdintuvą, paprastai sunkiau eiti kitu keliu. Nors skeneriai egzistuoja ir gali išsaugoti nuskaitytus dokumentus kaip vaizdą, tai nėra ypač naudinga, jei norite redaguoti dokumentą. Kad galėtumėte redaguoti dokumentą, naudokite technologiją, vadinamą optiniu simbolių atpažinimu arba OCR.

Kaip veikia optinis simbolių atpažinimas?

OCR naudoja įvairius metodus, kad tiksliai nuskaitytų dokumentus. OCR programinė įranga pakoreguoja dokumentą ir galbūt net atskirus žodžius, kad jie būtų tinkamai sulygiuoti. Vaizdas konvertuojamas į grynai nespalvotą formatą, nes tai lengviau nei atskirti pilkus atspalvius. Analizė taip pat atliekama siekiant nustatyti ir pašalinti visus netekstinius elementus.

Naudojami du pagrindiniai OCR algoritmų tipai: matricos suderinimas ir funkcijų ištraukimas. Matricos atitikimas paima vieno simbolio vaizdą, tada palygina jį su algoritmų sukonfigūruotais šriftais pagal pikselį po pikselio. Ši technika reikalauja, kad simbolis būtų tinkamai atskirtas nuo viso kito turinio ir kad šriftas būtų įtrauktas į OCR programinę įrangą. Šio tipo OCR taip pat neveikia atpažįstant rašyseną.

Funkcijų ištraukimo algoritmai suskirsto kiekvieną simbolį į ypatybes, tokias kaip linijos, kreivės ir linijų sankirtos. Ši technika žymiai sumažina priklausomybę nuo algoritmo, kuris mokomas naudojant žinomus šriftus. Funkcijų ištraukimas gali atpažinti naujus šriftus ir juos perrašyti, taip pat kai kuriuos rašysenos duomenis, nors tikslumas nėra toks geras kaip žinomų šriftų.

Kai kuri pažangesnė programinė įranga naudoja aplinkinių raidžių kontekstą, kad padėtų atpažinti raides, kurios nėra tokios aiškios. Pavyzdžiui, jei išspausdintas žodis „šuo“ ir OCR algoritmas negali tiksliai pasakyti, ar „o“ yra „a“ arba „o“, jis gali naudoti žodyną, kad pamatytų, ar koks nors galimų simbolių derinys suteikia žinomumo žodį. Tokiu atveju OCR algoritmas panaikintų „a“ galimybę, nes „dag“ nėra žodis, o „šuo“ yra.

Kur naudojamas OCR?

Vienas iš pagrindinių OCR naudojimo būdų yra pašto sistemoje. OCR naudojamas automatiškai identifikuoti laiškų ir siuntinių adresus, o tai gali atlikti daug greičiau nei žmonės. Tais atvejais, kai OCR sistema negali nuskaityti etiketės adreso, ji bus atskirta, kad žmogus galėtų apdoroti rankiniu būdu.

OCR yra naudingas kaip pritaikymo neįgaliesiems įrankis žmonėms su regėjimo negalia, kai jis derinamas su teksto į kalbą įrankiu. „Google“ vertėjas taip pat įgyvendina OCR kaip teksto vaizdų vertimo proceso dalį.