Шта је оптичко препознавање знакова?

click fraud protection

Иако је лако узети документ на рачунар и добити физичку копију помоћу штампача, генерално је теже отићи другим путем. Иако скенери постоје и могу да сачувају скениране документе као слику, ово није од посебне помоћи ако желите да уредите документ. Да бисте могли да уређујете документ, желите да користите технологију која се зове Оптичко препознавање знакова или ОЦР.

Како функционише оптичко препознавање знакова?

ОЦР користи низ техника за прецизно читање докумената. ОЦР софтвер прилагођава документ, а потенцијално и појединачне речи тако да буду исправно поравнате. Слика се претвара у чисто црно-бели формат јер је то лакше него разликовати нијансе сиве. Анализа се такође врши да би се идентификовале и уклониле све ставке које нису текстуалне.

Користе се два главна типа ОЦР алгоритама, подударање матрице и екстракција обележја. Упаривање матрице узима слику једног знака, а затим је упоређује са алгоритмима конфигурисаним фонтовима на бази пиксел по пиксел. Ова техника захтева да знак буде исправно изолован од свих осталих садржаја и да фонт буде укључен у софтвер за ОЦР. Ова врста ОЦР-а такође не функционише за препознавање рукописа.

Алгоритми за издвајање обележја разлажу сваки знак на карактеристике, као што су линије, криве и пресеци линија. Ова техника значајно смањује ослањање на алгоритам који се обучава са познатим фонтовима. Екстракција функција може да препозна нове фонтове и да их транскрибује, као и неки рукопис, иако тачност није тако добра као код познатих фонтова.

Неки напреднији софтвери користе контекст околних слова да би помогли у идентификацији слова која нису тако јасна. На пример, ако је реч „пас“ одштампана и ОЦР алгоритам не може са сигурношћу да каже да ли је „о“ „а“ или „о“, може користити речник да види да ли било која комбинација потенцијалних знакова даје до знања реч. У овом случају, ОЦР алгоритам би одбацио могућност „а“, пошто „даг“ није реч, док „пас“ јесте.

Где се користи ОЦР?

Једна од главних употреба ОЦР-а је у поштанском систему. ОЦР се користи за аутоматску идентификацију адреса писама и пакета, задатак који може да уради знатно брже него што би то могли људи. У случајевима када ОЦР систем није у могућности да прочита адресу налепнице, биће одвојена да би је човек могао да обради ручно.

ОЦР је користан као алатка за приступачност за особе са оштећењем вида када се комбинује са алатком за претварање текста у говор. Гоогле транслате такође примењује ОЦР као део процеса превођења текста у сликама.