Какво е оптично разпознаване на символи?

Въпреки че е лесно да вземете документ на компютъра си и да получите физическо копие с принтер, обикновено е по-трудно да отидете по другия път. Въпреки че съществуват скенери и могат да запазват сканирани документи като изображение, това не е особено полезно, ако искате да редактирате документа. За да можете да редактирате документ, искате да използвате технология, наречена оптично разпознаване на символи или OCR.

Как работи оптичното разпознаване на знаци?

OCR използва редица техники за точно четене на документи. Софтуерът за OCR коригира документа и евентуално дори отделните думи, така че да са подравнени правилно. Изображението се преобразува в чисто черно-бял формат, тъй като това е по-лесно от разграничаването между нюансите на сивото. Анализът също се извършва за идентифициране и премахване на всякакви нетекстови елементи.

Използват се два основни типа OCR алгоритми, съпоставяне на матрица и извличане на характеристики. Матричното съвпадение взема изображение от един знак, след което го сравнява с конфигурираните по алгоритми шрифтове на база пиксел по пиксел. Тази техника изисква символът да бъде правилно изолиран от цялото друго съдържание и шрифтът да бъде включен в софтуера за OCR. Този тип OCR също не работи за разпознаване на почерк.

Алгоритмите за извличане на характеристики разбиват всеки знак на характеристики, като линии, криви и пресечни точки. Тази техника значително намалява зависимостта от алгоритъма, който се обучава с известни шрифтове. Извличането на функции е в състояние да разпознава нови шрифтове и да ги транскрибира, както и някои ръкописни текстове, въпреки че точността не е толкова добра, колкото при познатите шрифтове.

Някои по-усъвършенствани софтуери използват контекста на околните букви, за да помогнат за идентифицирането на букви, които не са толкова ясни. Например, ако думата „куче“ е отпечатана и OCR алгоритъмът не може да каже със сигурност дали „o“ е „a“ или „o“, той може да използва речник, за да види дали някаква комбинация от потенциални знаци прави известна дума. В този случай алгоритъмът за OCR би отхвърлил възможността за „а“, тъй като „dag“ не е дума, докато „куче“ е.

Къде се използва OCR?

Едно от основните приложения на OCR е в пощенската система. OCR се използва за автоматично идентифициране на адреса на писма и колети, задача, която може да направи значително по-бързо от хората. В случаите, когато OCR системата не е в състояние да прочете адреса на етикета, той ще бъде отделен, за да може човек да обработи ръчно вместо това.

OCR е полезен като инструмент за достъпност за хора със зрителни увреждания, когато се комбинира с инструмент за преобразуване на текст в говор. Google translate също така прилага OCR като част от процеса на превод на текста в изображения.