Що таке оптичне розпізнавання символів?

Хоча легко взяти документ на комп’ютер і отримати фізичну копію за допомогою принтера, зазвичай важче піти іншим шляхом. Хоча сканери існують і можуть зберігати відскановані документи як зображення, це не особливо корисно, якщо ви хочете відредагувати документ. Щоб мати можливість редагувати документ, потрібно використовувати технологію під назвою Optical Character Recognition або OCR.

Як працює оптичне розпізнавання символів?

OCR використовує цілий ряд методів для точного читання документів. Програмне забезпечення OCR коригує документ і, можливо, навіть окремі слова, щоб вони були правильно вирівняні. Зображення перетворюється в чисто чорно-білий формат, оскільки це легше, ніж розрізняти відтінки сірого. Аналіз також виконується для виявлення та видалення будь-яких нетекстових елементів.

Використовуються два основних типи алгоритмів OCR: відповідність матриці та виділення ознак. Матричне відповідність бере зображення одного символу, а потім порівнює його з налаштованими алгоритмами шрифтами на основі пікселя. Ця техніка вимагає, щоб символ був правильно ізольований від усього іншого вмісту та щоб шрифт був включений у програмне забезпечення OCR. Цей тип OCR також не працює для розпізнавання рукописного введення.

Алгоритми виділення ознак розбивають кожен символ на об’єкти, такі як лінії, криві та перетини ліній. Ця техніка значно зменшує залежність від алгоритму, який навчається за допомогою відомих шрифтів. Вилучення функцій здатне розпізнавати нові шрифти та транскрибувати їх, а також деякий почерк, хоча точність не така висока, як для відомих шрифтів.

Деякі більш просунуті програми використовують контекст навколишніх літер, щоб допомогти визначити літери, які не настільки зрозумілі. Наприклад, якщо надруковано слово «собака», а алгоритм OCR не може точно визначити, чи є «о» «a» або «o», він може використовувати словник, щоб побачити, чи відома будь-яка комбінація потенційних символів слово. У цьому випадку алгоритм OCR відкидає можливість «а», оскільки «dag» не є словом, а «собака» є.

Де використовується OCR?

Одне з основних застосувань OCR – це поштова система. OCR використовується для автоматичного визначення адреси листів і посилок, завдання, яке він може виконувати значно швидше, ніж люди. У випадках, коли система OCR не може прочитати адресу мітки, вона буде відокремлена для обробки вручну людиною.

OCR корисний як інструмент доступності для людей з вадами зору в поєднанні з інструментом перетворення тексту в мовлення. Google translate також реалізує OCR як частину процесу перекладу тексту в зображеннях.