Ce este recunoașterea optică a caracterelor?

Deși este ușor să luați un document pe computer și să obțineți o copie fizică cu o imprimantă, este, în general, mai greu să mergeți invers. Deși există scanere și pot salva documentele scanate ca imagine, acest lucru nu este deosebit de util dacă doriți să editați documentul. Pentru a putea edita un document, doriți să utilizați o tehnologie numită Recunoaștere optică a caracterelor sau OCR.

Cum funcționează recunoașterea optică a caracterelor?

OCR folosește o gamă largă de tehnici pentru a citi documentele cu acuratețe. Software-ul OCR ajustează documentul și eventual chiar cuvintele individuale, astfel încât acestea să fie aliniate corect. Imaginea este convertită într-un format alb-negru pur, deoarece este mai ușor decât diferențierea între nuanțele de gri. Analiza este, de asemenea, efectuată pentru a identifica și elimina orice elemente non-text.

Sunt utilizate două tipuri principale de algoritmi OCR, potrivirea matricei și extragerea caracteristicilor. Potrivirea matricei ia o imagine a unui singur caracter, apoi o compară cu fonturile configurate de algoritmi, pixel cu pixel. Această tehnică necesită ca caracterul să fie izolat corect de orice alt conținut și ca fontul să fie inclus în software-ul OCR. Acest tip de OCR nu funcționează nici pentru recunoașterea scrisului de mână.

Algoritmii de extragere a caracteristicilor descompun fiecare caracter în caracteristici, cum ar fi linii, curbe și intersecții de linii. Această tehnică reduce semnificativ dependența de algoritmul antrenat cu fonturi cunoscute. Extragerea caracteristicilor este capabilă să recunoască noi fonturi și să le transcrie, precum și o anumită scriere de mână, deși acuratețea nu este la fel de bună ca pentru fonturile cunoscute.

Unele programe mai avansate folosesc contextul literelor din jur pentru a ajuta la identificarea literelor care nu sunt la fel de clare. De exemplu, dacă cuvântul „câine” este tipărit și algoritmul OCR nu poate spune cu siguranță dacă „o” este un „a” sau „o”, poate folosi un dicționar pentru a vedea dacă vreo combinație de caractere potențiale face cunoscută cuvânt. În acest caz, algoritmul OCR ar ignora posibilitatea „a”, deoarece „dag” nu este un cuvânt, în timp ce „câine” este.

Unde se utilizează OCR?

Una dintre principalele utilizări ale OCR este în sistemul poștal. OCR este folosit pentru a identifica automat adresa scrisorilor și pachetelor, o sarcină pe care o poate face mult mai rapid decât ar putea oamenii. În cazurile în care sistemul OCR nu poate citi adresa etichetei, aceasta va fi separată pentru ca un om să o proceseze manual.

OCR este util ca instrument de accesibilitate pentru persoanele cu deficiențe de vedere atunci când este combinat cu un instrument de transformare a textului în vorbire. Google Translate implementează și OCR ca parte a procesului de traducere a textului în imagini.