Qu'est-ce que la reconnaissance optique de caractères ?

S'il est facile de prendre un document sur votre ordinateur et d'en obtenir une copie physique avec une imprimante, il est généralement plus difficile d'aller dans l'autre sens. Bien que les scanners existent et puissent enregistrer les documents numérisés sous forme d'image, cela n'est pas particulièrement utile si vous souhaitez modifier le document. Pour pouvoir éditer un document, vous souhaitez utiliser une technologie appelée reconnaissance optique de caractères ou OCR.

Comment fonctionne la reconnaissance optique de caractères ?

L'OCR utilise une gamme de techniques pour lire avec précision les documents. Le logiciel OCR ajuste le document, et potentiellement même les mots individuels afin qu'ils soient correctement alignés. L'image est convertie en un format noir et blanc pur car c'est plus facile que de différencier les nuances de gris. Une analyse est également effectuée pour identifier et supprimer tous les éléments non textuels.

Deux principaux types d'algorithmes OCR sont utilisés, l'appariement matriciel et l'extraction de caractéristiques. La correspondance matricielle prend une image d'un seul caractère puis la compare aux polices configurées par les algorithmes pixel par pixel. Cette technique nécessite que le caractère soit correctement isolé de tout autre contenu et que la police soit incluse dans le logiciel OCR. Ce type d'OCR ne fonctionne pas non plus pour reconnaître l'écriture manuscrite.

Les algorithmes d'extraction de caractéristiques décomposent chaque caractère en caractéristiques, telles que des lignes, des courbes et des intersections de lignes. Cette technique réduit considérablement la dépendance à l'égard de l'algorithme entraîné avec des polices connues. L'extraction de caractéristiques est capable de reconnaître de nouvelles polices et de les transcrire, ainsi que certaines écritures manuscrites, bien que la précision ne soit pas aussi bonne que pour les polices connues.

Certains logiciels plus avancés utilisent le contexte des lettres environnantes pour aider à identifier les lettres qui ne sont pas aussi claires. Par exemple, si le mot « chien » est imprimé et que l'algorithme OCR ne peut pas dire avec certitude si le « o » est un "a" ou un "o", il peut utiliser un dictionnaire pour voir si une combinaison de caractères potentiels fait un mot. Dans ce cas, l'algorithme OCR écarterait la possibilité du « a », car « dag » n'est pas un mot, alors que « chien » l'est.

Où l'OCR est-elle utilisée ?

L'une des principales utilisations de l'OCR est dans le système postal. L'OCR est utilisé pour identifier automatiquement l'adresse des lettres et des colis, une tâche qu'il peut effectuer beaucoup plus rapidement que les gens ne pourraient le faire. Dans les cas où le système OCR est incapable de lire l'adresse de l'étiquette, elle sera séparée pour qu'un humain puisse la traiter manuellement à la place.

L'OCR est utile en tant qu'outil d'accessibilité pour les personnes malvoyantes lorsqu'il est associé à un outil de synthèse vocale. Google translate implémente également l'OCR dans le cadre du processus de traduction du texte en images.