O que é reconhecimento óptico de caracteres?

Embora seja fácil pegar um documento em seu computador e obter uma cópia física com uma impressora, geralmente é mais difícil fazer o contrário. Embora existam scanners e possam salvar documentos digitalizados como imagens, isso não é particularmente útil se você quiser editar o documento. Para poder editar um documento, você deseja usar uma tecnologia chamada Reconhecimento Óptico de Caracteres ou OCR.

Como funciona o reconhecimento óptico de caracteres?

OCR usa uma variedade de técnicas para ler documentos com precisão. O software OCR ajusta o documento e, potencialmente, até mesmo palavras individuais para que sejam alinhadas corretamente. A imagem é convertida em um formato de preto e branco puro, pois é mais fácil do que diferenciar tons de cinza. A análise também é realizada para identificar e remover quaisquer itens não textuais.

Dois tipos principais de algoritmos de OCR são usados, correspondência de matriz e extração de recursos. A correspondência de matriz obtém uma imagem de um único caractere e a compara com as fontes configuradas dos algoritmos pixel por pixel. Essa técnica requer que o caractere seja isolado corretamente de todos os outros conteúdos e que a fonte seja incluída no software OCR. Este tipo de OCR também não funciona para reconhecimento de escrita à mão.

Os algoritmos de extração de recursos dividem cada caractere em recursos, como linhas, curvas e intersecções de linha. Essa técnica reduz significativamente a dependência do algoritmo sendo treinado com fontes conhecidas. A extração de recursos é capaz de reconhecer novas fontes e transcrevê-las, bem como alguma escrita à mão, embora a precisão não seja tão boa quanto para fontes conhecidas.

Alguns softwares mais avançados usam o contexto das letras ao redor para ajudar a identificar as letras que não são tão claras. Por exemplo, se a palavra "cachorro" for impressa e o algoritmo OCR não puder dizer com certeza se o "o" é um “A” ou um “o”, ele pode usar um dicionário para ver se alguma combinação de caracteres potenciais torna um conhecido palavra. Nesse caso, o algoritmo de OCR descartaria a possibilidade do "a", já que "dag" não é uma palavra, enquanto "cachorro" é.

Onde o OCR é usado?

Um dos principais usos do OCR é no sistema postal. OCR é usado para identificar automaticamente o endereço de cartas e encomendas, uma tarefa que pode fazer muito mais rápido do que as pessoas. Nos casos em que o sistema OCR não consegue ler o endereço da etiqueta, ele será separado para ser processado manualmente por uma pessoa.

O OCR é útil como uma ferramenta de acessibilidade para pessoas com deficiência visual quando combinado com uma ferramenta de conversão de texto em voz. O Google translate também implementa OCR como parte do processo de tradução do texto em imagens.