¿Qué es el reconocimiento óptico de caracteres?

Si bien es fácil tomar un documento en su computadora y obtener una copia física con una impresora, generalmente es más difícil hacerlo al revés. Si bien existen escáneres y pueden guardar documentos escaneados como una imagen, esto no es particularmente útil si desea editar el documento. Para poder editar un documento, desea utilizar una tecnología llamada Reconocimiento óptico de caracteres u OCR.

¿Cómo funciona el reconocimiento óptico de caracteres?

OCR utiliza una variedad de técnicas para leer documentos con precisión. El software OCR ajusta el documento y, potencialmente, incluso las palabras individuales para que estén alineadas correctamente. La imagen se convierte a un formato en blanco y negro puro, ya que es más fácil que diferenciar los tonos de gris. También se realiza un análisis para identificar y eliminar cualquier elemento que no sea de texto.

Se utilizan dos tipos principales de algoritmos de OCR, el emparejamiento de matrices y la extracción de características. La coincidencia de matrices toma una imagen de un solo carácter y luego la compara con las fuentes configuradas por los algoritmos píxel por píxel. Esta técnica requiere que el carácter esté correctamente aislado del resto del contenido y que la fuente se incluya en el software OCR. Este tipo de OCR tampoco funciona para reconocer la escritura a mano.

Los algoritmos de extracción de características dividen cada carácter en características, como líneas, curvas e intersecciones de líneas. Esta técnica reduce significativamente la dependencia del algoritmo que se entrena con fuentes conocidas. La extracción de características es capaz de reconocer nuevas fuentes y transcribirlas, así como algunas escrituras a mano, aunque la precisión no es tan buena como para las fuentes conocidas.

Algunos programas de software más avanzados utilizan el contexto de las letras circundantes para ayudar a identificar las letras que no son tan claras. Por ejemplo, si la palabra "perro" está impresa y el algoritmo de OCR no puede decir con certeza si la "o" es una "A" o "o", puede usar un diccionario para ver si alguna combinación de caracteres potenciales hace que se conozca palabra. En este caso, el algoritmo OCR descartaría la posibilidad de la "a", ya que "dag" no es una palabra, mientras que "perro" sí lo es.

¿Dónde se utiliza OCR?

Uno de los principales usos del OCR es el sistema postal. El OCR se utiliza para identificar automáticamente la dirección de cartas y paquetes, una tarea que puede hacer mucho más rápido que las personas. En los casos en que el sistema OCR no pueda leer la dirección de la etiqueta, se separará para que un humano la procese manualmente.

OCR es útil como herramienta de accesibilidad para personas con discapacidad visual cuando se combina con una herramienta de conversión de texto a voz. Google translate también implementa OCR como parte del proceso de traducción del texto en imágenes.