컴퓨터에서 문서를 가져 와서 프린터로 실제 사본을 얻는 것은 쉽지만 일반적으로 다른 방향으로 가기가 더 어렵습니다. 스캐너가 존재하고 스캔한 문서를 이미지로 저장할 수 있지만 문서를 편집하려는 경우에는 특히 유용하지 않습니다. 광학 문자 인식 또는 OCR이라는 기술을 사용하려는 문서를 편집할 수 있습니다.
광학 문자 인식은 어떻게 작동합니까?
OCR은 문서를 정확하게 읽기 위해 다양한 기술을 사용합니다. OCR 소프트웨어는 문서와 잠재적으로 개별 단어를 조정하여 올바르게 정렬되도록 합니다. 이미지는 회색 음영을 구별하는 것보다 쉽기 때문에 순수한 흑백 형식으로 변환됩니다. 텍스트가 아닌 항목을 식별하고 제거하기 위한 분석도 수행됩니다.
OCR 알고리즘의 두 가지 주요 유형인 행렬 일치 및 특징 추출이 사용됩니다. 매트릭스 일치는 단일 문자의 이미지를 가져온 다음 픽셀 단위로 알고리즘 구성된 글꼴과 비교합니다. 이 기술을 사용하려면 문자가 다른 모든 콘텐츠와 올바르게 분리되어야 하며 글꼴이 OCR 소프트웨어에 포함되어야 합니다. 이 유형의 OCR은 필기 인식에도 작동하지 않습니다.
특징 추출 알고리즘은 각 문자를 선, 곡선 및 선 교차점과 같은 특징으로 나눕니다. 이 기술은 알려진 글꼴로 훈련되는 알고리즘에 대한 의존도를 크게 줄입니다. 기능 추출은 새 글꼴을 인식하고 일부 필기뿐만 아니라 새 글꼴을 인식할 수 있지만 정확도는 알려진 글꼴만큼 좋지는 않습니다.
일부 고급 소프트웨어는 주변 문자의 컨텍스트를 사용하여 명확하지 않은 문자를 식별하는 데 도움을 줍니다. 예를 들어 "dog"라는 단어가 인쇄되고 OCR 알고리즘이 "o"가 "a" 또는 "o", 사전을 사용하여 잠재적인 문자의 조합이 단어. 이 경우 OCR 알고리즘은 "dag"가 단어가 아니라 "dog"가 단어이므로 "a"의 가능성을 무시합니다.
OCR은 어디에 사용됩니까?
OCR의 주요 용도 중 하나는 우편 시스템입니다. OCR은 편지와 소포의 주소를 자동으로 식별하는 데 사용되며, 사람보다 훨씬 빠르게 처리할 수 있습니다. OCR 시스템이 레이블의 주소를 읽을 수 없는 경우 사람이 대신 수동으로 처리할 수 있도록 레이블을 분리합니다.
OCR은 TTS(텍스트 음성 변환) 도구와 결합될 때 시각 장애가 있는 사람들을 위한 접근성 도구로 유용합니다. Google 번역은 또한 이미지의 텍스트를 번역하는 과정의 일부로 OCR을 구현합니다.