Optik Karakter Tanıma Nedir?

click fraud protection

Bilgisayarınızda bir belge almak ve bir yazıcıyla fiziksel bir kopyasını almak kolay olsa da, diğer yoldan gitmek genellikle daha zordur. Tarayıcılar mevcut olsa ve taranan belgeleri görüntü olarak kaydedebilse de, belgeyi düzenlemek istiyorsanız bu özellikle yararlı değildir. Bir belgeyi düzenleyebilmek için Optik Karakter Tanıma veya OCR adı verilen bir teknolojiyi kullanmak istiyorsunuz.

Optik karakter tanıma nasıl çalışır?

OCR, belgeleri doğru bir şekilde okumak için bir dizi teknik kullanır. OCR yazılımı, belgeyi ve hatta tek tek sözcükleri doğru şekilde hizalanacak şekilde ayarlar. Görüntü, gri tonları arasında ayrım yapmaktan daha kolay olduğu için saf siyah beyaz bir biçime dönüştürülür. Metin olmayan öğeleri belirlemek ve kaldırmak için de analiz yapılır.

İki ana tip OCR algoritması kullanılır, matris eşleştirme ve özellik çıkarma. Matris eşleştirme, tek bir karakterin görüntüsünü alır ve ardından bunu, piksel bazında algoritmalar tarafından yapılandırılmış yazı tipleriyle karşılaştırır. Bu teknik, karakterin diğer tüm içerikten doğru şekilde izole edilmesini ve yazı tipinin OCR yazılımına dahil edilmesini gerektirir. Bu tür OCR, el yazısını tanımak için de çalışmaz.

Özellik çıkarma algoritmaları, her karakteri çizgiler, eğriler ve çizgi kesişimleri gibi özelliklere ayırır. Bu teknik, bilinen yazı tipleriyle eğitilen algoritmaya olan bağımlılığı önemli ölçüde azaltır. Özellik çıkarma, doğruluk bilinen yazı tipleri kadar iyi olmasa da, bazı el yazılarının yanı sıra yeni yazı tiplerini tanıyabilir ve bunları kopyalayabilir.

Bazı daha gelişmiş yazılımlar, net olmayan harfleri tanımlamaya yardımcı olmak için çevreleyen harflerin bağlamını kullanır. Örneğin, "köpek" kelimesi yazdırılırsa ve OCR algoritması "o"nun bir harf olup olmadığını kesin olarak söyleyemez. “a” veya “o”, potansiyel karakterlerin herhangi bir kombinasyonunun bilinen bir şey yapıp yapmadığını görmek için bir sözlük kullanabilir. kelime. Bu durumda, OCR algoritması "a" olasılığını azaltır, çünkü "dag" bir kelime değildir, "köpek" ise.

OCR nerelerde kullanılır?

OCR'nin ana kullanımlarından biri posta sistemindedir. OCR, mektupların ve paketlerin adresini otomatik olarak belirlemek için kullanılır; bu, insanlardan çok daha hızlı bir şekilde yapabileceği bir görevdir. OCR sisteminin etiketin adresini okuyamadığı durumlarda, bunun yerine bir insanın manuel olarak işlemesi için ayrılacaktır.

OCR, bir metinden konuşmaya aracıyla birleştirildiğinde, görme bozukluğu olan kişiler için bir erişilebilirlik aracı olarak kullanışlıdır. Google çeviri, resimlerdeki metni çevirme işleminin bir parçası olarak OCR'yi de uygular.