Apa itu Pengenalan Karakter Optik?

click fraud protection

Meskipun mudah untuk mengambil dokumen di komputer Anda dan mendapatkan salinan fisik dengan printer, umumnya lebih sulit untuk pergi ke arah lain. Meskipun pemindai ada dan dapat menyimpan dokumen yang dipindai sebagai gambar, ini tidak terlalu membantu jika Anda ingin mengedit dokumen. Untuk dapat mengedit dokumen yang ingin Anda gunakan teknologi yang disebut Optical Character Recognition atau OCR.

Bagaimana cara kerja pengenalan karakter optik?

OCR menggunakan berbagai teknik untuk membaca dokumen secara akurat. Perangkat lunak OCR menyesuaikan dokumen, dan bahkan mungkin kata-kata individual sehingga mereka disejajarkan dengan benar. Gambar diubah menjadi format hitam putih murni karena lebih mudah daripada membedakan antara nuansa abu-abu. Analisis juga dilakukan untuk mengidentifikasi dan menghapus item non-teks.

Dua jenis utama dari algoritma OCR digunakan, pencocokan matriks dan ekstraksi fitur. Pencocokan matriks mengambil gambar satu karakter kemudian membandingkannya dengan algoritma yang dikonfigurasikan font pada piksel demi piksel. Teknik ini mengharuskan karakter diisolasi dengan benar dari semua konten lain dan agar font disertakan dalam perangkat lunak OCR. Jenis OCR ini juga tidak berfungsi untuk mengenali tulisan tangan.

Algoritma ekstraksi fitur memecah setiap karakter menjadi fitur, seperti garis, kurva, dan perpotongan garis. Teknik ini secara signifikan mengurangi ketergantungan pada algoritma yang dilatih dengan font yang dikenal. Ekstraksi fitur mampu mengenali font baru dan menyalinnya, serta beberapa tulisan tangan, meskipun akurasinya tidak sebaik font yang dikenal.

Beberapa perangkat lunak yang lebih canggih menggunakan konteks huruf-huruf di sekitarnya untuk membantu mengidentifikasi huruf-huruf yang tidak begitu jelas. Misalnya, jika kata "anjing" dicetak dan algoritme OCR tidak dapat memastikan dengan pasti apakah "o" adalah "a" atau "o", itu dapat menggunakan kamus untuk melihat apakah ada kombinasi karakter potensial yang diketahui kata. Dalam hal ini, algoritme OCR akan mengabaikan kemungkinan "a", karena "dag" bukanlah kata, sedangkan "dog" adalah kata.

Di mana OCR digunakan?

Salah satu kegunaan utama OCR adalah dalam sistem pos. OCR digunakan untuk secara otomatis mengidentifikasi alamat surat dan parsel, tugas yang dapat dilakukan secara signifikan lebih cepat daripada yang bisa dilakukan orang. Dalam kasus di mana sistem OCR tidak dapat membaca alamat label, itu akan dipisahkan untuk diproses secara manual oleh manusia.

OCR berguna sebagai alat aksesibilitas bagi orang-orang dengan gangguan penglihatan bila dikombinasikan dengan alat text-to-speech. Google translate juga menerapkan OCR sebagai bagian dari proses menerjemahkan teks dalam gambar.