מהו זיהוי תווים אופטי?

אמנם קל לקחת מסמך במחשב ולקבל עותק פיזי עם מדפסת, אבל בדרך כלל קשה יותר ללכת בדרך אחרת. בעוד שסורקים קיימים ויכולים לשמור מסמכים סרוקים כתמונה, זה לא מועיל במיוחד אם אתה רוצה לערוך את המסמך. כדי להיות מסוגל לערוך מסמך אתה רוצה להשתמש בטכנולוגיה הנקראת זיהוי תווים אופטי או OCR.

כיצד פועל זיהוי תווים אופטי?

OCR משתמש במגוון טכניקות לקריאת מסמכים במדויק. תוכנת OCR מתאימה את המסמך, ואולי אף מילים בודדות כך שייושרו בצורה נכונה. התמונה מומרת לפורמט שחור ולבן טהור מכיוון שזה קל יותר מאשר להבדיל בין גוונים של אפור. ניתוח מבוצע גם כדי לזהות ולהסיר פריטים שאינם טקסט.

נעשה שימוש בשני סוגים עיקריים של אלגוריתמי OCR, התאמת מטריצות וחילוץ תכונות. התאמת מטריקס לוקחת תמונה של תו בודד ואז משווה אותה לגופנים המוגדרים באלגוריתמים לפי פיקסל לפי פיקסל. טכניקה זו מחייבת את הדמות להיות מבודדת בצורה נכונה מכל תוכן אחר ושהגופן ייכלל בתוכנת OCR. סוג זה של OCR גם לא עובד לזיהוי כתב יד.

אלגוריתמים לחילוץ תכונות מפרקים כל תו לתכונות, כגון קווים, עקומות וצמתים קווים. טכניקה זו מפחיתה משמעותית את ההסתמכות על האלגוריתם שאומן עם גופנים ידועים. חילוץ תכונות מסוגל לזהות גופנים חדשים ולתמלל אותם, כמו גם כתב יד כלשהו, למרות שהדיוק אינו טוב כמו של גופנים ידועים.

כמה תוכנות מתקדמות יותר משתמשות בהקשר של האותיות שמסביב כדי לעזור לזהות אותיות שאינן ברורות כל כך. לדוגמה, אם המילה "כלב" מודפסת ואלגוריתם ה-OCR לא יכול לדעת בוודאות אם ה-"o" הוא "a" או "o", זה יכול להשתמש במילון כדי לראות אם שילוב כלשהו של תווים פוטנציאליים מוכיח מִלָה. במקרה זה, אלגוריתם ה-OCR יבטל את האפשרות של "a", מכיוון ש"dag" אינה מילה, בעוד ש"כלב" כן.

היכן נעשה שימוש ב-OCR?

אחד השימושים העיקריים של OCR הוא במערכת הדואר. OCR משמש לזיהוי אוטומטי של כתובת של מכתבים וחבילות, משימה שהוא יכול לבצע מהר יותר ממה שאנשים יכולים לעשות. במקרים בהם מערכת ה-OCR אינה מסוגלת לקרוא את הכתובת של התווית, היא תופרד לאדם לעיבוד ידני במקום זאת.

OCR שימושי ככלי נגישות לאנשים עם לקות ראייה בשילוב עם כלי טקסט לדיבור. גוגל טרנסלייט מיישם גם OCR כחלק מתהליך תרגום הטקסט בתמונות.