في حين أنه من السهل أخذ مستند على جهاز الكمبيوتر الخاص بك والحصول على نسخة ورقية باستخدام الطابعة ، إلا أنه من الصعب بشكل عام الذهاب إلى الاتجاه الآخر. أثناء وجود الماسحات الضوئية ويمكنها حفظ المستندات الممسوحة ضوئيًا كصورة ، لا يكون هذا مفيدًا بشكل خاص إذا كنت تريد تحرير المستند. لتتمكن من تحرير مستند تريد استخدام تقنية تسمى التعرف الضوئي على الأحرف أو OCR.
كيف يعمل التعرف البصري على الحروف؟
يستخدم OCR مجموعة من التقنيات لقراءة المستندات بدقة. يقوم برنامج OCR بضبط المستند ، وربما حتى الكلمات الفردية بحيث يتم محاذاتها بشكل صحيح. يتم تحويل الصورة إلى تنسيق أبيض وأسود خالص لأنه أسهل من التمييز بين ظلال الرمادي. يتم إجراء التحليل أيضًا لتحديد وإزالة أي عناصر غير نصية.
يتم استخدام نوعين رئيسيين من خوارزميات التعرف الضوئي على الحروف ، مطابقة المصفوفة واستخراج الميزات. تأخذ مطابقة المصفوفة صورة من حرف واحد ثم تقارنها بالخوارزميات المكونة للخطوط على أساس كل بكسل ببكسل. تتطلب هذه التقنية عزل الحرف بشكل صحيح عن جميع المحتويات الأخرى ولكي يتم تضمين الخط في برنامج OCR. لا يعمل هذا النوع من التعرف الضوئي على الحروف أيضًا للتعرف على الكتابة اليدوية.
تعمل خوارزميات استخراج الميزات على تقسيم كل حرف إلى ميزات ، مثل الخطوط والمنحنيات وتقاطعات الخطوط. تقلل هذه التقنية بشكل كبير من الاعتماد على الخوارزمية التي يتم تدريبها باستخدام الخطوط المعروفة. يمكن لاستخراج الميزة التعرف على الخطوط الجديدة وكتابتها ، بالإضافة إلى بعض الكتابة اليدوية ، على الرغم من أن الدقة ليست جيدة مثل الخطوط المعروفة.
تستخدم بعض البرامج الأكثر تقدمًا سياق الحروف المحيطة للمساعدة في تحديد الحروف غير الواضحة. على سبيل المثال ، إذا تمت طباعة كلمة "كلب" ولا يمكن لخوارزمية التعرف الضوئي على الحروف معرفة ما إذا كان الحرف "o" "a" أو "o" ، يمكنه استخدام قاموس لمعرفة ما إذا كانت أي مجموعة من الأحرف المحتملة تجعله معروفًا كلمة. في هذه الحالة ، فإن خوارزمية التعرف الضوئي على الحروف ستقلل من احتمال وجود "a" ، لأن "dag" ليست كلمة ، بينما "dog" هي.
أين يتم استخدام OCR؟
أحد الاستخدامات الرئيسية لـ OCR هو في النظام البريدي. يستخدم التعرف الضوئي على الحروف للتعرف تلقائيًا على عنوان الحروف والطرود ، وهي مهمة يمكن أن تقوم بها بشكل أسرع مما يمكن للأشخاص القيام به. في الحالات التي يكون فيها نظام التعرف الضوئي على الحروف غير قادر على قراءة عنوان الملصق ، سيتم فصله ليتمكن الإنسان من معالجته يدويًا بدلاً من ذلك.
يعد التعرف الضوئي على الحروف مفيدًا كأداة وصول للأشخاص الذين يعانون من إعاقات بصرية عند دمجه مع أداة تحويل النص إلى كلام. تقوم Google Translate أيضًا بتنفيذ OCR كجزء من عملية ترجمة النص في الصور.