जबकि आपके कंप्यूटर पर दस्तावेज़ लेना और प्रिंटर के साथ एक भौतिक प्रतिलिपि प्राप्त करना आसान है, दूसरी तरफ जाना आम तौर पर कठिन होता है। जबकि स्कैनर मौजूद हैं और स्कैन किए गए दस्तावेज़ों को एक छवि के रूप में सहेज सकते हैं, यदि आप दस्तावेज़ को संपादित करना चाहते हैं तो यह विशेष रूप से सहायक नहीं है। किसी दस्तावेज़ को संपादित करने में सक्षम होने के लिए आप ऑप्टिकल कैरेक्टर रिकग्निशन या ओसीआर नामक तकनीक का उपयोग करना चाहते हैं।
ऑप्टिकल कैरेक्टर रिकग्निशन कैसे काम करता है?
ओसीआर दस्तावेजों को सटीक रूप से पढ़ने के लिए कई तकनीकों का उपयोग करता है। OCR सॉफ़्टवेयर दस्तावेज़ को समायोजित करता है, और संभावित रूप से अलग-अलग शब्दों को भी समायोजित करता है ताकि वे सही ढंग से संरेखित हों। छवि को एक शुद्ध काले और सफेद प्रारूप में परिवर्तित किया जाता है क्योंकि यह ग्रे के रंगों के बीच अंतर करने से आसान है। किसी भी गैर-पाठ्यवस्तु को पहचानने और हटाने के लिए विश्लेषण भी किया जाता है।
दो मुख्य प्रकार के ओसीआर एल्गोरिदम का उपयोग किया जाता है, मैट्रिक्स मिलान और फीचर निष्कर्षण। मैट्रिक्स मिलान एकल वर्ण की एक छवि लेता है और फिर पिक्सेल आधार पर पिक्सेल पर कॉन्फ़िगर किए गए एल्गोरिदम से इसकी तुलना करता है। इस तकनीक के लिए आवश्यक है कि चरित्र को अन्य सभी सामग्री से सही ढंग से अलग किया जाए और फ़ॉन्ट को OCR सॉफ़्टवेयर में शामिल किया जाए। इस प्रकार का OCR लिखावट को पहचानने के लिए भी काम नहीं करता है।
फ़ीचर निष्कर्षण एल्गोरिदम प्रत्येक वर्ण को सुविधाओं में विभाजित करते हैं, जैसे कि रेखाएँ, वक्र और रेखा चौराहा। यह तकनीक ज्ञात फोंट के साथ प्रशिक्षित किए जा रहे एल्गोरिथम पर निर्भरता को काफी कम कर देती है। फीचर एक्सट्रैक्शन नए फोंट को पहचानने और उन्हें ट्रांसक्रिप्ट करने में सक्षम है, साथ ही कुछ हस्तलेखन, हालांकि सटीकता ज्ञात फोंट के लिए उतनी अच्छी नहीं है।
कुछ और उन्नत सॉफ्टवेयर उन अक्षरों की पहचान करने में मदद करने के लिए आसपास के अक्षरों के संदर्भ का उपयोग करते हैं जो उतने स्पष्ट नहीं हैं। उदाहरण के लिए, यदि "डॉग" शब्द छपा हुआ है और ओसीआर एल्गोरिथम निश्चित रूप से यह नहीं बता सकता है कि "ओ" एक है या नहीं "ए" या "ओ", यह देखने के लिए एक शब्दकोश का उपयोग कर सकता है कि संभावित पात्रों का कोई संयोजन ज्ञात करता है या नहीं शब्द। इस मामले में, ओसीआर एल्गोरिदम "ए" की संभावना को छूट देगा, क्योंकि "डैग" एक शब्द नहीं है, जबकि "कुत्ता" है।
ओसीआर का उपयोग कहाँ किया जाता है?
ओसीआर के मुख्य उपयोगों में से एक डाक प्रणाली में है। ओसीआर का उपयोग पत्रों और पार्सल के पते की स्वचालित रूप से पहचान करने के लिए किया जाता है, यह एक ऐसा कार्य है जो लोगों की तुलना में काफी तेजी से कर सकता है। ऐसे मामलों में जहां ओसीआर सिस्टम लेबल के पते को पढ़ने में असमर्थ है, इसके बजाय इसे मानव द्वारा मैन्युअल रूप से संसाधित करने के लिए अलग किया जाएगा।
टेक्स्ट-टू-स्पीच टूल के साथ संयुक्त होने पर ओसीआर दृष्टिबाधित लोगों के लिए एक एक्सेसिबिलिटी टूल के रूप में उपयोगी है। छवियों में पाठ का अनुवाद करने की प्रक्रिया के हिस्से के रूप में Google अनुवाद ओसीआर को भी लागू करता है।