ऑप्टिकल कैरेक्टर रिकग्निशन क्या है?

click fraud protection

जबकि आपके कंप्यूटर पर दस्तावेज़ लेना और प्रिंटर के साथ एक भौतिक प्रतिलिपि प्राप्त करना आसान है, दूसरी तरफ जाना आम तौर पर कठिन होता है। जबकि स्कैनर मौजूद हैं और स्कैन किए गए दस्तावेज़ों को एक छवि के रूप में सहेज सकते हैं, यदि आप दस्तावेज़ को संपादित करना चाहते हैं तो यह विशेष रूप से सहायक नहीं है। किसी दस्तावेज़ को संपादित करने में सक्षम होने के लिए आप ऑप्टिकल कैरेक्टर रिकग्निशन या ओसीआर नामक तकनीक का उपयोग करना चाहते हैं।

ऑप्टिकल कैरेक्टर रिकग्निशन कैसे काम करता है?

ओसीआर दस्तावेजों को सटीक रूप से पढ़ने के लिए कई तकनीकों का उपयोग करता है। OCR सॉफ़्टवेयर दस्तावेज़ को समायोजित करता है, और संभावित रूप से अलग-अलग शब्दों को भी समायोजित करता है ताकि वे सही ढंग से संरेखित हों। छवि को एक शुद्ध काले और सफेद प्रारूप में परिवर्तित किया जाता है क्योंकि यह ग्रे के रंगों के बीच अंतर करने से आसान है। किसी भी गैर-पाठ्यवस्तु को पहचानने और हटाने के लिए विश्लेषण भी किया जाता है।

दो मुख्य प्रकार के ओसीआर एल्गोरिदम का उपयोग किया जाता है, मैट्रिक्स मिलान और फीचर निष्कर्षण। मैट्रिक्स मिलान एकल वर्ण की एक छवि लेता है और फिर पिक्सेल आधार पर पिक्सेल पर कॉन्फ़िगर किए गए एल्गोरिदम से इसकी तुलना करता है। इस तकनीक के लिए आवश्यक है कि चरित्र को अन्य सभी सामग्री से सही ढंग से अलग किया जाए और फ़ॉन्ट को OCR सॉफ़्टवेयर में शामिल किया जाए। इस प्रकार का OCR लिखावट को पहचानने के लिए भी काम नहीं करता है।

फ़ीचर निष्कर्षण एल्गोरिदम प्रत्येक वर्ण को सुविधाओं में विभाजित करते हैं, जैसे कि रेखाएँ, वक्र और रेखा चौराहा। यह तकनीक ज्ञात फोंट के साथ प्रशिक्षित किए जा रहे एल्गोरिथम पर निर्भरता को काफी कम कर देती है। फीचर एक्सट्रैक्शन नए फोंट को पहचानने और उन्हें ट्रांसक्रिप्ट करने में सक्षम है, साथ ही कुछ हस्तलेखन, हालांकि सटीकता ज्ञात फोंट के लिए उतनी अच्छी नहीं है।

कुछ और उन्नत सॉफ्टवेयर उन अक्षरों की पहचान करने में मदद करने के लिए आसपास के अक्षरों के संदर्भ का उपयोग करते हैं जो उतने स्पष्ट नहीं हैं। उदाहरण के लिए, यदि "डॉग" शब्द छपा हुआ है और ओसीआर एल्गोरिथम निश्चित रूप से यह नहीं बता सकता है कि "ओ" एक है या नहीं "ए" या "ओ", यह देखने के लिए एक शब्दकोश का उपयोग कर सकता है कि संभावित पात्रों का कोई संयोजन ज्ञात करता है या नहीं शब्द। इस मामले में, ओसीआर एल्गोरिदम "ए" की संभावना को छूट देगा, क्योंकि "डैग" एक शब्द नहीं है, जबकि "कुत्ता" है।

ओसीआर का उपयोग कहाँ किया जाता है?

ओसीआर के मुख्य उपयोगों में से एक डाक प्रणाली में है। ओसीआर का उपयोग पत्रों और पार्सल के पते की स्वचालित रूप से पहचान करने के लिए किया जाता है, यह एक ऐसा कार्य है जो लोगों की तुलना में काफी तेजी से कर सकता है। ऐसे मामलों में जहां ओसीआर सिस्टम लेबल के पते को पढ़ने में असमर्थ है, इसके बजाय इसे मानव द्वारा मैन्युअल रूप से संसाधित करने के लिए अलग किया जाएगा।

टेक्स्ट-टू-स्पीच टूल के साथ संयुक्त होने पर ओसीआर दृष्टिबाधित लोगों के लिए एक एक्सेसिबिलिटी टूल के रूप में उपयोगी है। छवियों में पाठ का अनुवाद करने की प्रक्रिया के हिस्से के रूप में Google अनुवाद ओसीआर को भी लागू करता है।