Google मैप्स में आसान भाषा स्विच, द्विभाषी खोज टॉगल और बहुत कुछ के साथ इंडिक भाषाओं पर ध्यान केंद्रित करता है

Google L10n वर्चुअल इवेंट में, Google ने भारत में बहुभाषियों को आकर्षित करने वाले परिवर्तनों के साथ इंडिक भाषाओं पर नए सिरे से ध्यान केंद्रित किया है।

भारत सैकड़ों भाषाओं का देश है, जहां हर 100 किलोमीटर पर बोली बदल जाती है। अंग्रेजी के प्रभुत्व वाली तकनीकी दुनिया में, ये स्थानीय भाषाएं और बोलियां इंटरनेट पर सार्थक अनुभवों तक पहुंच प्रदान करने में खुद को असमर्थ पाती हैं। आज Google L10n वर्चुअल इवेंट में, Google भारत में बहुभाषी उपयोगकर्ताओं के लिए भारत में समृद्ध अनुभव प्राप्त करना आसान बना रहा है। Google खोज के लिए आसान भाषा टॉगल के साथ, Google खोज में बेहतर द्विभाषी परिणाम सामने आना, Google मानचित्र में आसान भाषा स्विच, Google लेंस के माध्यम से हिंदी में होमवर्क सहायता, और MuRIL नामक एक बहुभाषी AI मॉडल कंप्यूटर के लिए विविध चीजों को समझना आसान बनाता है मानव भाषा.

पृष्ठभूमि

घोषणाओं पर पहुंचने से पहले, हमारे अंतरराष्ट्रीय दर्शकों को संदर्भ समझाने के लिए यहां कुछ पृष्ठभूमि दी गई है। ए भारत का बड़ा हिस्सा द्विभाषी और बहुभाषी है, जबकि भारत की 1.2 अरब से अधिक की विशाल आबादी में से केवल 0.02% की पहली भाषा अंग्रेजी है। कुल जनसंख्या का केवल 10.6% लोग ही अंग्रेजी बोल सकते हैं। इसके विपरीत, 43.63% आबादी अपनी पहली भाषा के रूप में हिंदी बोलती है, जबकि 57.1% लोग कुल मिलाकर हिंदी बोल सकते हैं (हालाँकि यह विभिन्न उप-बोलियों में विभाजित है)। अन्य भाषाएँ अनुसरण करती हैं, लेकिन छोटे प्रतिशत में - बंगाली, मराठी और तेलुगु क्रमशः 8.9%, 8.2% और 7.8% में। इसकी बड़ी और छोटी बात यह है कि एकमात्र पहुंच माध्यम के रूप में अंग्रेजी के इर्द-गिर्द प्रौद्योगिकी को केंद्रित करना तकनीक को बहुत बड़ी संख्या से दूर रखता है। वे उपयोगकर्ता जो अन्यथा तकनीक को बिल्कुल उपयोगी पाते हैं - और शायद उन्हें उन लोगों की तुलना में इसकी अधिक आवश्यकता है जिनके पास पहले से ही अन्य तकनीक तक पहुंच है तौर तरीकों।

जैसा कि मैंने अपने में नोट किया है Google Nest ऑडियो समीक्षा, यहां तक ​​कि स्मार्ट स्पीकर जैसी कोई चीज़ भी बहुभाषी सेटअप में कम उपयोग प्रदान करती है जैसा कि अंग्रेजी बोलने वाले घर में होता है। मिश्रित भाषाओं में कमांड को उतनी अच्छी तरह से पहचाना नहीं जाता है (जैसे कि कुछ हिंदी शब्दों के साथ मुख्य रूप से अंग्रेजी कमांड), और सेटिंग द्विभाषी भाषाएँ अभी भी कुछ संयोजनों तक ही सीमित हैं (हिंदी + उर्दू, या कोई भी दो इंडिक भाषाएं एक वैध संयोजन नहीं हैं, लेकिन हिंदी + अंग्रेजी है)। कुछ साल पहले की स्थिति से स्थिति बेहतर है, लेकिन सुधार के लिए अभी भी काफी रास्ता बाकी है।

और Google इसे जानता है, इसके लिए आधार बना रहा है L10n इवेंट में आज की घोषणाएँ (स्थानीयकरण के लिए एक चंचल संक्षिप्त नाम, एल और एन के बीच 10 अक्षरों के साथ)।

Google L10n इवेंट 2020 में घोषणाएँ

Google खोज में अंग्रेजी और भारतीय भाषाओं के बीच आसानी से टॉगल करने पर परिणाम मिलते हैं

Google बड़ी संख्या में हिंदी भाषी आबादी वाले भारतीय राज्यों में Google खोज में एक चिप/टैब के माध्यम से अंग्रेजी और हिंदी में परिणामों के बीच शीघ्रता से अदला-बदली करने की क्षमता प्रदान कर रहा है। इस चिप ने भारत में हिंदी प्रश्नों की संख्या में 10 गुना वृद्धि कर दी।

अब इसे और अधिक इंडिक भाषाओं में विस्तारित किया जा रहा है। Google खोज अब अंग्रेजी और तमिल/तेलुगु/बांग्ला/मराठी के बीच भी परिणामों को टॉगल करने की क्षमता प्रदान करेगा।

Google खोज में बेहतर द्विभाषी परिणाम सामने आ रहे हैं

भारत में उपयोगकर्ता, जिनमें मैं भी शामिल हूं, चीजों को अंग्रेजी में टाइप करना पसंद करते हैं, भले ही परिणाम स्थानीय भाषा में अपेक्षित हों। दरअसल, अंग्रेजी में हिंदी के लिप्यंतरण ने हिंग्लिश को जन्म दिया है, जो अंग्रेजी वर्णमाला के साथ लिखी जाने वाली हिंदी है।

Google खोज ऐसे द्विभाषियों के लिए उनकी खोज क्वेरी के लिए बचाव में आ रहा है। अगले महीने में, खोज उचित होने पर समर्थित भारतीय भाषाओं में प्रासंगिक सामग्री दिखाना शुरू कर देगी, भले ही क्वेरी हो अंग्रेजी में अनुवादित किया गया, जिससे प्राथमिक के रूप में अंग्रेजी के अलावा अधिक भाषाओं में द्विभाषी खोज परिणाम सामने आए। माध्यमिक के लिए समर्थित भारतीय भाषाएँ हिंदी, बांग्ला, मराठी, तमिल और तेलुगु हैं।

Google मानचित्र में आसान भाषा परिवर्तन

Google असिस्टेंट और डिस्कवर में सिस्टम से भिन्न भाषा में स्विच करने की क्षमता है, जिससे उपयोगकर्ता अपनी विशिष्ट प्राथमिकता में इन टूल का उपयोग कर सकते हैं। देश में Google डिस्कवर की 50% से अधिक सामग्री भारतीय भाषाओं में देखी जाती है, और Google Assistant के एक तिहाई उपयोगकर्ता इसे भारतीय भाषा में उपयोग कर रहे हैं।

ऐप के भीतर भाषा बदलने की क्षमता को अब Google मैप्स तक बढ़ाया जा रहा है। उपयोगकर्ता अब केवल ऐप खोल सकते हैं, सेटिंग्स पर जा सकते हैं, और अधिकतम नौ भाषाओं में से चयन करने के लिए "ऐप भाषा" पर टैप कर सकते हैं। इससे उपयोगकर्ताओं के लिए इस कार्य के लिए स्थानों की खोज करना, दिशा-निर्देश प्राप्त करना और अपनी पसंदीदा भाषा में नेविगेट करना आसान हो जाएगा।

Google लेंस के माध्यम से हिंदी में होमवर्क सहायता

Google लेंस आपको पहले से ही इसकी अनुमति देता है गणित की समस्याओं को हल करें अपने बच्चे के होमवर्क में मदद करने के लिए। आप गणित की किसी समस्या की तस्वीर ले सकते हैं और उसे हल करने के बारे में चरण-दर-चरण मार्गदर्शिका दिखाई जा सकती है। लेकिन यह गाइड मुख्य रूप से अंग्रेजी में प्रदर्शित किया गया है।

Google अब Google लेंस में होमवर्क सहायता के लिए हिंदी समाधान पेश कर रहा है।

म्यूरिल - कंप्यूटर सिस्टम को बड़े पैमाने पर भारतीय भाषाओं को समझने में मदद करने वाला बहुभाषी एआई मॉडल

एआई और मशीन लर्निंग के इर्द-गिर्द बहुत सी बातचीत इंसानों और इंसानों की भाषा को समझने पर केंद्रित है। लेकिन जब भाषाएं सैकड़ों रूप ले लेती हैं, तो यह बातचीत एक कठिन कार्य में बदल जाती है, पहले से कहीं अधिक। यहीं पर म्यूरिल आता है।

भारतीय भाषाओं के लिए बहुभाषी प्रतिनिधित्व का संक्षिप्त रूप, म्यूरिल एक बहुभाषी मॉडल है जो सभी भाषाओं में काम करता है। अन्य लाभों के अलावा, यह लिप्यंतरित पाठ के लिए सहायता भी प्रदान करता है जैसे रोमन लिपि का उपयोग करके हिंदी लिखते समय। MuRIL अनूदित वाक्यों की भावना निर्धारित करने में भी अच्छा है। म्यूरिल 16 भारतीय भाषाओं के साथ-साथ अंग्रेजी का भी समर्थन करता है, जो इसे अपनी तरह के किसी भी अन्य सार्वजनिक रूप से उपलब्ध मॉडल के मुकाबले भारतीय भाषाओं के लिए उच्चतम कवरेज प्रदान करता है।

म्यूरिल को ओपन-सोर्स बना दिया गया है और यह इसके लिए उपलब्ध है TensorFlow हब से डाउनलोड करें मुक्त करने के लिए।


यह देखना बहुत अच्छा है कि कंपनियां विविध भाषाओं की व्यापक स्वीकृति की दिशा में बातचीत को आगे बढ़ा रही हैं। हमें उम्मीद है कि अन्य भाषाओं और अन्य क्षेत्रों के लिए भी इस दिशा में प्रयास जारी रहेंगे।