في حدث Google L10n الافتراضي، أظهرت Google تركيزًا متجددًا على اللغات الهندية مع التغييرات التي تجذب متعددي اللغات في الهند.
الهند هي أرض المئات من اللغات، حيث تتغير اللهجة كل 100 كيلومتر. وفي عالم التكنولوجيا الذي تهيمن عليه اللغة الإنجليزية، تجد هذه اللغات واللهجات المحلية نفسها غير قادرة على توفير الوصول إلى تجارب ذات معنى على الإنترنت. في حدث Google L10n الافتراضي اليوم، تسهل Google على المستخدمين متعددي اللغات في الهند الحصول على تجارب غنية في الهند من خلال تبديل اللغة بسهولة لبحث Google، وظهور أفضل للنتائج ثنائية اللغة في بحث Google، والتبديل السهل للغة في خرائط Google، المساعدة في الواجبات المنزلية باللغة الهندية من خلال Google Lens، ونموذج الذكاء الاصطناعي متعدد اللغات المسمى MuRIL لتسهيل فهم أجهزة الكمبيوتر المتنوعة لغة بشرية.
خلفية
قبل الوصول إلى الإعلانات، إليك بعض المعلومات الأساسية لشرح السياق لجمهورنا الدولي. أ جزء كبير من الهند ثنائي اللغة ومتعدد اللغات، حيث تعد اللغة الإنجليزية هي اللغة الأولى لـ 0.02٪ فقط من سكان الهند البالغ عددهم أكثر من 1.2 مليار نسمة. 10.6% فقط من إجمالي السكان يمكنهم التحدث باللغة الإنجليزية. في المقابل، يتحدث 43.63% من السكان اللغة الهندية كلغة أولى، في حين أن 57.1% يمكنهم التحدث باللغة الهندية بشكل عام (على الرغم من أن هذا مقسم إلى لهجات فرعية مختلفة). تتبعها اللغات الأخرى، ولكن بنسب أقل – البنغالية، الماراثية، والتيلجو بنسبة 8.9%، 8.2%، و7.8% على التوالي. باختصار، إن تركيز التكنولوجيا حول اللغة الإنجليزية باعتبارها بوابة الوصول الوحيدة يبقي التكنولوجيا بعيدة عن عدد كبير جدًا من الأشخاص. المستخدمون الذين قد يجدون التكنولوجيا مفيدة تمامًا - وربما يحتاجون إليها أكثر من أولئك الذين لديهم بالفعل إمكانية الوصول إلى التكنولوجيا في أماكن أخرى طرق.
كما لاحظت في بلدي مراجعة جوجل نيست للصوت، فحتى شيء مثل مكبر الصوت الذكي يوفر استخدامًا أقل في الإعداد متعدد اللغات كما هو الحال في الأسرة الناطقة باللغة الإنجليزية. لا يتم التعرف على الأوامر باللغات المختلطة بشكل جيد (مثل أمر باللغة الإنجليزية في المقام الأول مع بعض الكلمات الهندية)، والإعداد لا تزال اللغات ثنائية اللغة مقتصرة على بعض المجموعات (الهندية + الأردية، أو أي لغتين هنديتين ليست مجموعة صالحة، ولكن الهندية + الإنجليزية هي كذلك). إن الوضع أفضل مما كان عليه قبل سنوات قليلة، ولكن لا يزال هناك طريق عادل للمضي قدماً في التحسينات.
وجوجل يعرف ذلك، ويشكل الأساس لـ إعلانات اليوم في حدث L10n (اختصار مرح لـ Localization، مكون من 10 أحرف بين L وn).
الإعلانات في حدث Google L10n 2020
سهولة التبديل بين نتائج اللغة الإنجليزية والهندية في بحث Google
تقدم Google إمكانية التبديل السريع بين النتائج باللغتين الإنجليزية والهندية من خلال شريحة/علامة تبويب في بحث Google، في الولايات الهندية التي بها عدد كبير من السكان الناطقين باللغة الهندية. ساهمت هذه الشريحة في زيادة عدد طلبات البحث باللغة الهندية بمقدار 10 أضعاف في الهند.
ويتم الآن توسيع نفس الشيء ليشمل المزيد من اللغات الهندية. سيوفر بحث Google الآن القدرة على تبديل النتائج بين الإنجليزية والتاميلية/التيلجو/البنغالية/الماراثية أيضًا.
ظهور أفضل للنتائج ثنائية اللغة في بحث Google
يفضل المستخدمون في الهند، وأنا منهم، كتابة الأشياء باللغة الإنجليزية حتى لو كانت النتائج متوقعة باللغة المحلية. في الواقع، أدت الترجمة الصوتية من الهندية إلى الإنجليزية إلى ظهور اللغة الهنجليزية، وهي لغة هندية مكتوبة بالأبجدية الإنجليزية.
يأتي بحث Google لإنقاذ هؤلاء الأشخاص ثنائيي اللغة من أجل استعلامات البحث الخاصة بهم. خلال الشهر التالي، سيبدأ البحث في عرض المحتوى ذي الصلة باللغات الهندية المدعومة عندما يكون ذلك مناسبًا، حتى لو كان الاستعلام قد تم ذلك تمت ترجمتها إلى اللغة الإنجليزية، مما أدى إلى ظهور نتائج بحث ثنائية اللغة عبر المزيد من اللغات بالإضافة إلى اللغة الإنجليزية باعتبارها اللغة الأساسية. اللغات الهندية المدعومة للمرحلة الثانوية هي الهندية، البنغالية، الماراثية، التاميلية، والتيلجو.
تبديل اللغة بسهولة في خرائط جوجل
يتمتع مساعد Google وDiscover بالقدرة على التبديل إلى لغة مختلفة عن النظام، مما يسمح للمستخدمين باستخدام هذه الأدوات حسب تفضيلاتهم المحددة. يتم عرض أكثر من 50% من المحتوى الموجود في Google Discover باللغات الهندية في البلاد، ويستخدمه ثلث مستخدمي مساعد Google باللغة الهندية.
يتم الآن توسيع القدرة على تغيير اللغات داخل التطبيق لتشمل خرائط Google. يمكن للمستخدمين الآن ببساطة فتح التطبيق، والانتقال إلى الإعدادات، والنقر على "لغة التطبيق" للاختيار من بين ما يصل إلى تسع لغات. سيسهل هذا على المستخدمين البحث عن الأماكن والحصول على الاتجاهات والتنقل بلغتهم المفضلة لهذه المهمة.
المساعدة في الواجبات المنزلية باللغة الهندية من خلال Google Lens
Google Lens يسمح لك بذلك بالفعل حل مسائل الرياضيات للمساعدة في واجبات ابنك المنزلية. يمكنك التقاط صورة لمسألة رياضية، وسيظهر لك دليل خطوة بخطوة حول كيفية حلها. ولكن تم عرض هذا الدليل في المقام الأول باللغة الإنجليزية.
تقدم Google الآن حلولاً هندية للمساعدة في الواجبات المنزلية في Google Lens.
MuRIL – نموذج الذكاء الاصطناعي متعدد اللغات لمساعدة أنظمة الكمبيوتر على فهم اللغات الهندية على نطاق واسع
تتمحور الكثير من المحادثات حول الذكاء الاصطناعي والتعلم الآلي حول فهم البشر واللغة البشرية. ولكن عندما تتخذ اللغات مائة شكل، تتضخم هذه المحادثة وتتحول إلى مهمة هائلة، أكثر مما كانت عليه بالفعل. هذا هو المكان الذي يأتي فيه MuRIL.
اختصارًا لـ Multilingual Represtantions for Indian Languages، MuRIL هو نموذج متعدد اللغات يتوسع عبر اللغات. ومن بين المزايا الأخرى، أنه يوفر أيضًا دعمًا للنص المكتوب بحروف صوتية، كما هو الحال عند كتابة اللغة الهندية باستخدام النص الروماني. يعتبر MuRIL أيضًا جيدًا في تحديد الشعور بالجمل المكتوبة بحروف صوتية. يدعم MuRIL 16 لغة هندية بالإضافة إلى اللغة الإنجليزية، مما يمنحه أعلى تغطية للغات الهندية بين أي نموذج آخر متاح للعامة من نوعه.
لقد أصبح MuRIL مفتوح المصدر ومتاحًا لـ قم بالتنزيل من TensorFlow Hub مجانا.
من الرائع أن نرى الشركات توجه المحادثات نحو قبول أوسع للغات المتنوعة. ونأمل أن تستمر الجهود في هذا الصدد بالنسبة للغات الأخرى والمناطق الأخرى أيضًا.