Google зосереджується на індійських мовах завдяки легкому перемиканню мов у Картах, двомовним перемикачам пошуку тощо

click fraud protection

На віртуальному заході Google L10n компанія Google знову зосередилася на індійських мовах із змінами, які приваблюють багатомовних людей в Індії.

Індія – країна сотні мов, де діалект змінюється кожні 100 км. У світі технологій, де домінує англійська, ці місцеві мови та діалекти виявляються нездатними забезпечити доступ до значущого досвіду в Інтернеті. На сьогоднішньому віртуальному заході Google L10n Google спрощує для багатомовних користувачів в Індії можливість збагачувати враження в Індії з легким перемиканням мов для Пошуку Google, кращим двомовним відображенням результатів у Пошуку Google, легким перемиканням мови в Картах Google, допомогу в домашньому завданні на хінді через Google Lens і багатомовну модель штучного інтелекту під назвою MuRIL, щоб полегшити комп’ютерам розуміння різноманітних людська мова.

Фон

Перш ніж перейти до оголошень, ось деяка довідка, щоб пояснити контекст нашій міжнародній аудиторії. А велика частина Індії є двомовною та багатомовною, причому англійська є рідною мовою лише для 0,02% величезного населення Індії, яке налічує понад 1,2 мільярда людей. Лише 10,6% населення розмовляють англійською. Навпаки, 43,63% населення розмовляє гінді як рідною мовою, тоді як 57,1% можуть розмовляти гінді загалом (хоча це розділено на різні піддіалекти). Далі йдуть інші мови, але в менших відсотках — бенгальська, маратхі та телугу у 8,9%, 8,2% та 7,8% відповідно. Коротше кажучи, зосередження технології на англійській мові як єдиному засобі доступу захищає технологію від дуже великої кількості користувачів, які інакше вважали б цю технологію абсолютно корисною – і, можливо, потребували б її навіть більше, ніж ті, хто вже має доступ до технології в інших шляхи.

Як я зазначив у своєму Огляд Google Nest Audio, навіть щось на кшталт розумного динаміка пропонує менше використання в багатомовній установці, ніж в англомовній родині. Команди змішаними мовами розпізнаються погано (наприклад, переважно англійська команда з деякими словами гінді), а налаштування двомовні мови все ще обмежені деякими комбінаціями (Хінді + урду або будь-які дві індійські мови не є допустимою комбінацією, але гінді + англійська є). Ситуація краща, ніж та, що була кілька років тому, але ще є справедливий шлях для покращення.

І Google це знає, формуючи базу для сьогоднішні оголошення на події L10n (грайлива абревіатура від Localization, з 10 буквами між L і n).

Оголошення на події Google L10n 2020

Легке перемикання між результатами пошуку англійською та індійською мовами в Пошуку Google

Google пропонує можливість швидкого перемикання між результатами англійською та хінді за допомогою чіпа/вкладки в Пошуку Google у штатах Індії зі значною кількістю гінді-мовного населення. Цей чіп у 10 разів збільшив кількість запитів на гінді в Індії.

Те саме зараз поширюється на інші індійські мови. Тепер у Пошуку Google можна буде перемикати результати між англійською та тамільською/телугу/бангла/маратхі.

Краще двомовне відображення результатів у Пошуку Google

Користувачі в Індії, включаючи мене, вважають за краще вводити текст англійською, навіть якщо результати очікуються місцевою мовою. Насправді транслітерація хінді англійською породила хінгліш, який є гінді, написаним англійським алфавітом.

Пошук Google приходить на допомогу двомовним людям у пошукових запитах. Протягом наступного місяця Пошук почне показувати релевантний вміст підтримуваними індійськими мовами, коли це буде доречно, навіть якщо запит має було транслітеровано англійською мовою, що призвело до двомовних результатів пошуку на більшій кількості мов на додаток до англійської як основної. Підтримувані індійські мови для вторинного: гінді, бангла, маратхі, тамільська та телугу.

Легке перемикання мови в Картах Google

Google Assistant і Discover мають можливість перемикатися на мову, відмінну від мови системи, що дозволяє користувачам використовувати ці інструменти відповідно до своїх уподобань. Понад 50% вмісту в Google Discover переглядається індіанськими мовами в країні, а третина користувачів Google Assistant використовує його індійською мовою.

Тепер можливість змінювати мови в додатку поширюється на Карти Google. Тепер користувачі можуть просто відкрити програму, перейти в налаштування та натиснути «Мова програми», щоб вибрати одну з дев’яти мов. Це полегшить користувачам пошук місць, отримання вказівок і навігацію мовою, яку вони вибирають для виконання цього завдання.

Допомога в домашньому завданні хінді через Google Lens

Google Lens вже дозволяє розв'язувати математичні задачі щоб допомогти вашій дитині зробити домашнє завдання. Ви можете сфотографувати математичну задачу, і вам покажуть покрокову інструкцію щодо її вирішення. Але в основному цей посібник викладено англійською мовою.

Зараз Google представляє рішення на хінді для допомоги в домашніх завданнях у Google Lens.

MuRIL — багатомовна модель ШІ, яка допомагає комп’ютерним системам розуміти індійські мови в масштабі

Багато розмов навколо штучного інтелекту та машинного навчання зосереджено навколо розуміння людей і людської мови. Але коли мови приймають сотні форм, ця розмова перетворюється на важливе завдання, ще більше, ніж це було раніше. Тут на допомогу приходить MuRIL.

Скорочення від Multilingual Represtantions for Indian Languages, MuRIL — це багатомовна модель, яка масштабується між мовами. Серед інших переваг він також забезпечує підтримку транслітерованого тексту, наприклад під час написання хінді латиницею. MuRIL також добре визначає настрої транслітерованих речень. MuRIL підтримує 16 індійських мов, а також англійську, що забезпечує найвищий рівень охоплення для індійських мов серед усіх інших загальнодоступних моделей подібного роду.

MuRIL було зроблено з відкритим кодом і доступно для завантажити з TensorFlow Hub безкоштовно.


Приємно бачити, як компанії спрямовують розмови на ширше сприйняття різноманітних мов. Ми сподіваємося, що зусилля для інших мов та інших регіонів продовжаться.