Google се фокусира върху индийските езици с лесно превключване на език в Карти, двуезични превключватели за търсене и др

click fraud protection

На виртуалното събитие Google L10n Google показа подновен фокус върху индийските езици с промени, които се харесват на многоезичните в Индия.

Индия е страната на стоте езика, място, където диалектът се променя на всеки 100 километра. В един технологичен свят, доминиран от английски, тези местни езици и диалекти се оказват неспособни да осигурят достъп до смислени преживявания в Интернет. На виртуалното събитие Google L10n днес, Google улеснява многоезичните потребители в Индия да имат обогатяващи преживявания в Индия с лесно превключване на езика за Google Търсене, по-добро двуезично показване на резултатите в Google Търсене, лесно превключване на езика в Google Карти, помощ за домашни на хинди чрез Google Lens и многоезичен AI модел, наречен MuRIL, за да улесни компютрите да разбират различни човешки език.

Заден план

Преди да преминем към съобщенията, ето малко предистория, за да обясним контекста на нашата международна публика. А голяма част от Индия е двуезична и многоезична, като английският е първи език само на 0,02% от огромното население на Индия от над 1,2 милиарда души. Само 10,6% от цялото население може да говори английски. За разлика от това, 43,63% от населението говори хинди като първи език, докато 57,1% могат да говорят хинди като цяло (въпреки че това е разделено на различни поддиалекти). Следват други езици, но в по-малък процент - бенгалски, маратхи и телугу съответно с 8,9%, 8,2% и 7,8%. Накратко и накратко, фокусирането на технологията около английския като единствена среда за достъп държи технологията далеч от много голям брой потребители, които иначе биха намерили технологията за абсолютно полезна -- и може би се нуждаят от нея дори повече от онези, които вече имат достъп до технологията в други начини.

Както отбелязах в моя Преглед на Google Nest Audio, дори нещо като интелигентен високоговорител предлага по-малко използване в многоезична настройка, както би било в англоезично домакинство. Командите на смесени езици не се разпознават толкова добре (като предимно английска команда с някои думи на хинди) и настройката двуезичните езици все още е ограничен до някои комбинации (Хинди + урду или всеки два индийски езика не са валидна комбинация, но хинди + английски е). Ситуацията е по-добра от това, което беше преди няколко години, но все още има справедлив начин да се върви към подобрения.

И Google знае това, като формира основата за днешните съобщения на събитието L10n (закачливо съкращение за локализация, с 10 букви между L и n).

Съобщения на Google L10n събитие 2020 г

Лесно превключване между резултатите на английски и индийски език в Google Търсене

Google предлага възможност за бърза смяна между резултати на английски и хинди чрез чип/раздел в Google Търсене в индийски щати със значително население, говорещо хинди. Този чип увеличи 10 пъти увеличението на заявките на хинди в Индия.

Същото сега се разширява до повече индийски езици. Google Търсене вече ще предлага възможност за превключване на резултатите между английски и тамилски/телугу/бангла/маратхи.

По-добър двуезичен резултат, който се показва в Google Търсене

Потребителите в Индия, включително и аз, предпочитат да въвеждат неща на английски, дори ако резултатите се очакват на местен език. Всъщност транслитерацията на хинди на английски доведе до хинглиш, който е хинди, написан с английската азбука.

Google Търсене идва на помощ за тези двуезични хора за техните заявки за търсене. През следващия месец Търсене ще започне да показва подходящо съдържание на поддържани индийски езици, когато е подходящо, дори ако заявката е е транслитериран на английски, което води до двуезични резултати от търсене на повече езици в допълнение към английския като основен. Поддържаните индийски езици за средното ниво са хинди, бангла, маратхи, тамилски и телугу.

Лесно превключване на език в Google Maps

Google Assistant и Discover имат способността да превключват на език, различен от системата, което позволява на потребителите да използват тези инструменти според специфичните си предпочитания. Повече от 50% от съдържанието в Google Discover се гледа на индийски езици в страната, а една трета от потребителите на Google Assistant го използват на индийски език.

Възможността за смяна на езици в рамките на приложението вече се разширява в Google Карти. Потребителите вече могат просто да отворят приложението, да отидат в Настройки и да докоснат „Език на приложението“, за да изберат от до девет езика. Това ще улесни потребителите да търсят места, да получават упътвания и да навигират на предпочитания от тях език за тази задача.

Помощ за домашни на хинди чрез Google Lens

Google Lens вече ви позволява решаване на математически задачи за да помогнете с домашните на вашето дете. Можете да направите снимка на математически проблем и да ви бъде показано ръководство стъпка по стъпка как да го решите. Но това ръководство е показано предимно на английски език.

Google вече въвежда решения на хинди за помощ при домашните в Google Lens.

MuRIL -- многоезичният AI модел, който помага на компютърните системи да разбират индийските езици в мащаб

Голяма част от разговорите около AI и машинното обучение са съсредоточени около разбирането на хората и човешкия език. Но когато езиците приемат стотици форми, този разговор се превръща в огромна задача, дори повече, отколкото беше. Тук се намесва MuRIL.

Съкратено от Multilingual Represtantions for Indian Languages, MuRIL е многоезичен модел, който се мащабира между езиците. Наред с други предимства, той също така осигурява поддръжка за транслитериран текст, като например при писане на хинди с латиница. MuRIL също е добър в определянето на настроението на транслитерирани изречения. MuRIL поддържа 16 индийски езика, както и английски, което му дава най-голямо покритие за индийски езици сред всеки друг публично достъпен модел от този вид.

MuRIL е направен с отворен код и е достъпен за изтеглете от TensorFlow Hub безплатно.


Страхотно е да видиш компаниите да насочват разговорите към по-широко приемане на различни езици. Надяваме се, че усилията в тази насока ще продължат и за други езици и други региони.