На виртуальном мероприятии Google L10n компания Google вновь продемонстрировала внимание к индийским языкам, внеся изменения, которые привлекательны для многоязычных жителей Индии.
Индия — страна ста языков, место, где диалект меняется каждые 100 км. В технологическом мире, где доминирует английский язык, эти местные языки и диалекты оказываются неспособными обеспечить доступ к значимому опыту в Интернете. На сегодняшнем виртуальном мероприятии Google L10n Google помогает многоязычным пользователям в Индии получить полезный опыт в Индии. с простым переключением языка для поиска Google, улучшенным отображением двуязычных результатов в поиске Google, простым переключением языка в Картах Google, помощь в выполнении домашних заданий на хинди с помощью Google Lens, а также многоязычная модель искусственного интеллекта под названием MuRIL, облегчающая компьютерам понимание разнообразных человеческий язык.
Фон
Прежде чем перейти к объявлениям, приведем некоторую предысторию, которая поможет объяснить контекст нашей международной аудитории. А
большая часть Индии двуязычна и многоязычна, при этом английский является первым языком лишь для 0,02% огромного населения Индии, насчитывающего более 1,2 миллиарда человек. Только 10,6% от общей численности населения могут говорить по-английски. Напротив, 43,63% населения говорят на хинди как на своем родном языке, а 57,1% могут говорить на хинди в целом (хотя он разделен на различные поддиалекты). Далее следуют другие языки, но в меньшем проценте — бенгали, маратхи и телугу — 8,9%, 8,2% и 7,8% соответственно. Короче говоря, концентрация технологий на английском языке как на единственном средстве доступа удерживает технологию от очень большого числа пользователей. пользователи, которые в противном случае нашли бы эту технологию абсолютно полезной – и, возможно, нуждаются в ней даже больше, чем те, кто уже имеет доступ к технологии в других странах. пути.Как я отметил в своем Обзор Google Nest Audio, даже что-то вроде умной колонки менее полезно в многоязычной среде, чем в англоязычной семье. Команды на смешанных языках распознаются не очень хорошо (например, преимущественно английские команды с некоторыми словами на хинди), и настройка двуязычные языки все еще ограничены некоторыми комбинациями (Хинди + урду или любые два индийских языка не являются допустимой комбинацией, а хинди + английский — допустимой). Ситуация лучше, чем несколько лет назад, но еще есть хороший путь к улучшению.
И Google знает об этом, формируя базу для сегодняшние анонсы на мероприятии L10n (игривое сокращение от «Локализация», состоящее из 10 букв между L и n).
Анонсы на Google L10n Event 2020
Легкое переключение между результатами на английском и индийском языках в поиске Google.
Google предлагает возможность быстрого переключения между результатами на английском и хинди с помощью чипа/вкладки в поиске Google в штатах Индии со значительной численностью населения, говорящего на хинди. Этот чип увеличил количество запросов на хинди в Индии в 10 раз.
То же самое теперь распространяется и на большее количество индийских языков. Поиск Google теперь также будет предлагать возможность переключать результаты между английским и тамильским/телугу/бангла/маратхи.
Лучшее отображение двуязычных результатов в поиске Google.
Пользователи в Индии, включая меня, предпочитают вводить текст на английском языке, даже если результаты ожидаются на местном языке. Фактически, транслитерация хинди на английский язык дала начало хинглишу, то есть хинди, написанному английским алфавитом.
Поиск Google приходит на помощь таким билингвам при поисковых запросах. В течение следующего месяца Поиск начнет показывать релевантный контент на поддерживаемых индийских языках, даже если запрос был транслитерирован на английский, что привело к появлению двуязычных результатов поиска на большем количестве языков в дополнение к английскому как основному. Поддерживаемые индийские языки для дополнительного образования: хинди, бангла, маратхи, тамильский и телугу.
Простое переключение языка в Google Maps
Google Assistant и Discover имеют возможность переключаться на язык, отличный от языка системы, что позволяет пользователям использовать эти инструменты по своему усмотрению. Более 50% контента в Google Discover просматривается на индийских языках в стране, и треть пользователей Google Assistant используют его на индийском языке.
Возможность менять язык в приложении теперь распространяется и на Карты Google. Теперь пользователи могут просто открыть приложение, перейти в «Настройки» и нажать «Язык приложения», чтобы выбрать один из девяти языков. Это облегчит пользователям поиск мест, прокладку маршрутов и навигацию на предпочитаемом ими для этой задачи языке.
Помощь с домашним заданием на хинди через Google Lens
Google Lens уже позволяет вам решать математические задачи чтобы помочь с домашним заданием вашего ребенка. Вы можете сфотографировать математическую задачу и получить пошаговое руководство по ее решению. Но это руководство в основном отображается на английском языке.
Google теперь представляет решения на хинди для помощи в выполнении домашних заданий в Google Lens.
MuRIL — многоязычная модель искусственного интеллекта, которая поможет компьютерным системам понимать индийские языки в большом масштабе.
Большая часть разговоров об искусственном интеллекте и машинном обучении сосредоточена на понимании людей и человеческого языка. Но когда языки принимают сотни форм, этот разговор превращается в сложную задачу, более сложную, чем раньше. Здесь на помощь приходит MuRIL.
MuRIL — сокращение от «Многоязычные представления индийских языков» — многоязычная модель, масштабируемая для разных языков. Помимо других преимуществ, он также обеспечивает поддержку транслитерированного текста, например, при написании хинди с использованием латиницы. MuRIL также хорошо определяет тональность транслитерированных предложений. MuRIL поддерживает 16 индийских языков, а также английский, что обеспечивает самый высокий охват индийских языков среди всех других общедоступных моделей такого рода.
MuRIL сделан с открытым исходным кодом и доступен для скачать из TensorFlow Hub бесплатно.
Приятно видеть, что компании направляют разговоры в сторону более широкого признания разнообразных языков. Мы надеемся, что усилия в этом направлении продолжатся и для других языков и других регионов.