Карты Google улучшают обнаружение POI на 10 индийских языках с помощью моделей автоматического обучения транслитерации.
Google недавно добавили новую опцию переключения языка на Картах Google, чтобы помочь пользователям в Индии искать места, прокладывать маршруты и ориентироваться на предпочитаемом ими местном языке. Однако, поскольку названия большинства индийских достопримечательностей (POI) недоступны на родном языке, возможность обнаружения на индийских языках по-прежнему остается серьезной проблемой. Чтобы решить эту проблему, Google теперь представляет новую функцию в Картах, которая будет автоматически транслитерировать названия POI для улучшения их обнаружения.
Google утверждает, что эта новая функция будет «предоставить пользователям более богатый и интуитивно понятный языковой опыт и позволит миллионам людей отправлять запросы в на своем родном языке и находить на картах такую информацию, как рестораны, заправочные станции, больницы, продуктовые магазины». и более. Благодаря этой функции Карты Google теперь смогут автоматически транслитерировать латинские названия POI на хинди, бангла, маратхи, телугу, тамильский, гуджарати, каннада, малаялам, пенджаби и одиа.
Говоря о возможностях новой функции автоматической транслитерации в Google Maps, Сибу Джони, инженер-программист Google Maps, сказал:«Почти три четверти индийцев взаимодействуют с Интернетом, используя преимущественно местные языки, а не английский, и это число только растет. Чтобы сделать Карты Google максимально полезными для миллионов пользователей индийского языка, мы ввели обновленную автоматическую система транслитерации, которая позволяет нам предоставлять более точные результаты, когда пользователи ищут POI в предпочитаемом ими месте. язык. В стране, где названия заведений написаны словами из разных языков и аббревиатурами, фонетическое отображение эти слова на их родном языке помогут нам более точно отображать результаты, которые ищут пользователи на местном языке. для."
Google привел следующий пример, чтобы показать, как функция автоматической транслитерации поможет пользователям Карт в Индии:
«Обычные английские слова часто используются в названиях мест в Индии, даже если они написаны родным письмом. То, как имя пишется в этих сценариях, во многом зависит от его произношения. Например, एनआईटी от аббревиатуры NIT произносится как «эн-ай-ти», а не как английское слово «нит». Поэтому, понимая, что NIT — это распространенная в регионе аббревиатура, Карты могут получить правильную транслитерацию. Раньше, когда Карты не могли понять контекст एनआईटी, вместо этого они отображали связанный объект, который мог находиться дальше от пользователя. Благодаря этой разработке мы можем найти желаемый результат из запроса на местном языке. Кроме того, пользователи могут видеть названия POI на своем местном языке, даже если у них изначально нет такой информации».
Чтобы включить эту функцию, Google использовал ансамбль моделей обучения, различные словари транслитерации и модуль акронимов с очень большой выборкой онлайн-текстов. Google утверждает, что эта функция обеспечивает значительные улучшения качества и покрытия по сравнению с существующей автоматической транслитерацией названий POI; до 20 раз на некоторых языках. В следующей таблице показаны улучшения покрытия и качества поддерживаемых языков.
Более подробную информацию о новой функции автоматической транслитерации в Картах Google и о том, как она работает, см. эта почта в блоге Google India.