Карти Google покращують видимість об’єктів інтересу 10 індійськими мовами за допомогою моделей автоматичного навчання транслітерації.
Google нещодавно додано нову опцію перемикання мови на Картах Google, щоб допомогти користувачам в Індії шукати місця, прокладати маршрути та здійснювати навігацію улюбленою мовою. Однак, оскільки назви більшості індійських визначних місць (POI) недоступні рідним шрифтом, доступність індійських мов все ще залишається серйозною проблемою. Щоб вирішити цю проблему, Google зараз представляє нову функцію в Картах, яка автоматично транслітерує назви POI для покращення видимості.
Google стверджує, що ця нова функція буде "забезпечить більш багатий, інтуїтивно зрозумілий мовний досвід для користувачів і дозволить мільйонам надсилати запити в власною мовою та знаходити на Картах інформацію про ресторани, заправки, лікарні, продуктові магазини, і більше. Завдяки цій функції Google Maps тепер зможе автоматично транслітерувати назви POI латиницею на хінді, бангла, маратхі, телугу, тамільську, гуджараті, каннада, малаялам, пенджабі та одіа.
Говорячи про можливості нової функції автоматичної транслітерації в Google Maps, Сібу Джоні, програмний інженер Google Maps, сказав, «Майже три чверті індійців взаємодіють з Інтернетом переважно місцевими мовами, а не англійською, і це число лише зростає. Щоб зробити Карти Google якомога кориснішими для мільйонів користувачів, які говорять індійською мовою, ми запровадили оновлену автоматичну система транслітерації, яка дозволяє нам надавати більш точні результати, коли користувачі шукають POI у бажаному місці мова. У країні, де назви закладів пишуться словами з багатьох мов та абревіатурами, фонетичне відображення ці слова їхньою рідною мовою допоможуть нам точніше висвітлити результати, які шукають користувачі місцевою мовою для."
Google навів такий приклад, щоб показати, як функція автоматичної транслітерації допоможе користувачам Карт в Індії:
«Звичайні англійські слова часто використовуються в назвах місць в Індії, навіть якщо вони написані рідною мовою. Спосіб написання імені в цих сценаріях значною мірою залежить від його вимови. Наприклад, एनआईटी з абревіатури NIT вимовляється як «en-aye-tee», а не як англійське слово «nit». Тому, розуміючи, що NIT є поширеною абревіатурою регіону, Карти можуть отримати правильну транслітерацію. У минулому, коли Карти не могли зрозуміти контекст एनआईटी, натомість вони показували пов’язану сутність, яка могла бути далі від користувача. Завдяки цій розробці ми можемо знайти бажаний результат із запиту місцевою мовою. Крім того, користувачі можуть бачити назви POI своєю місцевою мовою, навіть якщо вони спочатку не мають цієї інформації».
Щоб увімкнути цю функцію, Google використав набір моделей навчання, різні словники транслітерації та модуль акронімів із дуже великою вибіркою онлайн-текстів. Google стверджує, що ця функція пропонує суттєві покращення якості та покриття порівняно з існуючою автоматичною транслітерацією назв POI; до 20 разів на деяких мовах. У наведеній нижче таблиці показано покриття та покращення якості підтримуваними мовами.
Щоб дізнатися більше про нову функцію автоматичної транслітерації в Картах Google і про те, як вона працює, перегляньте цей пост у блозі Google India.