Google Maps подобрява откриваемостта на POI на 10 индийски езика, използвайки модели за автоматично обучение на транслитерация.
Google наскоро добави нова опция за превключване на езика в Google Карти, за да помогне на потребителите в Индия да търсят места, да получават упътвания и да навигират на предпочитания от тях местен език. Въпреки това, тъй като имената на повечето индийски интересни места (POI) не са налични на родни скриптове, откриваемостта на индийските езици все още е основен проблем. За да се справи с това, Google сега въвежда нова функция в Maps, която автоматично ще транслитерира имената на POI, за да подобри откриваемостта.
Google твърди, че тази нова функция ще „осигурява по-богато, по-интуитивно езиково изживяване за потребителите и ще позволи на милиони да изпращат заявки на собствения си език и да намират информация на Карти като ресторанти, бензинови помпи, болници, хранителни магазини," и още. Благодарение на функцията Google Maps вече ще може автоматично да транслитерира латинските имена на POI на хинди, бангла, маратхи, телугу, тамилски, гуджарати, каннада, малаялам, пенджаби и одия.
Говорейки за възможностите на новата функция за автоматична транслитерация в Google Maps, Cibu Johny, софтуерен инженер, Google Maps, каза, „Близо три четвърти от индийците взаимодействат с мрежата предимно на местни езици, а не на английски, и този брой само нараства. За да направим Google Карти възможно най-полезен за милиони потребители на индийски език, въведохме актуализирана автоматична система за транслитерация, която ни позволява да предоставяме по-точни резултати, когато потребителите търсят POI в предпочитания от тях език. В страна, където имената на заведенията се изписват с думи от множество езици и акроними, фонетично картографиране тези думи на родния им език ще ни помогнат да изведем по-точно резултатите, които потребителите на местния език търсят за."
Google даде следния пример, за да покаже как функцията за автоматична транслитерация ще помогне на потребителите на Карти в Индия:
„Обичайните английски думи се използват често в имената на места в Индия, дори когато са написани на родната писменост. Начинът, по който името е изписано в тези скриптове, до голяма степен се определя от произношението му. Например एनआईटी от акронима NIT се произнася „en-aye-tee“, а не като английската дума „nit“. Следователно, разбирайки, че NIT е често срещан акроним от региона, Картите могат да извлекат правилната транслитерация. В миналото, когато Картите не можеха да разберат контекста на एनआईटी, вместо това показваха свързан обект, който може да е по-далеч от потребителя. С тази разработка можем да намерим желания резултат от заявката на местния език. Освен това потребителите могат да видят имената на POI на техния местен език, дори когато първоначално не разполагат с тази информация.
За да активира тази функция, Google използва набор от модели за обучение, различни речници за транслитерация и модул от акроними с много голяма извадка от онлайн текстове. Google твърди, че функцията предлага значителни подобрения в качеството и покритието спрямо съществуващите автоматични транслитерации на имената на POI; до 20 пъти на някои езици. Следната таблица показва покритието и подобренията в качеството на поддържаните езици.
За повече подробности относно новата функция за автоматична транслитерация в Google Maps и как работи, вижте тази публикация в блога на Google India.