Google Maps подобрява откриваемостта с автоматична транслитерация

click fraud protection

Google Maps подобрява откриваемостта на POI на 10 индийски езика, използвайки модели за автоматично обучение на транслитерация.

Google наскоро добави нова опция за превключване на езика в Google Карти, за да помогне на потребителите в Индия да търсят места, да получават упътвания и да навигират на предпочитания от тях местен език. Въпреки това, тъй като имената на повечето индийски интересни места (POI) не са налични на родни скриптове, откриваемостта на индийските езици все още е основен проблем. За да се справи с това, Google сега въвежда нова функция в Maps, която автоматично ще транслитерира имената на POI, за да подобри откриваемостта.

Google твърди, че тази нова функция ще „осигурява по-богато, по-интуитивно езиково изживяване за потребителите и ще позволи на милиони да изпращат заявки на собствения си език и да намират информация на Карти като ресторанти, бензинови помпи, болници, хранителни магазини," и още. Благодарение на функцията Google Maps вече ще може автоматично да транслитерира латинските имена на POI на хинди, бангла, маратхи, телугу, тамилски, гуджарати, каннада, малаялам, пенджаби и одия.

Говорейки за възможностите на новата функция за автоматична транслитерация в Google Maps, Cibu Johny, софтуерен инженер, Google Maps, каза, „Близо три четвърти от индийците взаимодействат с мрежата предимно на местни езици, а не на английски, и този брой само нараства. За да направим Google Карти възможно най-полезен за милиони потребители на индийски език, въведохме актуализирана автоматична система за транслитерация, която ни позволява да предоставяме по-точни резултати, когато потребителите търсят POI в предпочитания от тях език. В страна, където имената на заведенията се изписват с думи от множество езици и акроними, фонетично картографиране тези думи на родния им език ще ни помогнат да изведем по-точно резултатите, които потребителите на местния език търсят за."

Google даде следния пример, за да покаже как функцията за автоматична транслитерация ще помогне на потребителите на Карти в Индия:

„Обичайните английски думи се използват често в имената на места в Индия, дори когато са написани на родната писменост. Начинът, по който името е изписано в тези скриптове, до голяма степен се определя от произношението му. Например एनआईटी от акронима NIT се произнася „en-aye-tee“, а не като английската дума „nit“. Следователно, разбирайки, че NIT е често срещан акроним от региона, Картите могат да извлекат правилната транслитерация. В миналото, когато Картите не можеха да разберат контекста на एनआईटी, вместо това показваха свързан обект, който може да е по-далеч от потребителя. С тази разработка можем да намерим желания резултат от заявката на местния език. Освен това потребителите могат да видят имената на POI на техния местен език, дори когато първоначално не разполагат с тази информация.

За да активира тази функция, Google използва набор от модели за обучение, различни речници за транслитерация и модул от акроними с много голяма извадка от онлайн текстове. Google твърди, че функцията предлага значителни подобрения в качеството и покритието спрямо съществуващите автоматични транслитерации на имената на POI; до 20 пъти на някои езици. Следната таблица показва покритието и подобренията в качеството на поддържаните езици.

За повече подробности относно новата функция за автоматична транслитерация в Google Maps и как работи, вижте тази публикация в блога на Google India.