Mapy Google zlepšujú objaviteľnosť bodov záujmu v 10 indických jazykoch pomocou modelov učenia sa automatického prepisu.
Google nedávno pridal novú možnosť prepínania jazykov v Mapách Google, aby pomohla používateľom v Indii vyhľadávať miesta, získavať trasy a navigovať v ich preferovanom miestnom jazyku. Keďže však názvy väčšiny indických zaujímavých miest (POI) nie sú k dispozícii v natívnom písme, objaviteľnosť v indických jazykoch je stále hlavným problémom. Na vyriešenie tohto problému teraz Google predstavuje novú funkciu v Mapách, ktorá automaticky prepíše názvy bodov záujmu, aby sa zlepšila ich objaviteľnosť.
Google tvrdí, že táto nová funkcia bude „poskytnúť používateľom bohatší a intuitívnejší jazykový zážitok a umožniť miliónom zadávať dopyty vo svojom vlastnom jazyku a nájsť informácie na Mapách, ako sú reštaurácie, benzínové pumpy, nemocnice, obchody s potravinami,“ a viac. Vďaka tejto funkcii budú teraz Mapy Google schopné automaticky prepísať latinské názvy bodov záujmu do hindčiny, bengálčiny, maráthčiny, telugčiny, tamilčiny, gudžarátčiny, kannady, malajálamčiny, pandžábčiny a udí.
Cibu Johny, softvérový inžinier, Google Maps, povedal o možnostiach novej funkcie automatického prepisu v Mapách Google„Takmer tri štvrtiny Indov komunikuje s webom primárne pomocou miestnych jazykov namiesto angličtiny a toto číslo len rastie. Aby boli Mapy Google čo najužitočnejšie pre milióny používateľov indického jazyka, zaviedli sme aktualizovaný automat transliteračný systém, ktorý nám umožňuje poskytovať presnejšie výsledky, keď používatelia vyhľadávajú body záujmu podľa vlastného výberu Jazyk. V krajine, kde sú názvy podnikov písané slovami z viacerých jazykov a akronymov, ktoré sú foneticky mapované tieto slová do ich rodného jazyka nám pomôžu presnejšie zobraziť výsledky, ktoré používatelia v miestnom jazyku hľadajú pre."
Google uviedol nasledujúci príklad, aby ukázal, ako funkcia automatického prepisu pomôže používateľom Máp v Indii:
„Bežné anglické slová sa často používajú v názvoch miest v Indii, aj keď sú napísané pôvodným písmom. Spôsob, akým je názov napísaný v týchto skriptoch, je do značnej miery ovplyvnený jeho výslovnosťou. Napríklad एनआईटी zo skratky NIT sa vyslovuje „en-aye-tee“, nie ako anglické slovo „nit“. Po pochopení, že NIT je bežný akronym z regiónu, môžu Mapy odvodiť správny prepis. V minulosti, keď Mapy nerozumeli kontextu एनआईटी, namiesto toho zobrazovali súvisiacu entitu, ktorá mohla byť ďalej od používateľa. S týmto vývojom môžeme nájsť požadovaný výsledok z dopytu v miestnom jazyku. Okrem toho môžu používatelia vidieť názvy bodov POI vo svojom miestnom jazyku, aj keď tieto informácie pôvodne nemajú.“
Na aktiváciu tejto funkcie použil Google súbor učebných modelov, rôzne transliteračné slovníky a modul akronymov s veľmi veľkou vzorkou online textov. Google tvrdí, že táto funkcia ponúka výrazné zlepšenie kvality a pokrytia oproti existujúcim automatickým prepisom názvov POI; v niektorých jazykoch až 20-krát. Nasledujúca tabuľka zobrazuje pokrytie a vylepšenia kvality v podporovaných jazykoch.
Ďalšie podrobnosti o novej funkcii automatického prepisu v Mapách Google a o tom, ako funguje, nájdete na stránke tento príspevok na blogu Google India.