Google sa zameriava na indické jazyky s jednoduchým prepínaním jazykov v Mapách, dvojjazyčnými prepínačmi vyhľadávania a ďalšími funkciami

Na virtuálnom podujatí Google L10n spoločnosť Google ukázala obnovené zameranie na indické jazyky so zmenami, ktoré oslovujú viacjazyčných ľudí v Indii.

India je krajina sto jazykov, miesto, kde sa dialekt mení každých 100 km. V technologickom svete, ktorému dominuje angličtina, tieto miestne jazyky a dialekty nedokážu poskytnúť prístup k zmysluplným zážitkom na internete. Na dnešnom virtuálnom podujatí Google L10n spoločnosť Google uľahčuje viacjazyčným používateľom v Indii obohacujúce skúsenosti v Indii s jednoduchým prepínaním jazyka pre Vyhľadávanie Google, lepším dvojjazyčným zobrazovaním výsledkov vo Vyhľadávaní Google, jednoduchým prepínaním jazyka v Mapách Google, pomoc s domácimi úlohami v hindčine cez Google Lens a viacjazyčný model AI s názvom MuRIL, ktorý počítačom uľahčí porozumenie rôznym ľudský jazyk.

Pozadie

Predtým, ako sa dostaneme k oznámeniam, tu je niekoľko podkladov na vysvetlenie kontextu nášmu medzinárodnému publiku. A veľká časť Indie je dvojjazyčná a viacjazyčná

, pričom angličtina je prvým jazykom len pre 0,02 % z obrovskej populácie Indie, ktorá má viac ako 1,2 miliardy ľudí. Len 10,6 % z celkovej populácie vie hovoriť anglicky. Na rozdiel od toho 43,63 % populácie hovorí hindsky ako svoj prvý jazyk, zatiaľ čo 57,1 % hovorí celkovo hindsky (hoci je rozdelená do rôznych subdialektov). Nasledujú ďalšie jazyky, ale v menšom percente – bengálčina, maráthčina a telugčina v 8,9 %, 8,2 % a 7,8 %. Stručne povedané, zameranie technológie na angličtinu ako jediné prístupové médium bráni technológii od veľmi veľkého počtu používatelia, ktorí by inak považovali túto technológiu za absolútne užitočnú – a možno ju potrebujú ešte viac ako tí, ktorí už majú prístup k technike v iných spôsoby.

Ako som poznamenal v mojom Recenzia Google Nest Audio, dokonca aj niečo ako inteligentný reproduktor ponúka menšie využitie vo viacjazyčnom nastavení ako v anglicky hovoriacej domácnosti. Príkazy v zmiešaných jazykoch nie sú tak dobre rozpoznané (ako primárne anglický príkaz s niektorými hindskými slovami) a nastavenie bilingválnych jazykov je stále obmedzený na niektoré kombinácie (Hindčina + urdčina alebo akékoľvek dva indické jazyky nie sú platnou kombináciou, ale hindčina + angličtina áno). Situácia je lepšia ako pred niekoľkými rokmi, ale stále existuje spravodlivá cesta k zlepšeniu.

A Google to vie a tvorí základ pre dnešné oznámenia na podujatí L10n (hravá skratka pre lokalizáciu s 10 písmenami medzi L a n).

Oznámenia na podujatí Google L10n 2020

Jednoduché prepínanie medzi výsledkami v angličtine a indickom jazyku vo Vyhľadávaní Google

Spoločnosť Google ponúka možnosť rýchleho prepínania medzi výsledkami v angličtine a hindčine prostredníctvom čipu/karty vo Vyhľadávaní Google v indických štátoch s významnou populáciou hovoriacou hindsky. Tento čip 10x zvýšil nárast dopytov v hindčine v Indii.

To isté sa teraz rozširuje do ďalších indických jazykov. Vyhľadávanie Google teraz ponúkne možnosť prepínať výsledky aj medzi angličtinou a tamilčinou/telugčinou/banglou/maráthčinou.

Lepšie dvojjazyčné zobrazovanie výsledkov vo Vyhľadávaní Google

Používatelia v Indii vrátane mňa radšej píšu veci v angličtine, aj keď sa výsledky očakávajú v miestnom jazyku. V skutočnosti prepis hindčiny do angličtiny viedol k vzniku Hinglish, čo je hindčina písaná anglickou abecedou.

Vyhľadávanie Google prichádza na záchranu takýchto dvojjazyčných používateľov pri ich vyhľadávacích dopytoch. V priebehu budúceho mesiaca začne Vyhľadávanie podľa potreby zobrazovať relevantný obsah v podporovaných indických jazykoch, a to aj v prípade, že dopyt áno boli prepísané do angličtiny, čím vznikli dvojjazyčné výsledky vyhľadávania vo viacerých jazykoch okrem angličtiny ako primárnej. Podporované indické jazyky pre sekundárne sú hindčina, bengálčina, maráthčina, tamilčina a telugčina.

Jednoduché prepínanie jazyka v Mapách Google

Asistent Google a Discover majú možnosť prepnúť na iný jazyk ako systém, čo používateľom umožňuje používať tieto nástroje podľa vlastných preferencií. Viac ako 50 % obsahu v službe Google Discover sa v krajine zobrazuje v indických jazykoch a tretina používateľov Asistenta Google ho používa v indickom jazyku.

Možnosť meniť jazyky v rámci aplikácie sa teraz rozširuje aj na Mapy Google. Používatelia môžu teraz jednoducho otvoriť aplikáciu, prejsť do Nastavenia a klepnutím na „Jazyk aplikácie“ si vybrať až z deviatich jazykov. Používateľom to uľahčí vyhľadávanie miest, získavanie trás a navigáciu v preferovanom jazyku pre túto úlohu.

Pomoc s domácimi úlohami v hindčine cez Google Lens

Google Lens vám to už umožňuje riešiť matematické úlohy pomôcť s domácimi úlohami vášho dieťaťa. Môžete odfotografovať matematický problém a zobrazí sa vám podrobný návod, ako ho vyriešiť. Ale táto príručka bola primárne zobrazená v angličtine.

Google teraz predstavuje hindské riešenia pre pomoc s domácimi úlohami v Google Lens.

MuRIL – viacjazyčný model AI, ktorý pomáha počítačovým systémom porozumieť indickým jazykom vo veľkom rozsahu

Veľa konverzácií okolo AI a strojového učenia sa sústreďuje na pochopenie ľudí a ľudského jazyka. Ale keď jazyky nadobudnú sto podôb, táto konverzácia sa premení na impozantnú úlohu, a to ešte väčšiu, než bola. Tu prichádza na rad MuRIL.

Skratka pre viacjazyčné vyjadrenia pre indické jazyky, MuRIL je viacjazyčný model, ktorý sa mení v rôznych jazykoch. Okrem iných výhod poskytuje aj podporu pre prepisovaný text, napríklad pri písaní hindčiny pomocou rímskeho písma. MuRIL je tiež dobrý pri určovaní sentimentu prepísaných viet. MuRIL podporuje 16 indických jazykov, ako aj angličtinu, vďaka čomu má najvyššie pokrytie indických jazykov spomedzi všetkých ostatných verejne dostupných modelov svojho druhu.

MuRIL bol vytvorený ako open source a je dostupný pre stiahnuť z TensorFlow Hub zadarmo.


Je skvelé vidieť, ako spoločnosti smerujú konverzácie smerom k širšiemu prijatiu rôznych jazykov. Dúfame, že úsilie v tomto smere bude pokračovať aj v iných jazykoch a iných regiónoch.