Google se zaměřuje na indické jazyky se snadným přepínáním jazyků v Mapách, dvojjazyčnými přepínači vyhledávání a dalšími funkcemi

click fraud protection

Na virtuální akci Google L10n ukázal Google obnovené zaměření na indické jazyky se změnami, které oslovují vícejazyčné v Indii.

Indie je země stovky jazyků, místo, kde se dialekt mění každých 100 km. V technologickém světě, kterému dominuje angličtina, tyto místní jazyky a dialekty nejsou schopny poskytnout přístup ke smysluplným zážitkům na internetu. Na dnešní virtuální akci Google L10n Google usnadňuje vícejazyčným uživatelům v Indii obohacující zážitky v Indii se snadným přepínáním jazyka pro Vyhledávání Google, lepším dvojjazyčným zobrazením výsledků ve Vyhledávání Google, snadným přepínáním jazyka v Mapách Google, pomoc s domácími úkoly v hindštině prostřednictvím Google Lens a vícejazyčný model umělé inteligence nazvaný MuRIL, který počítačům usnadňuje porozumění různým lidský jazyk.

Pozadí

Než se dostaneme k oznámením, zde je několik pozadí pro vysvětlení kontextu našemu mezinárodnímu publiku. A velká část Indie je dvojjazyčná a vícejazyčná, přičemž angličtina je prvním jazykem pouze 0,02 % obrovské indické populace s více než 1,2 miliardami lidí. Pouze 10,6 % celkové populace umí mluvit anglicky. V kontrastu, 43,63 % populace mluví hindsky jako jejich první jazyk, zatímco 57,1 % může mluvit hindsky celkově (ačkoli toto je rozděleno do různých sub-dialektů). Další jazyky následují, ale v menším procentu — bengálština, maráthština a telugština v 8,9 %, 8,2 % a 7,8 %. Dlouhé a krátké je, že zaměření technologie na angličtinu jako jediné přístupové médium brání technologii daleko od velkého počtu uživatelé, kteří by jinak považovali tuto technologii za naprosto užitečnou – a možná ji potřebují ještě více než ti, kteří již mají přístup k technologii v jiných způsoby.

Jak jsem poznamenal ve svém Recenze Google Nest Audio, dokonce i něco jako chytrý reproduktor nabízí méně použití ve vícejazyčném nastavení, než by tomu bylo v anglicky mluvící domácnosti. Příkazy ve smíšených jazycích nejsou tak dobře rozpoznávány (jako primárně anglický příkaz s některými hindskými slovy) a nastavení bilingvních jazyků je stále omezeno na některé kombinace (Hindština + urdština nebo jakékoli dva indické jazyky nejsou platnou kombinací, ale hindština + angličtina ano). Situace je lepší než to, co bylo před několika lety, ale stále existuje slušná cesta ke zlepšení.

A Google to ví a tvoří základ pro dnešní oznámení na akci L10n (hravá zkratka pro lokalizaci, s 10 písmeny mezi L a n).

Oznámení na Google L10n Event 2020

Snadné přepínání mezi výsledky v angličtině a indickém jazyce ve Vyhledávání Google

Google nabízí možnost rychlého přepínání mezi výsledky v angličtině a hindštině prostřednictvím čipu/karty ve Vyhledávání Google v indických státech s významnou hindsky mluvící populací. Tento čip 10x zvýšil nárůst hindských dotazů v Indii.

Totéž se nyní rozšiřuje do více indických jazyků. Vyhledávání Google nyní nabídne možnost přepínat výsledky také mezi angličtinou a tamilštinou/telugštinou/banglou/maráthštinou.

Lepší dvojjazyčné zobrazení výsledků ve Vyhledávání Google

Uživatelé v Indii, včetně mě, dávají přednost psaní věcí v angličtině, i když se výsledky očekávají v místním jazyce. Ve skutečnosti přepis hindštiny do angličtiny dal vzniknout hinglish, což je hindština psaná anglickou abecedou.

Vyhledávání Google přichází na pomoc těmto bilingvistům pro jejich vyhledávací dotazy. Během příštího měsíce začne Vyhledávání podle potřeby zobrazovat relevantní obsah v podporovaných indických jazycích, a to i v případě, že dotaz ano byly přepsány do angličtiny, což dalo vzniknout dvojjazyčným výsledkům vyhledávání ve více jazycích kromě angličtiny jako primární. Podporované indické jazyky pro sekundární jazyk jsou hindština, bengálština, maráthština, tamilština a telugština.

Snadné přepínání jazyka v Mapách Google

Asistent Google a Discover mají možnost přepnout na jiný jazyk než systém, což uživatelům umožňuje používat tyto nástroje podle jejich specifických preferencí. Více než 50 % obsahu v Google Discover je v zemi zobrazeno v indických jazycích a třetina uživatelů Google Assistant jej používá v indickém jazyce.

Možnost změny jazyků v rámci aplikace se nyní rozšiřuje i na Mapy Google. Uživatelé nyní mohou jednoduše otevřít aplikaci, přejít do Nastavení a klepnutím na „Jazyk aplikace“ si vybrat až z devíti jazyků. Uživatelé tak budou snáze vyhledávat místa, získávat trasy a navigovat v jejich preferovaném jazyce pro tento úkol.

Pomoc s domácími úkoly v hindštině prostřednictvím Google Lens

Google Lens vám to již umožňuje řešit matematické úlohy pomoci s domácími úkoly vašeho dítěte. Můžete vyfotografovat matematický problém a zobrazí se vám podrobný návod, jak jej vyřešit. Tato příručka však byla primárně zobrazena v angličtině.

Google nyní zavádí hindská řešení pro pomoc s domácími úkoly v Google Lens.

MuRIL – vícejazyčný model umělé inteligence, který pomáhá počítačovým systémům porozumět indickým jazykům ve velkém měřítku

Mnoho konverzací o umělé inteligenci a strojovém učení se soustředí na porozumění lidem a lidské řeči. Ale když jazyky nabývají sto podob, tato konverzace se zvrhne v impozantní úkol, ještě větší, než tomu bylo doposud. Zde přichází na řadu MuRIL.

MuRIL je zkratka pro Multilingual Represtantions for Indian Languages ​​a je vícejazyčný model, který se škáluje napříč jazyky. Kromě jiných výhod poskytuje také podporu pro přepsaný text, například při psaní hindštiny pomocí latinského písma. MuRIL je také dobrý při určování sentimentu transliterovaných vět. MuRIL podporuje 16 indických jazyků a také angličtinu, což mu poskytuje nejvyšší pokrytí indických jazyků mezi všemi ostatními veřejně dostupnými modely svého druhu.

MuRIL byl vytvořen jako open source a je dostupný pro stáhnout z TensorFlow Hub zdarma.


Je skvělé vidět, jak společnosti směřují konverzace k širšímu přijetí různých jazyků. Doufáme, že úsilí v tomto směru bude pokračovat i pro další jazyky a další regiony.