Google se fokusira na indijske jezike s jednostavnom promjenom jezika u Kartama, dvojezičnim preklopnicima za pretraživanje i više

click fraud protection

Na Google L10n virtualnom događaju, Google je pokazao obnovljeni fokus na indijske jezike s promjenama koje se sviđaju višejezičnim osobama u Indiji.

Indija je zemlja stotinu jezika, mjesto gdje se dijalekt mijenja svakih 100 km. U svijetu tehnologije kojim dominira engleski, ovi lokalni jezici i dijalekti ne mogu pružiti pristup značajnim iskustvima na internetu. Na današnjem virtualnom događaju Google L10n, Google olakšava višejezičnim korisnicima u Indiji obogaćujući doživljaj u Indiji s jednostavnim mijenjanjem jezika za Google pretraživanje, boljim dvojezičnim prikazom rezultata u Google pretraživanju, jednostavnim mijenjanjem jezika u Google kartama, pomoć za domaću zadaću na hindskom putem Google Lensa i višejezični AI model pod nazivom MuRIL kako bi računala lakše razumjela različite ljudski jezik.

Pozadina

Prije nego što prijeđemo na najave, evo pozadine za objašnjenje konteksta našoj međunarodnoj publici. A veliki dio Indije je dvojezičan i višejezičan, pri čemu je engleski prvi jezik samo 0,02% ogromne indijske populacije od preko 1,2 milijarde ljudi. Samo 10,6% ukupnog stanovništva govori engleski. Nasuprot tome, 43,63% stanovništva govori hindski kao svoj prvi jezik, dok 57,1% govori hindski općenito (iako je to podijeljeno na različite poddijalekte). Slijede ostali jezici, ali u manjem postotku — bengalski, marati i telugu s 8,9%, 8,2% odnosno 7,8%. Ukratko, fokusiranje tehnologije na engleski kao jedini pristupni medij udaljava tehnologiju od vrlo velikog broja korisnicima koji bi inače ovu tehnologiju smatrali apsolutno korisnom -- i možda im je potrebna čak i više od onih koji već imaju pristup tehnologiji u drugim načine.

Kao što sam primijetio u svom Google Nest Audio recenzija, čak i nešto poput pametnog zvučnika nudi manje upotrebe u višejezičnom okruženju nego u kućanstvu u kojem se govori engleski. Naredbe na mješovitim jezicima se ne prepoznaju tako dobro (poput primarno engleske naredbe s nekim hindskim riječima), a postavljanje dvojezični jezici još uvijek je ograničen na neke kombinacije (Hindu + urdu ili bilo koja dva indijska jezika nisu važeća kombinacija, ali hindski + engleski jest). Situacija je bolja nego što je bila prije nekoliko godina, ali još uvijek postoji pravi put za poboljšanja.

I Google to zna, čineći bazu za današnje najave na događaju L10n (razigrana skraćenica za lokalizaciju, s 10 slova između L i n).

Najave na događaju Google L10n 2020

Jednostavno prebacivanje između rezultata na engleskom i indijskom jeziku u Google pretraživanju

Google je nudio mogućnost brze izmjene rezultata na engleskom i hindskom jeziku putem čipa/kartice u Google pretraživanju, u indijskim državama sa značajnim brojem stanovnika koji govore hindski. Ovaj je čip povećao povećanje broja hindskih upita za 10 puta u Indiji.

Isto se sada proširuje na više indijskih jezika. Google Search će sada također nuditi mogućnost prebacivanja rezultata između engleskog i tamilskog/telugu/bangla/marathi jezika.

Bolje dvojezično pojavljivanje rezultata u Google pretraživanju

Korisnici u Indiji, uključujući i mene, radije upisuju stvari na engleskom čak i ako se rezultati očekuju na lokalnom jeziku. Zapravo, transliteracija hindskog na engleski dovela je do hingliša, koji je hindski napisan engleskim alfabetom.

Google pretraživanje stiže u pomoć takvim dvojezičnim osobama za njihove upite za pretraživanje. Tijekom sljedećeg mjeseca Pretraživanje će početi prikazivati ​​relevantan sadržaj na podržanim indijskim jezicima kada je to prikladno, čak i ako je upit je transliteriran na engleski, što dovodi do dvojezičnih rezultata pretraživanja na više jezika uz engleski kao primarni. Podržani indijski jezici za sekundarno su hindi, bangla, marati, tamilski i telugu.

Jednostavno mijenjanje jezika u Google kartama

Google Assistant i Discover imaju mogućnost prebacivanja na jezik koji se razlikuje od jezika sustava, što korisnicima omogućuje korištenje ovih alata prema njihovim posebnim željama. Više od 50% sadržaja na Google Discoveru gleda se na indijskim jezicima u zemlji, a trećina korisnika Google Assistant koristi ga na indijskom jeziku.

Mogućnost promjene jezika unutar aplikacije sada se proširuje na Google karte. Korisnici sada mogu jednostavno otvoriti aplikaciju, otići u Postavke i dodirnuti "Jezik aplikacije" za odabir do devet jezika. To će korisnicima olakšati traženje mjesta, dobivanje uputa i navigaciju na željenom jeziku za ovaj zadatak.

Pomoć za domaću zadaću na hindskom putem Google objektiva

Google Lens vam to već omogućuje rješavati matematičke probleme pomoći vašem djetetu oko domaće zadaće. Možete snimiti fotografiju matematičkog problema i pokazati vam vodič korak po korak kako ga riješiti. Ali ovaj je vodič prvenstveno prikazan na engleskom jeziku.

Google sada predstavlja hindska rješenja za pomoć pri izradi domaće zadaće u Google Lensu.

MuRIL -- višejezični AI model koji pomaže računalnim sustavima razumjeti indijske jezike u velikom broju

Mnogo razgovora o umjetnoj inteligenciji i strojnom učenju vrti se oko razumijevanja ljudi i ljudskog jezika. Ali kada jezici poprime stotine oblika, ovaj razgovor se pretvara u težak zadatak, veći nego što je već bio. Tu na scenu stupa MuRIL.

Skraćenica za višejezične prikaze za indijske jezike, MuRIL je višejezični model koji se prilagođava više jezika. Među ostalim prednostima, također pruža podršku za transliterirani tekst kao što je pisanje hindskog latinicom. MuRIL je također dobar u određivanju osjećaja transliteriranih rečenica. MuRIL podržava 16 indijskih jezika, kao i engleski, što mu daje najveću pokrivenost za indijske jezike od bilo kojeg drugog javno dostupnog modela te vrste.

MuRIL je otvoren i dostupan je za preuzmite s TensorFlow Huba besplatno.


Sjajno je vidjeti kako tvrtke usmjeravaju razgovore prema širem prihvaćanju različitih jezika. Nadamo se da će se napori u tom smislu nastaviti i za druge jezike i druge regije.