Google fokuserer på indiske språk med enkel språkbytte i Maps, tospråklige søkebrytere og mer

På det virtuelle Google L10n-arrangementet har Google vist fornyet fokus på indiske språk med endringer som appellerer til flerspråklige i India.

India er landet med hundre språk, et sted hvor dialekten endres hver 100 km. I en teknologisk verden dominert av engelsk, finner disse lokale språkene og dialektene seg ute av stand til å gi tilgang til meningsfulle opplevelser på Internett. På det virtuelle Google L10n-arrangementet i dag gjør Google det enklere for flerspråklige brukere i India å få berikende opplevelser i India med enkle språkvekslinger for Google Søk, bedre tospråklig resultatvisning i Google Søk, enkel språkbytte i Google Maps, leksehjelp på hindi gjennom Google Lens, og en flerspråklig AI-modell kalt MuRIL for å gjøre det enklere for datamaskiner å forstå ulike menneskelig språk.

Bakgrunn

Før vi kommer til kunngjøringene, her er litt bakgrunn for å forklare konteksten for vårt internasjonale publikum. EN stor del av India er tospråklig og flerspråklig, med engelsk som førstespråket til bare 0,02 % av Indias enorme befolkning på over 1,2 milliarder mennesker. Bare 10,6 % av den totale befolkningen kan engelsk. Derimot snakker 43,63% av befolkningen hindi som sitt første språk, mens 57,1% kan snakke hindi totalt sett (selv om dette er delt inn i forskjellige underdialekter). Andre språk følger, men i mindre prosentandeler - Bengali, Marathi og Telugu på henholdsvis 8,9 %, 8,2 % og 7,8 %. Det lange og korte med det er at fokusering av teknologi rundt engelsk som eneste tilgangsmedium holder teknologien unna et veldig stort antall brukere som ellers ville finne teknologien absolutt nyttig -- og kanskje trenger den enda mer enn de som allerede har tilgang til teknologien i andre måter.

Som jeg noterte i min Google Nest Audio anmeldelse, til og med noe som en smart høyttaler gir mindre bruk i et flerspråklig oppsett som det ville gjort i en engelsktalende husholdning. Kommandoer på blandede språk gjenkjennes ikke så godt (som en primært engelsk kommando med noen hindi-ord), og oppsett tospråklige språk er fortsatt begrenset til noen kombinasjoner (Hindi + urdu, eller to indiske språk er ikke en gyldig kombinasjon, men hindi + engelsk er det). Situasjonen er bedre enn for noen få år siden, men det er fortsatt en god vei å gå for forbedringer.

Og Google vet dette, og danner grunnlaget for dagens kunngjøringer på L10n-arrangementet (en leken forkortelse for Localization, med 10 bokstaver mellom L og n).

Kunngjøringer på Google L10n Event 2020

Enkelt å veksle mellom engelske og indiske språkresultater i Google Søk

Google har tilbudt muligheten til å raskt bytte mellom resultater på engelsk og hindi gjennom en brikke/fane i Google Søk, i indiske stater med en betydelig hinditalende befolkning. Denne brikken økte økningen i hindi-søk med 10 ganger i India.

Det samme utvides nå til flere indiske språk. Google Søk vil nå tilby muligheten til å veksle resultater mellom engelsk og tamil/telugu/bangla/marathi også.

Bedre tospråklig resultat i Google Søk

Brukere i India, inkludert meg selv, foretrekker å skrive ting på engelsk selv om resultatene forventes på et lokalt språk. Faktisk har translitterasjon hindi til engelsk gitt opphav til Hinglish, som er hindi skrevet med det engelske alfabetet.

Google Søk kommer til unnsetning for slike tospråklige for deres søk. I løpet av den neste måneden vil Search begynne å vise relevant innhold på støttede indiske språk når det passer, selv om søket har blitt translitterert til engelsk, noe som gir opphav til tospråklige søkeresultater på flere språk i tillegg til engelsk som primært. Støttede indiske språk for sekundært er hindi, bangla, marathi, tamil og telugu.

Enkel språkbytte i Google Maps

Google Assistant og Discover har muligheten til å bytte til et annet språk enn systemet, slik at brukerne kan bruke disse verktøyene i deres spesifikke preferanser. Mer enn 50 % av innholdet i Google Discover blir sett på indiske språk i landet, og en tredjedel av Google Assistant-brukerne bruker det på et indisk språk.

Muligheten til å endre språk i appen utvides nå til Google Maps. Brukere kan nå ganske enkelt åpne appen, gå til Innstillinger og trykke på "Appspråk" for å velge mellom opptil ni språk. Dette vil gjøre det enklere for brukere å søke etter steder, få veibeskrivelser og navigere rundt på deres foretrukne språk for denne oppgaven.

Leksehjelp på hindi gjennom Google Lens

Google Lens lar deg allerede løse matematiske problemer for å hjelpe til med leksene til barnet ditt. Du kan ta et bilde av et matematisk problem, og få vist en trinn-for-trinn-guide for hvordan du løser det. Men denne veiledningen har først og fremst blitt vist på engelsk.

Google introduserer nå hindiløsninger for leksehjelp i Google Lens.

MuRIL - den flerspråklige AI-modellen for å hjelpe datasystemer å forstå indiske språk i stor skala

Mye av samtalen rundt AI og maskinlæring dreier seg om å forstå mennesker og menneskelig språk. Men når språk tar hundre former, blir denne samtalen en formidabel oppgave, mer enn den allerede var. Det er her MuRIL kommer inn.

MuRIL er en forkortelse for Multilingual Represtantions for Indian Languages, og er en flerspråklig modell som skaleres på tvers av språk. Blant andre fordeler gir den også støtte for translitterert tekst, for eksempel når du skriver hindi ved å bruke det romerske skriftet. MuRIL er også flink til å bestemme følelsene til translittererte setninger. MuRIL støtter 16 indiske språk så vel som engelsk, og gir den den høyeste dekningen for indiske språk blant alle andre offentlig tilgjengelige modeller av sitt slag.

MuRIL er gjort åpen kildekode og er tilgjengelig for last ned fra TensorFlow Hub gratis.


Det er flott å se selskaper styre samtaler mot bredere aksept for ulike språk. Vi håper innsatsen fortsetter på dette området også for andre språk og andre regioner.