Google fokuserer på indiske sprog med nem sprogskifte i Maps, tosprogede søgeskift og mere

Ved den virtuelle Google L10n-begivenhed har Google vist fornyet fokus på indiske sprog med ændringer, der appellerer til flersprogede i Indien.

Indien er de hundrede sprogs land, et sted hvor dialekten skifter hver 100 km. I en teknologiverden domineret af engelsk, finder disse lokale sprog og dialekter sig ude af stand til at give adgang til meningsfulde oplevelser på internettet. Ved Google L10n virtuelle begivenhed i dag gør Google det nemmere for flersprogede brugere i Indien at få berigende oplevelser i Indien med nemme sprogskift til Google Søgning, bedre visning af tosprogede resultater i Google Søgning, let sprogskift i Google Maps, lektiehjælp på hindi gennem Google Lens og en flersproget kunstig intelligens-model kaldet MuRIL for at gøre det nemmere for computere at forstå forskellige menneskeligt sprog.

Baggrund

Inden vi kommer til meddelelserne, er her lidt baggrund for at forklare konteksten for vores internationale publikum. EN en stor del af Indien er tosproget og flersproget

, hvor engelsk er det første sprog for kun 0,02 % af Indiens store befolkning på over 1,2 milliarder mennesker. Kun 10,6% af den samlede befolkning kan engelsk. I modsætning hertil taler 43,63% af befolkningen hindi som deres første sprog, mens 57,1% kan tale hindi generelt (selvom dette er opdelt i forskellige underdialekter). Andre sprog følger, men i mindre procenter - Bengali, Marathi og Telugu i henholdsvis 8,9 %, 8,2 % og 7,8 %. Det lange og korte af det er, at fokusering af teknologi omkring engelsk som det eneste adgangsmedie, holder teknologien væk fra et meget stort antal brugere, der ellers ville finde teknologien absolut nyttig - og måske har brug for den endnu mere end dem, der allerede har adgang til teknologien i andre måder.

Som jeg bemærkede i min Google Nest Audio anmeldelse, selv noget som en smart højttaler giver mindre brug i en flersproget opsætning, som den ville i en engelsktalende husstand. Kommandoer på blandede sprog genkendes ikke så godt (som en primært engelsk kommando med nogle hindiord), og opsætning tosprogede sprog er stadig begrænset til nogle kombinationer (Hindi + Urdu eller to af de indiske sprog er ikke en gyldig kombination, men hindi + engelsk er det). Situationen er bedre, end den var for nogle få år siden, men der er stadig en rimelig vej til forbedringer.

Og Google ved dette og danner grundlaget for dagens annonceringer ved L10n-arrangementet (en legende forkortelse for Localization, med 10 bogstaver mellem L og n).

Meddelelser ved Google L10n Event 2020

Nemt at skifte mellem engelske og indiske sprogresultater i Google Søgning

Google har tilbudt muligheden for hurtigt at skifte mellem resultater på engelsk og hindi gennem en chip/fane i Google Søgning i indiske stater med en betydelig hinditalende befolkning. Denne chip øgede stigningen i hindi-forespørgsler med 10x i Indien.

Det samme bliver nu udvidet til flere indiske sprog. Google Søgning vil nu også tilbyde muligheden for at skifte resultater mellem engelsk og tamil/telugu/bangla/marathi.

Bedre visning af tosprogede resultater i Google Søgning

Brugere i Indien, inklusive mig selv, foretrækker at skrive ting på engelsk, selvom resultaterne forventes på et lokalt sprog. Faktisk har translitteration af hindi til engelsk givet anledning til Hinglish, som er hindi skrevet med det engelske alfabet.

Google Søgning kommer sådanne tosprogede til undsætning for deres søgeforespørgsler. I løbet af den næste måned vil Søgning begynde at vise relevant indhold på understøttede indiske sprog, når det er relevant, selvom forespørgslen har blevet translittereret til engelsk, hvilket giver anledning til tosprogede søgeresultater på tværs af flere sprog ud over engelsk som det primære. Understøttede indiske sprog for det sekundære er hindi, bangla, marathi, tamil og telugu.

Nemt sprogskift i Google Maps

Google Assistant og Discover har mulighed for at skifte til et andet sprog end systemet, hvilket giver brugerne mulighed for at bruge disse værktøjer i deres specifikke præferencer. Mere end 50 % af indholdet i Google Discover ses på indiske sprog i landet, og en tredjedel af Google Assistant-brugere bruger det på et indisk sprog.

Muligheden for at ændre sprog i appen udvides nu til Google Maps. Brugere kan nu blot åbne appen, gå til Indstillinger og trykke på "Appsprog" for at vælge mellem op til ni sprog. Dette vil gøre det nemmere for brugere at søge efter steder, få rutevejledninger og navigere rundt på deres foretrukne sprog til denne opgave.

Lektiehjælp på hindi via Google Lens

Google Lens giver dig allerede mulighed for det løse matematiske problemer at hjælpe med dit barns lektier. Du kan tage et billede af et matematisk problem og få vist en trin-for-trin guide til, hvordan du løser det. Men denne guide er primært blevet vist på engelsk.

Google introducerer nu hindi-løsninger til lektiehjælp i Google Lens.

MuRIL - den flersprogede AI-model, der hjælper computersystemer med at forstå indiske sprog i stor skala

Meget af samtalen omkring kunstig intelligens og maskinlæring drejer sig om forståelse af mennesker og menneskeligt sprog. Men når sprog antager hundrede former, ballonerer denne samtale til en formidabel opgave, mere end den allerede var. Det er her MuRIL kommer ind.

MuRIL er en forkortelse for Multilingual Represtantions for Indian Languages ​​og er en flersproget model, der skaleres på tværs af sprog. Blandt andre fordele giver det også støtte til translittereret tekst, såsom når du skriver hindi ved hjælp af det romerske skrift. MuRIL er også god til at bestemme følelsen af ​​translittererede sætninger. MuRIL understøtter 16 indiske sprog såvel som engelsk, hvilket giver den den højeste dækning for indiske sprog blandt enhver anden offentligt tilgængelig model af sin art.

MuRIL er gjort open source og er tilgængelig for download fra TensorFlow Hub gratis.


Det er fantastisk at se virksomheder styre samtaler i retning af bredere accept af forskellige sprog. Vi håber, at indsatsen fortsætter med dette formål også for andre sprog og andre regioner.