La evenimentul virtual Google L10n, Google a arătat o atenție reînnoită asupra limbilor indice, cu modificări care atrag multilingvii din India.
India este țara a o sută de limbi, un loc în care dialectul se schimbă la fiecare 100 km. Într-o lume tehnologică dominată de engleză, aceste limbi și dialecte locale nu pot oferi acces la experiențe semnificative pe Internet. La evenimentul virtual Google L10n de astăzi, Google facilitează utilizatorilor multilingvi din India să aibă experiențe îmbogățitoare în India cu comutare ușoară de limbă pentru Căutarea Google, rezultate bilingve mai bune în Căutarea Google, comutare ușoară de limbă în Hărți Google, ajutor pentru teme în hindi prin Google Lens și un model AI multilingv numit MuRIL pentru a facilita computerele să înțeleagă diverse limbajul uman.
fundal
Înainte de a ajunge la anunțuri, iată câteva elemente de bază pentru a explica contextul publicului nostru internațional. A o mare parte din India este bilingvă și multilingvă, engleza fiind prima limbă a doar 0,02% din populația imensă a Indiei, de peste 1,2 miliarde de oameni. Doar 10,6% din populația totală poate vorbi engleza. În schimb, 43,63% din populație vorbește hindi ca primă limbă, în timp ce 57,1% pot vorbi hindi în general (deși aceasta este împărțită în diferite sub-dialecte). Urmează și alte limbi, dar în procente mai mici - bengali, marathi și telugu în 8,9%, 8,2% și, respectiv, 7,8%. Pe scurt și pe scurt, concentrarea tehnologiei în jurul limbii engleze, ca singurul mijloc de acces, ține tehnologia departe de un număr foarte mare de utilizatorii care altfel ar considera tehnologia absolut utilă - și poate au nevoie de ea chiar mai mult decât cei care au deja acces la tehnologie în alte moduri.
După cum am notat în meu Recenzie Google Nest Audio, chiar și ceva de genul unui difuzor inteligent oferă mai puțină utilizare într-o configurație multilingvă, așa cum ar fi într-o gospodărie vorbitoare de engleză. Comenzile în limbi mixte nu sunt recunoscute atât de bine (cum ar fi o comandă în principal în limba engleză cu unele cuvinte hindi) și configurarea limbile bilingve este încă limitată la unele combinații (Hindi + Urdu, sau oricare două limbi indice nu sunt o combinație validă, dar Hindi + Engleză este). Situația este mai bună decât era în urmă cu câțiva ani, dar mai este o cale corectă de parcurs pentru îmbunătățiri.
Și Google știe acest lucru, formând baza pentru anunțurile de astăzi la evenimentul L10n (o abreviere jucăușă pentru Localizare, cu 10 litere între L și n).
Anunțuri la Google L10n Event 2020
Comutare ușoară între rezultatele în limba engleză și cea indiană în Căutarea Google
Google a oferit posibilitatea de a schimba rapid rezultatele în engleză și hindi printr-un cip/filă în Căutarea Google, în statele indiene cu o populație semnificativă vorbitoare de hindi. Acest cip a crescut de 10 ori creșterea interogărilor hindi în India.
Același lucru este acum extins la mai multe limbi indice. Căutarea Google va oferi acum posibilitatea de a comuta rezultatele între engleză și tamilă/telugu/bangla/marathi.
O mai bună apariție a rezultatelor bilingve în Căutarea Google
Utilizatorii din India, inclusiv eu, preferă să scrie lucrurile în engleză, chiar dacă rezultatele sunt așteptate într-o limbă locală. De fapt, transliterarea hindi în engleză a dat naștere la higlish, care este hindi scris cu alfabetul englez.
Căutarea Google vine în ajutor pentru astfel de bilingvi pentru interogările lor de căutare. Pe parcursul lunii următoare, Căutarea va începe să afișeze conținut relevant în limbile indiene acceptate, atunci când este cazul, chiar dacă interogarea a făcut-o a fost transliterată în engleză, dând naștere la rezultate de căutare bilingve în mai multe limbi, în plus față de engleza ca principală. Limbile indiene acceptate pentru ciclul secundar sunt hindi, bangla, marathi, tamil și telugu.
Comutare ușoară de limbă în Google Maps
Asistentul Google și Discover au capacitatea de a comuta într-o altă limbă decât sistemul, permițând utilizatorilor să folosească aceste instrumente după preferințele lor specifice. Peste 50% din conținutul din Google Discover este vizualizat în limbile indiene din țară, iar o treime dintre utilizatorii Asistentului Google îl folosesc într-o limbă indiană.
Capacitatea de a schimba limbile în cadrul aplicației este acum extinsă la Google Maps. Utilizatorii pot să deschidă acum aplicația, să acceseze Setări și să atingă „Limba aplicației” pentru a selecta din până la nouă limbi. Acest lucru va face mai ușor pentru utilizatori să caute locuri, să obțină indicații de orientare și să navigheze în limba preferată pentru această sarcină.
Ajutor pentru teme în hindi prin Google Lens
Google Lens vă permite deja acest lucru rezolva probleme de matematica pentru a ajuta copilul la temele. Puteți să faceți o fotografie a unei probleme de matematică și să vi se arate un ghid pas cu pas despre cum să o rezolvați. Dar acest ghid a fost afișat în principal în limba engleză.
Google introduce acum soluții hindi pentru ajutor pentru teme în Google Lens.
MuRIL -- modelul AI multilingv pentru a ajuta sistemele informatice să înțeleagă limbile indiene la scară
O mare parte din conversația despre AI și învățarea automată se concentrează pe înțelegerea oamenilor și a limbajului uman. Dar când limbile iau o sută de forme, această conversație se transformă într-o sarcină formidabilă, mai mult decât era deja. Aici intervine MuRIL.
Prescurtare pentru Reprezentări multilingve pentru limbile indiene, MuRIL este un model multilingv care se extinde în diferite limbi. Printre alte beneficii, oferă și suport pentru text transliterat, cum ar fi atunci când scrieți hindi folosind grafia romană. MuRIL este, de asemenea, bun la determinarea sentimentului propozițiilor transliterate. MuRIL acceptă 16 limbi indiene, precum și engleza, oferindu-i cea mai mare acoperire pentru limbile indiene dintre orice alt model disponibil public de acest gen.
MuRIL a fost făcut open-source și este disponibil pentru descărcați de pe TensorFlow Hub gratuit.
Este grozav să vezi că companiile conduc conversațiile către o acceptare mai largă a diverselor limbi. Sperăm să continue eforturile în acest sens și pentru alte limbi și alte regiuni.