„Google L10n“ virtualiame renginyje „Google“ atnaujino dėmesį į indų kalbas ir padarė pakeitimus, kurie patinka daugiakalbiams Indijoje.
Indija yra šimto kalbų šalis, kur tarmė keičiasi kas 100 km. Technologijų pasaulyje, kuriame dominuoja anglų kalba, šios vietinės kalbos ir dialektai negali suteikti prieigos prie prasmingos patirties internete. Šiandien vykstančiame virtualiame „Google L10n“ renginyje „Google“ padeda įvairiakalbiams naudotojams Indijoje lengviau patirti turtingą patirtį Indijoje su lengvais „Google“ paieškos kalbos perjungimais, geresniu dviejų kalbų rezultatų pateikimu „Google“ paieškoje, lengvu kalbos perjungimu „Google“ žemėlapiuose, namų darbų pagalba hindi kalba naudojant „Google Lens“ ir daugiakalbį AI modelį MuRIL, kad kompiuteriai galėtų lengviau suprasti įvairius dalykus žmonių kalba.
Fonas
Prieš pereinant prie pranešimų, pateikiame šiek tiek pagrindo, kad paaiškintume kontekstą mūsų tarptautinei auditorijai. A didelė Indijos dalis yra dvikalbė ir daugiakalbė, o anglų kalba yra pirmoji kalba tik 0,02 % Indijos gyventojų, kuriuose gyvena daugiau nei 1,2 milijardo žmonių. Tik 10,6% visų gyventojų gali kalbėti angliškai. Priešingai, 43,63 % gyventojų kalba hindi kalba kaip savo gimtąja kalba, o 57,1 % gali kalbėti hindi kalba apskritai (nors tai suskirstyta į skirtingus subdialektus). Toliau pateikiamos kitos kalbos, bet mažesniais procentais - bengalų, maratų ir telugų atitinkamai 8,9%, 8,2% ir 7,8%. Trumpas ir trumpas dalykas yra tai, kad sutelkus technologiją į anglų kalbą kaip vienintelę prieigos terpę, technologija apsaugoma nuo labai daug naudotojai, kuriems ši technologija kitu atveju būtų absoliučiai naudinga ir galbūt jos prireiktų dar labiau nei tiems, kurie jau turi prieigą prie šios technologijos kitose srityse. būdai.
Kaip pažymėjau savo „Google Nest Audio“ apžvalga, net kažkas panašaus į išmanųjį garsiakalbį siūlo mažiau naudoti daugiakalbėje sąrankoje, kaip angliškai kalbančiame namų ūkyje. Komandos mišriomis kalbomis nėra taip gerai atpažįstamos (pvz., daugiausia anglų kalbos komanda su kai kuriais hindi kalbos žodžiais), todėl dvikalbės kalbos vis dar apsiriboja kai kuriais deriniais (Hindi + urdu arba bet kurios dvi indų kalbos nėra tinkamas derinys, bet hindi + anglų kalba yra tinkamas). Situacija geresnė nei buvo prieš keletą metų, tačiau vis dar yra teisingas kelias tobulėti.
Ir „Google“ tai žino, sudarydama pagrindą šios dienos pranešimai L10n renginyje (žaismingas lokalizacijos santrumpa su 10 raidžių tarp L ir n).
Pranešimai „Google L10n Event 2020“.
Lengvas perjungimas tarp anglų ir indų kalbų rezultatų „Google“ paieškoje
Indijos valstijose, kuriose daug hindi kalbančių gyventojų, „Google“ siūlo galimybę greitai keistis rezultatais anglų ir hindi kalbomis naudojant „Google“ paieškos lustą / skirtuką. Šis lustas Indijoje 10 kartų padidino užklausų hindi kalba skaičių.
Tas pats dabar plečiamas į daugiau indų kalbų. „Google“ paieška dabar taip pat pasiūlys galimybę perjungti rezultatus tarp anglų ir tamilų / telugų / bangų / maratų.
Geresnis dvikalbis rezultatas „Google“ paieškoje
Naudotojai iš Indijos, įskaitant mane, nori rašyti dalykus anglų kalba, net jei tikimasi rezultatų vietine kalba. Tiesą sakant, dėl hindi kalbos transliteracijos į anglų kalbą atsirado hinglish, kuri yra hindi kalba, parašyta naudojant anglų abėcėlę.
„Google“ paieška padeda tokiems dvikalbiams jų paieškos užklausoms. Kitą mėnesį Paieškoje bus pradėtas rodyti atitinkamas turinys palaikomomis indų kalbomis, net jei bus pateikta užklausa buvo transliteruotas į anglų kalbą, todėl paieškos rezultatai dvikalbiais ir daugiau kalbų, be anglų kalbos, yra pagrindinė. Palaikomos indų kalbos antrinėje mokykloje yra hindi, bangla, maratų, tamilų ir telugų kalbos.
Lengvas kalbos perjungimas „Google“ žemėlapiuose
„Google Assistant“ ir „Discover“ turi galimybę perjungti į kitą kalbą nei sistema, todėl vartotojai gali naudoti šiuos įrankius pagal savo pageidavimus. Daugiau nei 50 % „Google Discover“ turinio šalyje peržiūrima indų kalbomis, o trečdalis „Google Assistant“ naudotojų jį naudoja indų kalba.
Galimybė keisti kalbas programoje dabar išplečiama ir „Google“ žemėlapiuose. Dabar vartotojai gali tiesiog atidaryti programą, eiti į „Nustatymai“ ir bakstelėti „Programos kalba“, kad pasirinktų iš iki devynių kalbų. Taip naudotojai galės lengviau ieškoti vietų, gauti nuorodų ir naršyti norima kalba atliekant šią užduotį.
Namų darbų pagalba hindi kalba naudojant „Google Lens“.
„Google Lens“ jau leidžia išspręsti matematikos uždavinius padėti jūsų vaikui atlikti namų darbus. Galite nufotografuoti matematikos uždavinį ir jums bus parodytas nuoseklus vadovas, kaip ją išspręsti. Tačiau šis vadovas pirmiausia buvo rodomas anglų kalba.
„Google“ dabar pristato hindi kalbos sprendimus, padedančius atlikti namų darbus sistemoje „Google Lens“.
MuRIL – daugiakalbis AI modelis, padedantis kompiuterių sistemoms suprasti indų kalbas plačiu mastu
Daugelis pokalbių apie AI ir mašininį mokymąsi yra susiję su žmonių ir žmonių kalbos supratimu. Tačiau kai kalbos įgauna šimtą formų, šis pokalbis virsta milžiniška užduotimi, dar labiau nei anksčiau. Čia atsiranda MuRIL.
„MuRIL“ yra daugiakalbių indų kalbų atvaizdų trumpinys, kuris yra daugiakalbis modelis, taikomas skirtingomis kalbomis. Be kitų privalumų, jis taip pat palaiko transliteruotą tekstą, pvz., rašant hindi kalba naudojant romėnišką raštą. MuRIL taip pat gerai nustato transliteruotų sakinių jausmus. „MuRIL“ palaiko 16 indų kalbų ir anglų kalbą, todėl indų kalbų aprėptis yra didžiausia tarp visų kitų viešai prieinamų tokio tipo modelių.
MuRIL buvo sukurtas atvirojo kodo ir yra prieinamas parsisiųsti iš TensorFlow Hub nemokamai.
Puiku matyti, kaip įmonės skatina pokalbius, kad būtų priimtos įvairios kalbos. Tikimės, kad pastangos bus tęsiamos ir kitose kalbose bei kituose regionuose.