Google koncentrējas uz indiešu valodām, izmantojot vienkāršu valodu pārslēgšanu pakalpojumā Maps, bilingvālās meklēšanas pārslēgšanu un daudz ko citu

Google L10n virtuālajā pasākumā Google ir parādījis jaunu uzmanību indiešu valodām ar izmaiņām, kas piesaista daudzvalodīgos Indijā.

Indija ir simts valodu zeme, vieta, kur dialekts mainās ik pēc 100 km. Tehnoloģiju pasaulē, kurā dominē angļu valoda, šīs vietējās valodas un dialekti nespēj nodrošināt piekļuvi nozīmīgai pieredzei internetā. Šodien Google L10n virtuālajā pasākumā Google atvieglo daudzvalodu lietotājiem Indijā gūt bagātinošu pieredzi Indijā. ar vienkāršu valodu pārslēgšanu Google meklēšanai, labāku bilingvālu rezultātu parādīšanu Google meklēšanā, vienkāršu valodu pārslēgšanu pakalpojumā Google Maps, mājasdarbu palīdzība hindi valodā, izmantojot Google Lens un daudzvalodu AI modeli MuRIL, lai datoriem būtu vieglāk saprast dažādus cilvēku valoda.

Fons

Pirms ķerties pie paziņojumiem, šeit ir sniegta informācija, lai izskaidrotu kontekstu mūsu starptautiskajai auditorijai. A liela daļa Indijas ir divvalodu un daudzvalodu, kur angļu valoda ir pirmā valoda tikai 0,02% Indijas plašā iedzīvotāju, kurā ir vairāk nekā 1,2 miljardi cilvēku. Tikai 10,6% no visiem iedzīvotājiem prot runāt angliski. Turpretim 43,63% iedzīvotāju runā hindi kā dzimtā valoda, savukārt 57,1% var runāt hindi valodā kopumā (lai gan tas ir sadalīts dažādos apakšdialektos). Tālāk seko citas valodas, bet mazākā skaitā — bengāļu, maratu un telugu attiecīgi 8,9%, 8,2% un 7,8%. Īsumā ir tas, ka tehnoloģiju fokusēšana uz angļu valodu kā vienīgo piekļuves vidi ļauj tehnoloģiju attālināt no ļoti liela skaita lietotāji, kuriem citādi šī tehnoloģija būtu absolūti noderīga — un, iespējams, tā ir vajadzīga pat vairāk nekā tiem, kuriem jau ir piekļuve tehnoloģijām citās veidus.

Kā es atzīmēju savā Google Nest Audio apskats, pat kaut kas līdzīgs viedajam skaļrunim daudzvalodu iestatījumos ir mazāk lietojams kā angliski runājošā mājsaimniecībā. Komandas jauktajās valodās netiek tik labi atpazītas (piemēram, komanda galvenokārt angļu valodā ar dažiem hindi vārdiem), un bilingvālās valodas joprojām ir ierobežotas ar dažām kombinācijām (Hindi + urdu vai jebkuras divas indiešu valodas nav derīga kombinācija, bet hindi + angļu valoda ir derīga kombinācija). Situācija ir labāka par to, kāda tā bija pirms dažiem īsiem gadiem, taču joprojām ir ejams taisnīgs ceļš uz uzlabojumiem.

Un Google to zina, veidojot pamatu šodienas paziņojumi L10n pasākumā (rotaļīgs saīsinājums vārdam lokalizācija, ar 10 burtiem starp L un n).

Paziņojumi Google L10n pasākumā 2020

Ērta pārslēgšanās starp rezultātiem angļu un indiešu valodā Google meklēšanā

Google piedāvā iespēju ātri apmainīties starp rezultātiem angļu un hindi valodās, izmantojot Google meklēšanas mikroshēmu/cilni Indijas štatos ar ievērojamu hindi valodā runājošo iedzīvotāju skaitu. Šī mikroshēma Indijā 10 reizes palielināja vaicājumu skaitu hindi valodā.

Tas pats tagad tiek paplašināts uz vairākām indiešu valodām. Google meklēšana tagad piedāvās iespēju pārslēgt rezultātus arī starp angļu un tamilu/telugu/banglu/maratu valodu.

Labāka divvalodu rezultātu parādīšanās Google meklēšanā

Lietotāji Indijā, arī es, dod priekšroku rakstīt tekstu angļu valodā, pat ja rezultāti tiek gaidīti vietējā valodā. Faktiski hindi valodas transliterācija angļu valodā ir izraisījusi hinglish, kas ir hindi valoda, kas rakstīta ar angļu alfabētu.

Google meklēšana nāk palīgā šādiem bilingvāliem viņu meklēšanas vaicājumiem. Nākamā mēneša laikā pakalpojumā Meklēšana tiks rādīts atbilstošs saturs atbalstītajās Indijas valodās, ja tas būs piemērots, pat ja vaicājumā ir ir transliterēts angļu valodā, tādējādi radot bilingvālus meklēšanas rezultātus vairākās valodās, papildus angļu valodai kā primārajai. Atbalstītās indiešu valodas sekundārajā programmā ir hindi, bangu, maratu, tamilu un telugu.

Vienkārša valodas maiņa pakalpojumā Google Maps

Google palīgam un Discover ir iespēja pārslēgties uz citu valodu, kas atšķiras no sistēmas, ļaujot lietotājiem izmantot šos rīkus atbilstoši savām vēlmēm. Vairāk nekā 50% Google Discover satura šajā valstī tiek skatīti indiešu valodās, un trešā daļa Google Assistant lietotāju to izmanto indiešu valodā.

Iespēja mainīt valodas lietotnē tagad tiek paplašināta arī pakalpojumā Google Maps. Lietotāji tagad var vienkārši atvērt lietotni, doties uz sadaļu Iestatījumi un pieskarties “Lietotnes valoda”, lai atlasītu no līdz pat deviņām valodām. Tas lietotājiem atvieglos vietu meklēšanu, norādes un navigāciju šim uzdevumam izvēlētajā valodā.

Palīdzība mājas darbos hindi valodā, izmantojot Google Lens

Google Lens jau ļauj to darīt atrisināt matemātikas uzdevumus lai palīdzētu bērnam pildīt mājasdarbus. Varat nofotografēt matemātikas uzdevumu un parādīt soli pa solim norādījumus par to, kā to atrisināt. Taču šī rokasgrāmata galvenokārt ir parādīta angļu valodā.

Google tagad ievieš hindi valodas risinājumus mājasdarbu palīdzībai pakalpojumā Google Lens.

MuRIL — daudzvalodu AI modelis, kas palīdz datorsistēmām izprast Indijas valodas plašā mērogā

Liela daļa sarunu par AI un mašīnmācību ir vērsta uz cilvēku un cilvēku valodas izpratni. Bet, kad valodām ir simts formas, šī saruna kļūst par milzīgu uzdevumu, vairāk nekā tas jau bija. Šeit parādās MuRIL.

Saīsinājums no daudzvalodu attēlojumiem indiešu valodām, MuRIL ir daudzvalodu modelis, ko var izmantot dažādās valodās. Papildus citām priekšrocībām tas nodrošina arī atbalstu transliterētam tekstam, piemēram, rakstot hindi, izmantojot romiešu rakstību. MuRIL labi spēj arī noteikt transliterēto teikumu noskaņojumu. MuRIL atbalsta 16 indiešu valodas, kā arī angļu valodu, nodrošinot lielāko Indijas valodu pārklājumu starp visiem citiem publiski pieejamiem šāda veida modeļiem.

MuRIL ir padarīts par atvērtā koda versiju un ir pieejams lejupielādēt no TensorFlow Hub par brīvu.


Ir lieliski redzēt, ka uzņēmumi virza sarunas uz dažādu valodu plašāku pieņemšanu. Mēs ceram, ka centieni turpināsies arī citās valodās un citos reģionos.