Google keskendub india keeltele tänu lihtsale keelevahetusele Mapsis, kakskeelse otsingu lülitite ja muuga

Google on virtuaalsel üritusel Google L10n näidanud üles uut tähelepanu india keeltele muudatustega, mis meeldivad India mitmekeelsetele inimestele.

India on saja keele maa, koht, kus dialekt muutub iga 100 km järel. Tehnoloogiamaailmas, kus domineerib inglise keel, ei suuda need kohalikud keeled ja dialektid pakkuda Internetis juurdepääsu sisukatele kogemustele. Tänasel Google L10n virtuaalsel üritusel muudab Google Indias elavate mitmekeelsete kasutajate jaoks Indias rikastavate kogemuste saamise lihtsamaks Google'i otsingu lihtsate keelelülitustega, parema kakskeelsete tulemuste kuvamisega Google'i otsingus, lihtsa keelevahetusega Google Mapsis, kodutööde abi hindi keeles Google Lensi ja mitmekeelse AI mudeli MuRIL kaudu, et arvutitel oleks lihtsam mõista erinevaid inimkeel.

Taust

Enne teadaannete juurde asumist on siin taust, et selgitada konteksti meie rahvusvahelisele publikule. A suur osa Indiast on kaks- ja mitmekeelne, kus inglise keel on esimene keel vaid 0,02% India suurest enam kui 1,2 miljardist elanikkonnast. Ainult 10,6% kogu elanikkonnast oskab inglise keelt. Seevastu 43,63% elanikkonnast räägib oma emakeelena hindi keelt, samas kui 57,1% oskab üldiselt hindi keelt (kuigi see on jagatud erinevateks alammurreteks). Järgnevad teised keeled, kuid väiksemates protsentides – bengali, marati ja telugu vastavalt 8,9%, 8,2% ja 7,8%. Pikem ja lühike on see, et tehnoloogia keskendumine inglise keelele kui ainsale juurdepääsukeskkonnale hoiab tehnoloogia eemal väga paljudest kasutajad, kes muidu leiaksid, et tehnoloogia on täiesti kasulik – ja võib-olla vajavad seda isegi rohkem kui need, kellel on juba juurdepääs tehnoloogiale teistes riikides. viise.

Nagu ma märkisin oma Google Nest Audio ülevaade, isegi midagi nutikõlarit pakub mitmekeelses seadistuses vähem kasutust kui inglise keelt kõnelevas majapidamises. Segakeelte käske ei tunta nii hästi ära (nagu peamiselt ingliskeelne käsk mõne hindi sõnaga) ja seadistamine kakskeelsed keeled on siiski piiratud teatud kombinatsioonidega (Hindi + urdu või kaks india keelt ei ole sobiv kombinatsioon, kuid hindi + inglise keel on sobiv kombinatsioon). Olukord on parem kui mõni aasta tagasi, kuid paranduste tegemiseks on veel õiglane tee.

Ja Google teab seda, moodustades selle aluse tänased teated L10n üritusel (Lokaliseerimise mänguline lühend, L ja n vahel on 10 tähte).

Google L10n Event 2020 teated

Lihtne lülituda inglis- ja indiakeelsete tulemuste vahel Google'i otsingus

Google on pakkunud võimalust kiiresti vahetada inglis- ja hindikeelsete tulemuste vahel Google'i otsingu kiibi/vahekaardi kaudu India osariikides, kus on märkimisväärne hindi keelt kõnelev elanikkond. See kiip suurendas Indias hindi päringute arvu 10 korda.

Sama laieneb nüüd rohkematele india keeltele. Google'i otsing pakub nüüd võimalust vahetada tulemusi ka inglise ja tamili/telugu/bangli/marati vahel.

Parem kakskeelne tulemus Google'i otsingus

Indias elavad kasutajad, sealhulgas mina, eelistavad kirjutada asju inglise keeles, isegi kui tulemusi oodatakse kohalikus keeles. Tegelikult on hindi keele translitereerimine inglise keelde tekitanud hinglishi, mis on hindi keeles kirjutatud inglise tähestikuga.

Google'i otsing tuleb sellistele kakskeelsetele inimestele nende otsingupäringute jaoks appi. Järgmise kuu jooksul hakkab otsing näitama asjakohast sisu toetatud India keeltes, kui see on asjakohane, isegi kui päring on seda teinud on translitereeritud inglise keelde, mis toob kaasa kakskeelsed otsingutulemused rohkemates keeltes lisaks inglise keelele kui peamisele keelele. Toetatud India keeled on hindi, bangla, marati, tamili ja telugu.

Lihtne keelevahetus Google Mapsis

Google'i assistendil ja Discoveril on võimalus lülituda süsteemist erinevale keelele, võimaldades kasutajatel kasutada neid tööriistu vastavalt oma eelistustele. Rohkem kui 50% Google Discoveri sisust vaadatakse riigis India keeltes ja kolmandik Google Assistanti kasutajatest kasutab seda India keeles.

Rakenduses keelte muutmise võimalust laiendatakse nüüd ka Google Mapsile. Kasutajad saavad nüüd lihtsalt rakenduse avada, avada seaded ja puudutada valikut "Rakenduse keel", et valida kuni üheksa keele hulgast. See muudab kasutajate jaoks selle ülesande jaoks eelistatud keeles kohtade otsimise, juhiste hankimise ja ringi liikumise lihtsamaks.

Kodutööde abi hindi keeles Google Lensi kaudu

Google Lens juba võimaldab teil seda teha lahendada matemaatikaülesandeid et aidata teie last kodutööde tegemisel. Saate matemaatikaülesandest pildistada ja teile kuvatakse selle lahendamise samm-sammuline juhend. Kuid see juhend on peamiselt kuvatud inglise keeles.

Google tutvustab nüüd Google Lensis kodutööde abistamiseks hindikeelseid lahendusi.

MuRIL – mitmekeelne AI mudel, mis aitab arvutisüsteemidel India keeli ulatuslikult mõista

Suur osa tehisintellekti ja masinõppega seotud vestlustest keskendub inimeste ja inimkeele mõistmisele. Kuid kui keeled võtavad sada vormi, muutub see vestlus tohutuks ülesandeks, veelgi enam, kui see juba oli. Siin tuleb mängu MuRIL.

Lühend sõnadest India keelte mitmekeelsed esitused, MuRIL on mitmekeelne mudel, mis ulatub erinevatesse keeltesse. Muude eeliste hulgas toetab see ka translitereeritud teksti, näiteks hindi kirjutamisel ladina kirja kasutades. MuRIL oskab hästi ka translitereeritud lausete sentimenti määrata. MuRIL toetab 16 India keelt ja inglise keelt, andes sellele kõige suurema katvuse India keelte jaoks kõigi teiste avalikult kättesaadavate mudelite seas.

MuRIL on muudetud avatud lähtekoodiga ja on saadaval laadige alla TensorFlow Hubist tasuta.


Tore on näha, kuidas ettevõtted juhivad vestlusi erinevate keelte laiemale aktsepteerimisele. Loodame, et jõupingutused selle nimel jätkuvad ka teiste keelte ja muude piirkondade jaoks.