Google L10n -virtuaalitapahtumassa Google on osoittanut uudelleen keskittymistä Intian kieliin muutoksilla, jotka vetoavat monikielisiin Intiassa.
Intia on sadan kielen maa, paikka, jossa murre vaihtuu 100 kilometrin välein. Englannin hallitsemassa teknologiamaailmassa nämä paikalliset kielet ja murteet eivät pysty tarjoamaan mielekkäitä kokemuksia Internetissä. Google tekee tänään Google L10n -virtuaalitapahtumassa Intian monikielisten käyttäjien mahdollisuuksia saada rikastuttavia kokemuksia Intiassa. Google-haun helpot kielenvaihdot, parempi kaksikielinen hakutulos Google-haussa, helppo kielenvaihto Google Mapsissa, kotitehtäviä hindin kielellä Google Lensin kautta ja monikielisen tekoälymallin MuRIL: n avulla tietokoneiden on helpompi ymmärtää erilaisia ihmisen kieli.
Tausta
Ennen kuin ryhdymme ilmoituksiin, tässä on taustaa selittääksesi kontekstin kansainväliselle yleisöllemme. A Suuri osa Intiasta on kaksi- ja monikielistäEnglanti on ensimmäinen kieli vain 0,02 prosentilla Intian yli 1,2 miljardin asukkaan väestöstä. Vain 10,6 % koko väestöstä puhuu englantia. Sitä vastoin 43,63 prosenttia väestöstä puhuu hindiä äidinkielenään, kun taas 57,1 prosenttia osaa puhua hindiä kokonaisuudessaan (vaikka tämä on jaettu eri osamurteisiin). Muut kielet seuraavat, mutta pienemmillä prosenttiosuuksilla - bengali, marathi ja telugu 8,9%, 8,2% ja 7,8%. Pitkä ja lyhyt seikka on se, että teknologian keskittyminen englannin kieleen ainoana pääsyvälineenä pitää tekniikan poissa erittäin suuresta määrästä käyttäjät, jotka muuten pitävät tekniikkaa ehdottoman hyödyllisenä – ja ehkä tarvitsevat sitä jopa enemmän kuin ne, joilla jo on pääsy tekniikkaan muissa tavoilla.
Kuten kirjoituksessani totesin Google Nest Audio -arvostelu, jopa älykaiuttimen kaltaiset asiat tarjoavat vähemmän käyttöä monikielisessä asennuksessa kuin englanninkielisessä taloudessa. Sekakielisiä komentoja ei tunnisteta kovin hyvin (kuten pääasiassa englanninkielistä komentoa joissakin hindinkielisissä sanoissa), ja kaksikieliset kielet on edelleen rajoitettu joihinkin yhdistelmiin (Hindi + urdu tai mitkään kaksi intialaista kieltä eivät ole kelvollinen yhdistelmä, mutta hindi + englanti on). Tilanne on parempi kuin muutama vuosi sitten, mutta parannuksia on vielä reilusti.
Ja Google tietää tämän ja muodostaa perustan tämän päivän ilmoitukset L10n-tapahtumassa (leikkisä lyhenne sanoista Localization, 10 kirjainta L: n ja n: n välissä).
Ilmoitukset Google L10n -tapahtumassa 2020
Helppo vaihtaa englannin ja intian kielen tulosten välillä Google-haussa
Google on tarjonnut mahdollisuuden vaihtaa nopeasti englannin- ja hindinkielisten tulosten välillä Google-haun sirun/välilehden avulla Intian osavaltioissa, joissa on huomattava hindinkielinen väestö. Tämä siru lisäsi hindinkielisten kyselyjen kasvua 10-kertaiseksi Intiassa.
Samaa laajennetaan nyt useammille intialaisille kielille. Google-haku tarjoaa nyt mahdollisuuden vaihtaa tuloksia myös englannin ja tamilin/telugun/banglan/marathin välillä.
Parempi kaksikielinen hakutulos Google-haussa
Intialaiset käyttäjät, minä mukaan lukien, kirjoittavat mieluummin asioita englanniksi, vaikka tuloksia odotettaisiin paikallisella kielellä. Itse asiassa hindin translitterointi englanniksi on johtanut hinglishiin, joka on hindi kirjoitettu englannin aakkosilla.
Google-haku tulee apuun tällaisille kaksikielisille heidän hakukyselyissään. Seuraavan kuukauden aikana Haku alkaa näyttää asiaankuuluvaa sisältöä tuetuilla intialaisilla kielillä tarvittaessa, vaikka kysely olisikin translitteroitu englanniksi, mikä johtaa kaksikielisiin hakutuloksiin useammilla kielillä ensisijaisen englannin lisäksi. Toissijaisen tuetut intialaiset kielet ovat hindi, bangla, marathi, tamili ja telugu.
Helppo kielenvaihto Google Mapsissa
Google Assistant ja Discover voivat vaihtaa eri kielelle kuin järjestelmä, jolloin käyttäjät voivat käyttää näitä työkaluja haluamallaan tavalla. Yli 50 % Google Discoverin sisällöstä katsotaan maassa Intian kielillä, ja kolmannes Google Assistantin käyttäjistä käyttää sitä intialaisella kielellä.
Mahdollisuus vaihtaa kieliä sovelluksen sisällä on nyt laajennettu Google Mapsiin. Käyttäjät voivat nyt yksinkertaisesti avata sovelluksen, siirtyä Asetuksiin ja napauttaa "Sovelluksen kieli" valitakseen jopa yhdeksästä kielestä. Näin käyttäjien on helpompi etsiä paikkoja, saada reittiohjeita ja navigoida haluamallaan kielellä tätä tehtävää varten.
Ohjeet kotitehtäviin hindiksi Google Lensin kautta
Google Lens sallii sen jo nyt ratkaista matemaattisia tehtäviä auttamaan lapsesi läksyissä. Voit ottaa kuvan matemaattisesta tehtävästä ja saada vaiheittaisen oppaan sen ratkaisemiseksi. Mutta tämä opas on esitetty pääasiassa englanniksi.
Google esittelee nyt hindinkielisiä ratkaisuja kotitehtäviin Google Lensissä.
MuRIL – monikielinen tekoälymalli, joka auttaa tietokonejärjestelmiä ymmärtämään intialaisia kieliä laajassa mittakaavassa
Suuri osa tekoälyä ja koneoppimista koskevasta keskustelusta keskittyy ihmisten ja ihmiskielen ymmärtämiseen. Mutta kun kielet ottavat sata muotoa, tästä keskustelusta tulee valtava tehtävä, enemmän kuin se jo oli. Tässä MuRIL tulee mukaan.
Lyhenne sanoista Intian kielten monikieliset esitykset, MuRIL on monikielinen malli, joka skaalautuu eri kielille. Muiden etujen ohella se tukee myös translitteroitua tekstiä, kuten kirjoitettaessa hindiä roomalaisella kirjaimella. MuRIL on myös hyvä määrittämään translitteroitujen lauseiden tunteita. MuRIL tukee 16 intialaista kieltä sekä englantia, mikä antaa sille suurimman kattavuuden intialaisten kielten suhteen kaikkien muiden julkisesti saatavilla olevien mallien joukossa.
MuRIL on tehty avoimeksi lähdekoodiksi ja se on saatavilla lataa TensorFlow Hubista ilmaiseksi.
On hienoa nähdä yritysten ohjaavan keskusteluja eri kielten laajempaan hyväksymiseen. Toivomme, että ponnisteluja jatketaan myös muiden kielten ja muiden alueiden osalta.