Гоогле се фокусира на индијске језике са лаким мењањем језика на Мапама, двојезичним преклопима за претрагу и још много тога

click fraud protection

На виртуелном догађају Гоогле Л10н, Гоогле је показао обновљени фокус на индијске језике са променама које су привлачне вишејезицима у Индији.

Индија је земља стотину језика, место где се дијалект мења сваких 100 километара. У свету технологије којим доминира енглески, ови локални језици и дијалекти нису у стању да обезбеде приступ значајним искуствима на Интернету. На Гоогле Л10н виртуелном догађају данас, Гоогле олакшава вишејезичним корисницима у Индији да имају обогаћујућа искуства у Индији са лаким преклопима језика за Гоогле претрагу, бољим двојезичним приказивањем резултата у Гоогле претрази, лаким мењањем језика у Гоогле мапама, помоћ код домаћег задатка на хиндију преко Гоогле објектива и вишејезичног АИ модела под називом МуРИЛ да би се рачунарима олакшало разумевање различитих људски језик.

Позадина

Пре него што пређемо на најаве, ево неке позадине за објашњење контекста нашој међународној публици. А велики део Индије је двојезичан и вишејезичан, при чему је енглески први језик само 0,02% огромне популације Индије од преко 1,2 милијарде људи. Само 10,6% укупне популације говори енглески. Насупрот томе, 43,63% становништва говори хинди као свој први језик, док 57,1% може да говори хинди у целини (иако је ово подељено на различите поддијалекте). Следе други језици, али у мањим процентима — бенгалски, марати и телугу са 8,9%, 8,2% и 7,8% респективно. Најкраће је да фокусирање технологије на енглески језик као једини приступни медиј држи технологију даље од великог броја корисници који би иначе сматрали да је технологија апсолутно корисна - а можда им је потребна чак и више од оних који већ имају приступ технологији у другим начине.

Као што сам приметио у свом Гоогле Нест Аудио преглед, чак и нешто попут паметног звучника нуди мање употребе у вишејезичном подешавању као што би то било у домаћинству у којем се говори енглески. Команде на мешовитим језицима се не препознају добро (као првенствено енглеска команда са неким хинди речима), а подешавање двојезични језици је и даље ограничен на неке комбинације (Хинди + Урду, или било која два индијска језика нису важећа комбинација, али хинди + енглески јесте). Ситуација је боља него што је била пре неколико година, али још увек постоји прави пут за побољшање.

И Гоогле то зна, формирајући основу за данашње најаве на догађају Л10н (разиграна скраћеница за локализацију, са 10 слова између Л и н).

Најаве на Гоогле Л10н догађају 2020

Лако пребацивање између резултата на енглеском и индијском језику у Гоогле претрази

Гоогле нуди могућност брзог пребацивања између резултата на енглеском и хиндију преко чипа/картице у Гоогле претрази, у индијским државама са значајном популацијом која говори хинди. Овај чип је повећао пораст упита на хиндском језику за 10 пута у Индији.

Исто се сада проширује на више индијских језика. Гоогле претрага ће сада понудити могућност пребацивања резултата између енглеског и тамилског/телугу/бангла/марати.

Бољи двојезични резултати који се појављују у Гоогле претрази

Корисници у Индији, укључујући и мене, радије куцају на енглеском чак и ако се резултати очекују на локалном језику. У ствари, транслитерација хинди на енглески је довела до хинглиша, који је хинди написан енглеским алфабетом.

Гоогле претрага долази у помоћ таквим двојезицима за њихове упите за претрагу. Током следећег месеца, Претрага ће почети да приказује релевантан садржај на подржаним индијским језицима када је то потребно, чак и ако је упит је транслитеровано на енглески, што је довело до двојезичних резултата претраге на више језика поред енглеског као примарног. Подржани индијски језици за секундарни језик су хинди, бангла, марати, тамилски и телугу.

Лако мењање језика у Гоогле мапама

Гоогле Ассистант и Дисцовер имају могућност да се пребаце на језик који није у систему, омогућавајући корисницима да користе ове алате према својим специфичним жељама. Више од 50% садржаја у Гоогле Дисцовер-у се гледа на индијским језицима у земљи, а трећина корисника Гоогле помоћника га користи на индијском језику.

Могућност промене језика унутар апликације сада се проширује на Гоогле мапе. Корисници сада могу једноставно да отворе апликацију, оду у Подешавања и додирну „Језик апликације“ да бирају између до девет језика. Ово ће олакшати корисницима да траже места, добију упутства и навигацију на жељеном језику за овај задатак.

Помоћ за домаћи задатак на хиндију преко Гоогле објектива

Гоогле објектив вам то већ дозвољава решавати математичке задатке да помогнете свом детету у домаћем задатку. Можете да снимите фотографију математичког проблема и да вам се покаже водич корак по корак о томе како да га решите. Али овај водич је првенствено приказан на енглеском.

Гоогле сада уводи решења на хинди за помоћ код домаћих задатака у Гоогле објективу.

МуРИЛ -- вишејезични АИ модел који помаже компјутерским системима да разумеју индијске језике у великом обиму

Велики део разговора око вештачке интелигенције и машинског учења усмерен је на разумевање људи и људског језика. Али када језици поприме стотину облика, овај разговор прерасте у тежак задатак, више него што је већ био. Овде долази МуРИЛ.

Скраћено за Вишејезичне репрезентације за индијске језике, МуРИЛ је вишејезични модел који се прилагођава различитим језицима. Између осталих предности, такође пружа подршку за транслитеровани текст, као што је када се пише на хинди користећи римско писмо. МуРИЛ је такође добар у одређивању сентимента транслитерираних реченица. МуРИЛ подржава 16 индијских језика као и енглески, што му даје највећу покривеност за индијске језике међу било којим другим јавно доступним моделима те врсте.

МуРИЛ је отворен и доступан је за преузмите са ТенсорФлов Хуб-а бесплатно.


Сјајно је видети компаније како усмеравају разговоре ка ширем прихватању различитих језика. Надамо се да ће се напори наставити у том правцу и за друге језике и друге регионе.