Стално слушање Хотворд Рецогнитион без трошења струје могло би ускоро доћи у Андроид апликације са ТрулиХандсфрее

click fraud protection

Најновија верзија Сенсори-јевог ТрулиХандсФрее, вишеплатформског пакета за препознавање гласа за иОС и Андроид, може се похвалити драматично смањеном потрошњом енергије.

Да ли сте се икада запитали како паметни телефони као што је Хуавеи Мате 9 реагују Амазон Алека и Гоогле помоћник команде („Алека“, „ОК, Гоогле“) чак и када је екран искључен и закључан? То је захваљујући хардверској компоненти која се зове ДСП, или процесор дигиталних сигнала, наменском аудио чипу који се бави детекцијом фразе мале снаге, увек укљученим (и другим задацима). То је суштина функционалности популарних гласовних асистената. Компанија Сенсори са седиштем у Силицијумској долини каже да њена софтверска алтернатива, ТрулиХандсфрее, даје ДСП-овима да остваре свој новац.

ТрулиХандсФрее, за који компанија тврди да је „најраспрострањенији“ механизам за препознавање говора на свету, је будна реч и пакет за препознавање говора дизајниран да подржи препознавање гласа мале снаге у апликацијама на Андроид, иОС и другим платформама. Сензори каже да је софтвер „реконструисан“ за повећану прецизност, мању потрошњу енергије и проширену подршку за уређаје.

„Хандс-фрее операција за контролу гласом постала је норма, а програмери апликација сада желе да креирају речи за буђење без употребе руку за своје апликације,“ рекао је Тодд Мозер, извршни директор компаније Сенсори, у изјави.

Развој новог и побољшаног ТрулиХандсфрее-а почео је 2017. Сенсори се удружио са произвођачем чипова Куалцомм-ом и АРМ-ом како би открио како да смање потрошњу енергије за буђење речи гласовног помоћника. Примењује три технике:

  • Сенсори-јева „мало-велика“ функција сталног слушања користи мали модел препознавања гласа да идентификује потенцијалне будне речи и поново потврди те будне речи на великом моделу. Нема захтевне захтеве за напајањем, али је прецизнији без мало веће потрошње енергије.
  • Слагање оквира, метода обуке неуронске мреже која води ка прецизнијим моделима и бржем декодирању, прекида одређене будне речи МИПС функција обраде модела (милион инструкција у секунди, мера перформанси обраде) на пола без утицаја тачност.
  • Мултитхреадинг омогућава ефикаснију обраду препознавања говора и побољшава време извршења за веће моделе речи у будном стању.

Сенсори каже да побољшања заједно смањују потрошњу енергије у мобилним апликацијама за више од 80%, што је једнако 200 мАх за 12-часовни дан.

Ако сте користили најновију верзију апликације за навигацију Вазе, већ сте видели нови ТрулиХандсфрее у акцији. „Недавно смо помогли Гоогле-овом Вазе-у да прихвати гласовне команде без употребе руку тако што смо им обезбедили Сенсори-јеву „ОК Вазе“ реч за буђење која се покреће када је апликација отворена“, рекао је господин Мозер. „Са претходним верзијама ТрулиХандсфрее-а, наш увек укључени механизам за буђење слуша реч за буђење ОК Вазе током кратког путовање би имало минималан утицај на батерију паметног телефона, али за дужа путовања, била је пожељна ефикаснија – па смо креирали то."

Најновији ТрулиХандсфрее се испоручује са подршком за неколико типова опција за буђење, укључујући фиксне речи и кориснички дефинисане речи за буђење. Ваке ворд модели за Алека, Сири, Гоогле Ассистант, Мицрософт Цортана и системе од Баиду, Алибаба и Тенцент. Вишеструко препознавање речи и подршка за више језика укључујући енглески, холандски, француски, италијански, јапански, шпански и турски.

Сенсори каже да ће ажурирани СДК за Андроид и иОС бити представљен пре краја другог квартала 2018.