Винаги слушащо разпознаване на горещи думи без изтичане на енергия може скоро да дойде в приложенията за Android с TrulyHandsfree

Най-новата версия на TrulyHandsFree на Sensory, междуплатформен пакет за разпознаване на глас за iOS и Android, може да се похвали с драстично намалена консумация на енергия.

Чудили ли сте се как реагират смартфони като Huawei Mate 9 Amazon Alexa и Google Assistant команди ("Alexa", "OK, Google") дори когато екранът е изключен и заключен? Благодарение на хардуерен компонент, наречен DSP или цифров сигнален процесор, специален аудио чип, който се справя с нискоенергийно, винаги включено разпознаване на фрази (и други задачи). Той е в основата на функционалността на популярните гласови асистенти. Базираната в Силициевата долина компания Sensory казва, че нейната софтуерно базирана алтернатива, TrulyHandsfree, дава възможност на DSP да се борят за парите си.

TrulyHandsFree, за който компанията твърди, че е "най-широко разпространеният" двигател за разпознаване на реч в света, е дума за събуждане и пакет за разпознаване на реч, предназначен да поддържа разпознаване на глас с ниска мощност в приложения в Android, iOS и други платформи. Sensory казва, че софтуерът е "преработен" за повишена точност, по-ниска консумация на енергия и разширена поддръжка на устройства.

„Операцията със свободни ръце за гласов контрол се превърна в норма и разработчиците на приложения сега търсят да създадат думи за събуждане със свободни ръце за собствените си приложения,“ каза Тод Мозер, главен изпълнителен директор на Sensory, в изявление.

Разработката на новия и подобрен TrulyHandsfree започна през 2017 г. Sensory се обедини с производителя на чипове Qualcomm и ARM, за да разбере как да намали консумацията на енергия за думите за събуждане на гласовия асистент. Той прилага три техники:

  • Функцията „малко-голямо“ за постоянно слушане на Sensory използва малък модел за разпознаване на глас, за да идентифицира потенциални думи за събуждане и да потвърди отново тези думи за събуждане на голям модел. Той няма високи изисквания към мощността, но е по-точен, без да консумира малко повече енергия.
  • Frame stacking, метод за обучение на невронни мрежи, който води до по-точни модели и по-бързо декодиране, прекъсва определена дума за събуждане MIPS (милион инструкции в секунда, мярка за производителност на обработка) наполовина, без това да се отрази точност.
  • Многопоточността позволява по-ефективна обработка на разпознаването на реч и подобрява времето за изпълнение за по-големи модели на събуждащи думи.

Sensory казва, че заедно подобренията намаляват консумацията на енергия в мобилните приложения с повече от 80%, което се равнява на 200mAh за 12-часов работен ден.

Ако сте използвали най-новата версия на приложението за навигация Waze, вече сте виждали новия TrulyHandsfree в действие. „Наскоро помогнахме на Waze на Google да приема гласови команди със свободни ръце, като им предоставихме думата за събуждане „OK Waze“ на Sensory, която се изпълнява, когато приложението е отворено,“ каза г-н Мозер. „С предишните версии на TrulyHandsfree, нашият винаги включен двигател за събуждащи думи слуша за събуждащата дума OK Waze по време на кратък пътуването би имало минимален ефект върху батерията на смартфона, но за по-дълги пътувания беше желателно по-ефективно – затова създадохме то."

Най-новият TrulyHandsfree се доставя с поддръжка за няколко типа опции за събуждащи думи, включително фиксирани думи и потребителски дефинирани думи за събуждане. Модели на думи за събуждане за Alexa, Siri, Google Assistant, Cortana на Microsoft и системи от Baidu, Alibaba и Tencent. Разпознаване на няколко думи за събуждане и поддръжка за множество езици, включително английски, холандски, френски, италиански, японски, испански и турски.

Sensory казва, че актуализиран SDK за Android и iOS ще бъде пуснат преди края на Q2 2018.