Neustále počúvanie kľúčových slov bez spotreby energie môže čoskoro prísť do aplikácií pre Android s TrulyHandsfree

click fraud protection

Najnovšia verzia Sensory's TrulyHandsFree, multiplatformový balík rozpoznávania hlasu pre iOS a Android, sa môže pochváliť dramaticky zníženou spotrebou energie.

Zaujímalo vás niekedy, ako reagujú smartfóny, ako je Huawei Mate 9 Amazon Alexa a Google Assistant príkazy ("Alexa", "OK, Google") aj keď je obrazovka vypnutá a uzamknutá? Je to vďaka hardvérovému komponentu nazývanému DSP alebo digitálny signálový procesor, špecializovanému zvukovému čipu, ktorý zvláda detekciu fráz s nízkou spotrebou a stále zapnuté (a ďalšie úlohy). Je základom funkcií populárnych hlasových asistentov. Spoločnosť Sensory so sídlom v Silicon Valley tvrdí, že jej softvérová alternatíva, TrulyHandsfree, dáva DSP za svoje peniaze.

TrulyHandsFree, o ktorom spoločnosť tvrdí, že je „najrozšírenejším“ nástrojom na rozpoznávanie reči na svete, je prebudením a sada rozpoznávania reči navrhnutá tak, aby podporovala nízkoenergetické rozpoznávanie hlasu v aplikáciách pre Android, iOS a ďalšie platformy. Sensory hovorí, že softvér bol „prerobený“ s cieľom zvýšiť presnosť, nižšiu spotrebu energie a rozšírenú podporu zariadení.

„Hands-free ovládanie hlasového ovládania sa stalo normou a vývojári aplikácií teraz hľadajú spôsob, ako vytvoriť hands-free slová prebudenia pre svoje vlastné aplikácie,“ uviedol vo vyhlásení Todd Mozer, generálny riaditeľ spoločnosti Sensory.

Vývoj nového a vylepšeného TrulyHandsfree sa začal v roku 2017. Spoločnosť Sensory sa spojila s výrobcom čipov Qualcomm a ARM, aby zistili, ako znížiť spotrebu energie pri prebúdzaní slov hlasového asistenta. Implementoval tri techniky:

  • „Malá-veľká“ funkcia neustáleho počúvania Sensory využíva malý model rozpoznávania hlasu na identifikáciu potenciálnych budiacich slov a opätovné overenie týchto budiacich slov na veľkom modeli. Nemá náročné požiadavky na napájanie, no je presnejší bez toho, aby spotreboval trochu viac energie.
  • Frame stacking, metóda tréningu neurónovej siete, ktorá vedie k presnejším modelom a rýchlejšiemu dekódovaniu, znižuje určité prebudené slovo MIPS funkcií spracovania modelu (milión inštrukcií za sekundu, miera výkonu spracovania) na polovicu bez ovplyvnenia presnosť.
  • Viacvláknové spracovanie umožňuje efektívnejšie spracovanie rozpoznávania reči a skracuje čas vykonania väčších modelov budiacich slov.

Sensory hovorí, že vylepšenia spolu znižujú spotrebu energie v mobilných aplikáciách o viac ako 80 %, čo sa rovná 200 mAh za 12 hodín denne.

Ak ste používali najnovšiu verziu navigačnej aplikácie Waze, už ste videli nové TrulyHandsfree v akcii. „Nedávno sme pomohli Waze od Google prijímať hlasové povely handsfree tým, že sme im poskytli budiace slovo „OK Waze“ od spoločnosti Sensory, ktoré sa spustí, keď je aplikácia otvorená,“ Povedal pán Mozer. „S predchádzajúcimi verziami TrulyHandsfree, keď náš neustále zapnutý nástroj na prebudenie počúva slovo OK Waze počas krátkej doby. výlet by mal minimálny vplyv na batériu smartfónu, no pri dlhších cestách sa žiadalo efektívnejšie – preto sme vytvorili to."

Najnovšie TrulyHandsfree sa dodáva s podporou niekoľkých typov možností prebudenia vrátane pevných slov a používateľsky definovaných slov prebudenia. Wake word modely pre Alexa, Siri, Google Assistant, Cortana od Microsoftu a systémy od Baidu, Alibaba a Tencent. Rozpoznávanie slov pri prebudení a podpora viacerých jazykov vrátane angličtiny, holandčiny, francúzštiny, taliančiny, japončiny, španielčiny a turečtiny.

Sensory hovorí, že aktualizovaná súprava SDK pre Android a iOS bude uvedená na trh pred koncom 2. štvrťroka 2018.