Stalno slušajuće prepoznavanje vrućih riječi bez potrošnje energije moglo bi uskoro doći u Android aplikacije s TrulyHandsfreeom

click fraud protection

Najnovija verzija Sensory TrulyHandsFree, višeplatformskog paketa za prepoznavanje glasa za iOS i Android, može se pohvaliti dramatično smanjenom potrošnjom energije.

Jeste li se ikada zapitali kako pametni telefoni kao što je Huawei Mate 9 reagiraju na Amazon Alexa i Google pomoćnik naredbe ("Alexa", "OK, Google") čak i kada je ekran isključen i zaključan? To je zahvaljujući hardverskoj komponenti koja se zove DSP ili procesor digitalnog signala, namjenskom audio čipu koji upravlja detekcijom fraze male snage, uvijek uključenom (i drugim zadacima). To je srž funkcionalnosti popularnih glasovnih pomoćnika. Tvrtka Sensory sa sjedištem u Silicijskoj dolini kaže da njezina softverska alternativa, TrulyHandsfree, daje DSP-ovima trku za svoj novac.

TrulyHandsFree, za koji tvrtka tvrdi da je "najrašireniji" mehanizam za prepoznavanje govora na svijetu, je budna riječ i paket za prepoznavanje govora dizajniran da podrži prepoznavanje glasa niske potrošnje u aplikacijama na Androidu, iOS-u i drugim platformama. Sensory kaže da je softver "reinženjeran" za povećanu točnost, nižu potrošnju energije i proširenu podršku za uređaje.

"Upravljanje glasom bez ruku postalo je norma, a programeri aplikacija sada žele stvoriti riječi za buđenje bez ruku za svoje vlastite aplikacije," rekao je Todd Mozer, izvršni direktor tvrtke Sensory, u izjavi.

Razvoj novog i poboljšanog TrulyHandsfreea započeo je 2017. Sensory se udružio s proizvođačem čipova Qualcomm i ARM-om kako bi otkrio kako smanjiti potrošnju energije za riječi za buđenje glasovnog asistenta. Implementirao je tri tehnike:

  • Sensoryjeva "mala-velika" značajka stalnog slušanja koristi mali model prepoznavanja glasa za prepoznavanje potencijalnih riječi za buđenje i revalidaciju tih riječi za buđenje na velikom modelu. Nema zahtjevne zahtjeve za napajanjem, ali je precizniji bez trošenja malo više energije.
  • Frame stacking, metoda treniranja neuronske mreže koja dovodi do preciznijih modela i bržeg dekodiranja, reže određene wake word model obrade funkcija' MIPS (milijun instrukcija u sekundi, mjera performansi obrade) na pola bez utjecaja točnost.
  • Multithreading omogućuje učinkovitiju obradu prepoznavanja govora i poboljšava vrijeme izvršenja za veće modele wake word-a.

Sensory kaže da poboljšanja zajedno smanjuju potrošnju energije na mobilnim aplikacijama za više od 80%, što je jednako 200 mAh u 12-satnom danu.

Ako ste koristili najnoviju verziju navigacijske aplikacije Waze, već ste vidjeli novi TrulyHandsfree na djelu. "Nedavno smo pomogli Googleovom Wazeu prihvatiti glasovne naredbe bez upotrebe ruku opskrbivši ih Sensoryjevom 'OK Waze' riječju za buđenje koja se pokreće kada je aplikacija otvorena," rekao je g. Mozer. "S prethodnim verzijama TrulyHandsfreea, naš uvijek uključeni mehanizam za buđenje riječi sluša OK Waze riječ za buđenje tijekom kratkog putovanje bi imalo minimalan učinak na bateriju pametnog telefona, ali za duža putovanja bila je poželjna učinkovitija -- pa smo stvorili to."

Najnoviji TrulyHandsfree isporučuje se s podrškom za nekoliko vrsta opcija za buđenje, uključujući fiksne riječi i korisnički definirane riječi za buđenje. Wake word modeli za Alexu, Siri, Google Assistant, Microsoftovu Cortanu i sustave Baidua, Alibabe i Tencenta. Multi-wake prepoznavanje riječi i podrška za više jezika uključujući engleski, nizozemski, francuski, talijanski, japanski, španjolski i turski.

Sensory kaže da će ažurirani SDK za Android i iOS biti predstavljen prije kraja drugog kvartala 2018.