Cea mai nouă versiune a TrulyHandsFree de la Sensory, o suită multiplatformă de recunoaștere a vocii pentru iOS și Android, se mândrește cu un consum de energie redus dramatic.
Te-ai întrebat vreodată cum răspund smartphone-urile precum Huawei Mate 9 Amazon Alexa și Asistent Google comenzi ("Alexa", "OK, Google") chiar și atunci când ecranul este oprit și blocat? Acest lucru se datorează unei componente hardware numită DSP sau procesor de semnal digital, un cip audio dedicat care se ocupă de detectarea frazelor cu putere redusă, mereu activă (și alte sarcini). Este esențial pentru funcționalitatea asistenților vocali populari. Compania Sensory din Silicon Valley declară că alternativa sa bazată pe software, TrulyHandsfree, oferă DSP-urilor un drum pentru banii lor.
TrulyHandsFree, despre care compania susține că este „cel mai larg implementat” motor de recunoaștere a vorbirii din lume, este un cuvânt de trezire și suită de recunoaștere a vorbirii, concepută pentru a sprijini recunoașterea vocii cu putere redusă în aplicații pe Android, iOS și alte platforme. Sensory spune că software-ul a fost „reproiectat” pentru o precizie sporită, un consum mai mic de energie și un suport extins pentru dispozitiv.
„Operarea hands-free pentru controlul vocal a devenit o normă, iar dezvoltatorii de aplicații caută acum să creeze cuvinte de trezire hands-free pentru propriile aplicații.” a declarat Todd Mozer, CEO al Sensory, într-o declarație.
Dezvoltarea noului și îmbunătățit TrulyHandsfree a început în 2017. Sensory a făcut echipă cu producătorul de cipuri Qualcomm și ARM pentru a descoperi cum să reducă consumul de energie pentru cuvintele de trezire ale asistentului vocal. A implementat trei tehnici:
- Funcția senzorială „mic-mare” de ascultare permanentă folosește un model mic de recunoaștere a vocii pentru a identifica potențiale cuvinte de trezire și pentru a revalida acele cuvinte de trezire pe un model mare. Nu are cerințe de putere solicitante, dar este mai precis fără a consuma puțin mai multă energie.
- Frame stacking, o metodă de antrenament a rețelei neuronale care duce la modele mai precise și la o decodare mai rapidă, reduce anumite cuvinte Modelul funcțiilor de procesare MIPS (milioane de instrucțiuni pe secundă, o măsură a performanței de procesare) la jumătate fără impact precizie.
- Multithreading permite o procesare mai eficientă a recunoașterii vorbirii și îmbunătățește timpul de execuție pentru modele de cuvinte mai mari.
Sensory spune că împreună îmbunătățirile reduc consumul de energie pentru aplicațiile mobile cu mai mult de 80%, ceea ce echivalează cu 200 mAh într-o zi de 12 ore.
Dacă ați folosit cea mai recentă versiune a aplicației de navigare Waze, ați văzut deja noul TrulyHandsfree în acțiune. „Recent am ajutat Waze de la Google să accepte comenzi vocale fără mâini, furnizându-le cuvântul de trezire „OK Waze” de la Sensory, care rulează atunci când aplicația este deschisă.” spuse domnul Mozer. „Cu versiunile anterioare de TrulyHandsfree, având motorul nostru de cuvinte de trezire mereu pornit care ascultă cuvântul de trezire OK Waze în timpul unei scurte călătoria ar fi avut un efect minim asupra bateriei unui smartphone, dar pentru călătorii mai lungi se dorea o mai eficientă -- așa că am creat aceasta."
Cel mai recent TrulyHandsfree este livrat cu suport pentru mai multe tipuri de opțiuni pentru cuvinte de trezire, inclusiv cuvinte fixe și cuvinte de trezire definite de utilizator. Modele de cuvinte de trezire pentru Alexa, Siri, Asistentul Google, Cortana de la Microsoft și sistemele de la Baidu, Alibaba și Tencent. Recunoașterea cuvintelor cu mai multe treziri și suport pentru mai multe limbi, inclusiv engleză, olandeză, franceză, italiană, japoneză, spaniolă și turcă.
Sensory spune că un SDK actualizat pentru Android și iOS va fi lansat înainte de sfârșitul trimestrului II 2018.