La reconnaissance de mots chauds à écoute permanente sans consommation d'énergie pourrait bientôt arriver dans les applications Android avec TrulyHandsfree

click fraud protection

La dernière version de TrulyHandsFree de Sensory, une suite de reconnaissance vocale multiplateforme pour iOS et Android, offre une consommation d'énergie considérablement réduite.

Vous êtes-vous déjà demandé comment les smartphones tels que le Huawei Mate 9 réagissent Amazon Alexa et Assistant Google commandes ("Alexa", "OK, Google") même lorsque l'écran est éteint et verrouillé? C'est grâce à un composant matériel appelé DSP, ou processeur de signal numérique, une puce audio dédiée qui gère la détection de phrases à faible consommation et toujours active (et d'autres tâches). C’est au cœur des fonctionnalités des assistants vocaux populaires. La société Sensory, basée dans la Silicon Valley, affirme que son alternative logicielle, TrulyHandsfree, donne du fil à retordre aux DSP.

TrulyHandsFree, qui, selon la société, est le moteur de reconnaissance vocale « le plus largement déployé » au monde, est un mot d'alarme et suite de reconnaissance vocale conçue pour prendre en charge la reconnaissance vocale à faible consommation dans les applications sur Android, iOS et d'autres plates-formes. Sensory affirme que le logiciel a été « repensé » pour une précision accrue, une consommation d'énergie réduite et une prise en charge étendue des appareils.

"Le fonctionnement mains libres pour la commande vocale est devenu la norme, et les développeurs d'applications cherchent désormais à créer des mots de réveil mains libres pour leurs propres applications." a déclaré Todd Mozer, PDG de Sensory, dans un communiqué.

Le développement du nouveau TrulyHandsfree amélioré a commencé en 2017. Sensory s'est associé au fabricant de puces Qualcomm et à ARM pour trouver comment réduire la consommation d'énergie des mots de réveil de l'assistant vocal. Il a mis en œuvre trois techniques :

  • La fonction d'écoute permanente « petit-grand » de Sensory utilise un petit modèle de reconnaissance vocale pour identifier les mots d'éveil potentiels et revalider ces mots d'éveil sur un grand modèle. Il n’a pas de besoins énergétiques exigeants, mais il est plus précis sans consommer un peu plus d’énergie.
  • L'empilement de trames, une méthode de formation des réseaux neuronaux qui conduit à des modèles plus précis et à un décodage plus rapide, supprime certains mots d'éveil. modéliser le MIPS des fonctions de traitement (millions d'instructions par seconde, une mesure des performances de traitement) de moitié sans impact précision.
  • Le multithreading permet un traitement de reconnaissance vocale plus efficace et améliore le temps d'exécution pour les modèles de mots d'activation plus volumineux.

Sensory affirme que l'ensemble des améliorations réduit la consommation d'énergie des applications mobiles de plus de 80 %, ce qui équivaut à 200 mAh par jour de 12 heures.

Si vous avez utilisé la dernière version de l'application de navigation Waze, vous avez déjà vu le nouveau TrulyHandsfree en action. "Nous avons récemment aidé Waze de Google à accepter les commandes vocales mains libres en leur fournissant le mot de réveil 'OK Waze' de Sensory qui s'exécute lorsque l'application est ouverte." » a déclaré M. Mozer. "Avec les versions précédentes de TrulyHandsfree, notre moteur de mots de réveil toujours actif écoutait le mot de réveil OK Waze pendant une courte période. un voyage aurait eu un effet minime sur la batterie d'un smartphone, mais pour les voyages plus longs, une solution plus efficace était souhaitée. Nous avons donc créé il."

Le dernier TrulyHandsfree prend en charge plusieurs types d'options de mots d'activation, notamment les mots fixes et les mots d'activation définis par l'utilisateur. Modèles de mots de réveil pour Alexa, Siri, l'Assistant Google, Cortana de Microsoft et les systèmes de Baidu, Alibaba et Tencent. Reconnaissance de mots multi-wakes et prise en charge de plusieurs langues, dont l'anglais, le néerlandais, le français, l'italien, le japonais, l'espagnol et le turc.

Sensory indique qu'un SDK mis à jour pour Android et iOS sera déployé avant la fin du deuxième trimestre 2018.