Altid lyttende hotword-genkendelse uden strømudtag kan snart komme til Android-apps med TrulyHandsfree

click fraud protection

Den nyeste version af Sensorys TrulyHandsFree, en stemmegenkendelsespakke på tværs af platforme til iOS og Android, kan prale af et dramatisk reduceret strømforbrug.

Har du nogensinde undret dig over, hvordan smartphones som Huawei Mate 9 reagerer på Amazon Alexa og Google Assistant kommandoer ("Alexa", "OK, Google"), selv når skærmen er slukket og låst? Det er takket være en hardwarekomponent kaldet en DSP eller digital signalprocessor, en dedikeret lydchip, der håndterer laveffekt, altid tændt sætningsdetektion (og andre opgaver). Det er kernen i populære stemmeassistenters funktionalitet. Det Silicon Valley-baserede selskab Sensory siger, at dets softwarebaserede alternativ, TrulyHandsfree, giver DSP'er en chance for pengene.

TrulyHandsFree, som virksomheden hævder er den "mest udbredte" talegenkendelsesmaskine i verden, er et wake-word og talegenkendelsespakke designet til at understøtte laveffekt stemmegenkendelse i applikationer på tværs af Android, iOS og andre platforme. Sensory siger, at softwaren er blevet "re-konstrueret" til øget nøjagtighed, lavere strømforbrug og udvidet enhedsunderstøttelse.

"Håndfri betjening til stemmestyring er blevet normen, og applikationsudviklere søger nu at skabe håndfri vågneord til deres egne apps." sagde Todd Mozer, CEO for Sensory, i en erklæring.

Udviklingen af ​​den nye og forbedrede TrulyHandsfree begyndte i 2017. Sensory gik sammen med chipproducenten Qualcomm og ARM for at finde ud af, hvordan man sænker strømforbruget til stemmeassistentens vågneord. Det implementerede tre teknikker:

  • Sensorys "lille-store" altid lyttende funktion bruger en lille stemmegenkendelsesmodel til at identificere potentielle vågne ord og genvalidere disse vågne ord på en stor model. Den har ikke krævende strømkrav, men den er mere præcis uden at forbruge lidt mere strøm.
  • Frame stacking, en metode til neural netværkstræning, der fører til mere nøjagtige modeller og hurtigere afkodning, skærer visse wake word modelbehandlingsfunktioners MIPS (million instruktioner pr. sekund, et mål for behandlingsydelse) halvt uden at påvirke nøjagtighed.
  • Multithreading muliggør mere effektiv talegenkendelsesbehandling og forbedrer udførelsestiden for større wake word-modeller.

Sensory siger tilsammen, at forbedringerne reducerer strømforbruget på mobilapps med mere end 80 %, hvilket svarer til 200mAh på en 12-timers dag.

Hvis du har brugt den seneste version af navigationsappen Waze, har du allerede set den nye TrulyHandsfree i aktion. "Vi hjalp for nylig Googles Waze med at acceptere håndfri stemmekommandoer ved at forsyne dem med Sensorys 'OK Waze' wake word, der kører, når appen er åben." sagde hr. Mozer. "Med tidligere versioner af TrulyHandsfree har vores altid tændte wake word-motor lytte efter OK Waze wake-ordet under en kort tur ville have haft minimal effekt på en smartphones batteri, men til længere ture ønskede man en mere effektiv -- så vi skabte det."

Den seneste TrulyHandsfree leveres med understøttelse af flere typer wake-ord-indstillinger, herunder faste ord og brugerdefinerede wake-ord. Wake word-modeller til Alexa, Siri, Google Assistant, Microsofts Cortana og systemer fra Baidu, Alibaba og Tencent. Multi-wake ordgenkendelse og understøttelse af flere sprog, herunder engelsk, hollandsk, fransk, italiensk, japansk, spansk og tyrkisk.

Sensory siger, at en opdateret SDK til Android og iOS vil rulle ud inden udgangen af ​​2. kvartal 2018.