Alltid lyttende Hotword-gjenkjenning uten strømforbruk kan snart komme til Android-apper med TrulyHandsfree

Den nyeste versjonen av Sensory's TrulyHandsFree, en stemmegjenkjenningssuite på tvers av plattformer for iOS og Android, har dramatisk redusert strømforbruk.

Noen gang lurt på hvordan smarttelefoner som Huawei Mate 9 reagerer på Amazon Alexa og Google Assistant kommandoer ("Alexa", "OK, Google") selv når skjermen er slått av og låst? Det er takket være en maskinvarekomponent kalt en DSP, eller digital signalprosessor, en dedikert lydbrikke som håndterer setningsdeteksjon med lav effekt, alltid på (og andre oppgaver). Det er kjernen i funksjonaliteten til populære stemmeassistenter. Det Silicon Valley-baserte selskapet Sensory sier at dets programvarebaserte alternativ, TrulyHandsfree, gir DSP-er en sjanse for pengene.

TrulyHandsFree, som selskapet hevder er den "mest utbredte" talegjenkjenningsmotoren i verden, er et våkenord og talegjenkjenningssuite designet for å støtte stemmegjenkjenning med lav effekt i applikasjoner på tvers av Android, iOS og andre plattformer. Sensory sier at programvaren har blitt "rekonstruert" for økt nøyaktighet, lavere strømforbruk og utvidet enhetsstøtte.

"Handfri drift for stemmestyring har blitt normen, og applikasjonsutviklere ser nå etter å lage håndfrie våkneord for sine egne apper," sa Todd Mozer, administrerende direktør i Sensory, i en uttalelse.

Utviklingen av den nye og forbedrede TrulyHandsfree startet i 2017. Sensory slo seg sammen med brikkeprodusenten Qualcomm og ARM for å finne ut hvordan man kan redusere strømforbruket for stemmeassistentens våkneord. Den implementerte tre teknikker:

  • Sensorys "lille-store" alltid lyttende funksjon bruker en liten stemmegjenkjenningsmodell for å identifisere potensielle våkne ord og revalidere disse våkne ordene på en stor modell. Den har ikke krevende strømkrav, men den er mer nøyaktig uten å bruke litt mer strøm.
  • Frame stacking, en metode for nevrale nettverkstrening som fører til mer nøyaktige modeller og raskere dekoding, kutter visse våkneord modellbehandlingsfunksjonenes MIPS (millioner instruksjoner per sekund, et mål på prosessytelse) halvert uten å påvirke nøyaktighet.
  • Multithreading gir mer effektiv talegjenkjenningsbehandling og forbedrer utførelsestiden for større wake word-modeller.

Sensory sier til sammen at forbedringene reduserer strømforbruket på mobilapper med mer enn 80 %, noe som tilsvarer 200mAh på en 12-timers dag.

Hvis du har brukt den nyeste versjonen av navigasjonsappen Waze, har du allerede sett den nye TrulyHandsfree i aksjon. «Vi hjalp nylig Googles Waze med å akseptere håndfri talekommandoer ved å gi dem Sensorys «OK Waze»-våkneord som kjører når appen er åpen.» sa Mr. Mozer. "Med tidligere versjoner av TrulyHandsfree, har vår alltid-på-våkneord-motor som lytter etter OK Waze-våkneordet under en kort tur ville ha hatt minimal effekt på en smarttelefons batteri, men for lengre turer var en mer effektiv ønsket -- så vi opprettet den."

Den nyeste TrulyHandsfree leveres med støtte for flere typer wake-ord-alternativer, inkludert faste ord og brukerdefinerte wake-ord. Wake word-modeller for Alexa, Siri, Google Assistant, Microsofts Cortana og systemer fra Baidu, Alibaba og Tencent. Multi-wake ordgjenkjenning og støtte for flere språk, inkludert engelsk, nederlandsk, fransk, italiensk, japansk, spansk og tyrkisk.

Sensory sier at en oppdatert SDK for Android og iOS vil rulle ut før slutten av andre kvartal 2018.