Den senaste versionen av Sensorys TrulyHandsFree, en plattformsoberoende röstigenkänningssvit för iOS och Android, har dramatiskt minskad strömförbrukning.
Har du någonsin undrat hur smartphones som Huawei Mate 9 reagerar på Amazon Alexa och Google Assistant kommandon ("Alexa", "OK, Google") även när skärmen är avstängd och låst? Det är tack vare en hårdvarukomponent som kallas en DSP, eller digital signalprocessor, ett dedikerat ljudchip som hanterar frasdetektering med låg effekt, alltid på (och andra uppgifter). Det är kärnan i populära röstassistenters funktionalitet. Det Silicon Valley-baserade företaget Sensory säger att dess mjukvarubaserade alternativ, TrulyHandsfree, ger DSP: er en kör för pengarna.
TrulyHandsFree, som företaget hävdar är den "mest utbredda" taligenkänningsmotorn i världen, är ett wake-word och taligenkänningssvit designad för att stödja lågeffekt röstigenkänning i applikationer på Android, iOS och andra plattformar. Sensory säger att programvaran har "omkonstruerats" för ökad noggrannhet, lägre strömförbrukning och utökat enhetsstöd.
"Handsfree-drift för röststyrning har blivit normen, och applikationsutvecklare letar nu efter att skapa handsfree-vakna ord för sina egna appar," sa Todd Mozer, vd för Sensory, i ett uttalande.
Utvecklingen av den nya och förbättrade TrulyHandsfree började 2017. Sensory slog sig ihop med chiptillverkaren Qualcomm och ARM för att ta reda på hur man sänker strömförbrukningen för röstassistentens väckningsord. Den implementerade tre tekniker:
- Sensorys "lilla-stora" alltid-lyssnande funktion använder en liten röstigenkänningsmodell för att identifiera potentiella vakna ord och återvalidera dessa vakna ord på en stor modell. Den har inga höga strömkrav, men den är mer exakt utan att förbruka något mer ström.
- Frame stacking, en metod för neurala nätverksträning som leder till mer exakta modeller och snabbare avkodning, skär bort vissa vakna ord modellbearbetningsfunktionernas MIPS (miljoner instruktioner per sekund, ett mått på bearbetningsprestanda) på hälften utan att påverka noggrannhet.
- Multithreading möjliggör effektivare taligenkänningsbehandling och förbättrar exekveringstiden för större wake word-modeller.
Sensory säger att förbättringarna tillsammans minskar strömförbrukningen på mobilappar med mer än 80 %, vilket motsvarar 200mAh på en 12-timmarsdag.
Om du har använt den senaste versionen av navigationsappen Waze har du redan sett nya TrulyHandsfree i aktion. "Vi hjälpte nyligen Googles Waze att acceptera handsfree-röstkommandon genom att förse dem med Sensorys "OK Waze" wake word som körs när appen är öppen." sa Mr. Mozer. "Med tidigare versioner av TrulyHandsfree, med vår alltid påslagna wake word-motor som lyssnar efter OK Waze wake-ord under en kort resa skulle ha haft minimal effekt på en smartphones batteri, men för längre resor önskades en mer effektiv -- så vi skapade Det."
Den senaste TrulyHandsfree levereras med stöd för flera typer av wake word-alternativ inklusive fasta ord och användardefinierade wake-ord. Wake word-modeller för Alexa, Siri, Google Assistant, Microsofts Cortana och system från Baidu, Alibaba och Tencent. Multi-wake ordigenkänning och stöd för flera språk inklusive engelska, holländska, franska, italienska, japanska, spanska och turkiska.
Sensory säger att en uppdaterad SDK för Android och iOS kommer att rullas ut före slutet av andra kvartalet 2018.