A Sensory TrulyHandsFree legújabb verziója, egy többplatformos hangfelismerő program iOS és Android rendszerhez, drámaian csökkentett energiafogyasztással büszkélkedhet.
Gondolkoztál már azon, hogyan reagálnak az olyan okostelefonok, mint a Huawei Mate 9 Amazon Alexa és Google Asszisztens parancsokat ("Alexa", "OK, Google") akkor is, ha a képernyő ki van kapcsolva és le van zárva? Ez a DSP-nek vagy digitális jelprocesszornak nevezett hardverkomponensnek köszönhető, egy dedikált audio chipnek, amely kezeli az alacsony fogyasztású, mindig bekapcsolt frázisérzékelést (és egyéb feladatokat). Ez a népszerű hangasszisztensek funkcióinak alapja. A Szilícium-völgyben székelő Sensory cég azt állítja, hogy szoftveralapú alternatívája, a TrulyHandsfree, a DSP-k számára kifut a pénzért.
A TrulyHandsFree, amely a vállalat állítása szerint a "legszélesebb körben alkalmazott" beszédfelismerő motor a világon, ébresztőszó és beszédfelismerő csomag, amelyet az alacsony fogyasztású hangfelismerés támogatására terveztek Android, iOS és más platformokon futó alkalmazásokban. A Sensory szerint a szoftvert "újratervezték" a nagyobb pontosság, az alacsonyabb energiafogyasztás és a kiterjesztett eszköztámogatás érdekében.
"A hangvezérlés kihangosítása már megszokottá vált, és az alkalmazásfejlesztők most arra törekednek, hogy kihangosított ébresztőszavakat hozzanak létre saját alkalmazásaikhoz." – mondta Todd Mozer, a Sensory vezérigazgatója közleményében.
Az új és továbbfejlesztett TrulyHandsfree fejlesztése 2017-ben kezdődött. A Sensory a chipgyártó Qualcomm-mal és az ARM-mel együttműködve kitalálta, hogyan csökkentheti a hangsegéd-ébresztőszavak energiafogyasztását. Három technikát valósított meg:
- A Sensory „kicsit-nagy” mindig figyelő funkciója egy kis hangfelismerő modellt használ a lehetséges ébresztőszavak azonosítására, és ezek újraérvényesítésére egy nagy modellen. Nem igényel nagy teljesítményt, de pontosabb anélkül, hogy valamivel több energiát fogyasztana.
- A kerethalmozás, a neurális hálózatok képzésének módszere, amely pontosabb modellekhez és gyorsabb dekódoláshoz vezet, levág bizonyos ébresztőszavakat A modellfeldolgozási funkciók MIPS-e (másodpercenkénti millió utasítás, a feldolgozási teljesítmény mértéke) a felére, anélkül, hogy befolyásolná pontosság.
- A többszálú megoldás hatékonyabb beszédfelismerési feldolgozást tesz lehetővé, és javítja a végrehajtási időt a nagyobb ébresztőszó-modellek esetében.
A Sensory szerint a fejlesztések együttesen több mint 80%-kal csökkentik a mobilalkalmazások energiafogyasztását, ami 200 mAh-nak felel meg egy 12 órás nap alatt.
Ha a Waze navigációs alkalmazás legújabb verzióját használtad, akkor már láthattad működés közben az új TrulyHandsfree-t. "Nemrég segítettünk a Google Waze-ének elfogadni a kihangosított hangutasításokat azáltal, hogy elláttuk őket a Sensory "OK Waze" ébresztőszójával, amely akkor fut, amikor az alkalmazás nyitva van." Mr. Mozer mondta. "A TrulyHandsfree korábbi verzióival a mindig bekapcsolt ébresztőszó motorunk az OK Waze ébresztőszóra figyel egy rövid idő alatt az utazás minimális hatással lett volna az okostelefon akkumulátorára, de hosszabb utakhoz hatékonyabb volt a kívánatos -- ezért létrehoztuk azt."
A legújabb TrulyHandsfree többféle ébresztőszó-beállítást támogat, beleértve a rögzített szavakat és a felhasználó által meghatározott ébresztőszavakat. Wake word modellek Alexa, Siri, Google Assistant, Microsoft Cortana és Baidu, Alibaba és Tencent rendszerekhez. Multi-wake szófelismerés és több nyelv támogatása, beleértve az angol, holland, francia, olasz, japán, spanyol és török nyelvet.
A Sensory szerint 2018 második negyedévének vége előtt megjelenik egy frissített SDK Androidra és iOS-re.