Найновіша версія Sensory TrulyHandsFree, крос-платформного пакету розпізнавання голосу для iOS і Android, може похвалитися значно зниженим енергоспоживанням.
Ви коли-небудь замислювалися, як реагують такі смартфони, як Huawei Mate 9 Amazon Alexa і Google Assistant команди ("Alexa", "OK, Google"), навіть коли екран вимкнено та заблоковано? Це завдяки апаратному компоненту, який називається DSP, або цифровий сигнальний процесор, спеціальному аудіочіпу, який виконує розпізнавання фраз із низьким енергоспоживанням, завжди ввімкнене (та інші завдання). Це основа популярних функцій голосових помічників. Компанія Sensory, що базується в Силіконовій долині, каже, що її альтернатива на основі програмного забезпечення TrulyHandsfree дає цифровим процесорам доступ до грошей.
TrulyHandsFree, який, як стверджує компанія, є «найпоширенішим» механізмом розпізнавання мовлення у світі, є тривожним словом і пакет розпізнавання мовлення, розроблений для підтримки розпізнавання голосу з низьким енергоспоживанням у програмах на платформах Android, iOS та інших. Sensory каже, що програмне забезпечення було «перероблено» для підвищення точності, зниження енергоспоживання та розширеної підтримки пристроїв.
«Керування голосом за допомогою гучного зв’язку стало нормою, і розробники додатків тепер прагнуть створити слова пробудження за допомогою гучного зв’язку для власних додатків», сказав Тодд Мозер, генеральний директор Sensory, у заяві.
Розробка нового вдосконаленого TrulyHandsfree почалася в 2017 році. Sensory об’єдналася з виробником мікросхем Qualcomm і ARM, щоб з’ясувати, як знизити енергоспоживання для слів пробудження голосового помічника. Він реалізував три техніки:
- Функція «маленький-великий» постійного прослуховування Sensory використовує маленьку модель розпізнавання голосу для визначення потенційних слів пробудження та повторної перевірки цих слів пробудження на великій моделі. Він не має високих вимог до потужності, але він більш точний, не споживаючи трохи більше енергії.
- Накопичування кадрів, метод навчання нейронної мережі, який веде до точніших моделей і швидшого декодування, скорочує певне слово пробудження моделі обробки функцій MIPS (мільйон інструкцій за секунду, міра продуктивності обробки) вдвічі без впливу точність.
- Багатопотоковість забезпечує більш ефективну обробку розпізнавання мовлення та покращує час виконання для більших моделей слів пробудження.
Sensory каже, що разом ці вдосконалення зменшують енергоспоживання мобільних додатків більш ніж на 80%, що дорівнює 200 мАг протягом 12-годинного робочого дня.
Якщо ви користувалися останньою версією навігаційної програми Waze, ви вже бачили новий TrulyHandsfree у дії. «Нещодавно ми допомогли Waze від Google приймати голосові команди «вільні руки», надавши їм слово пробудження «OK Waze» Sensory, яке запускається, коли додаток відкрито», – сказав пан Мозер. «З попередніми версіями TrulyHandsfree наш постійний механізм пробудження прослуховує слово пробудження OK Waze під час короткого поїздка мала б мінімальний вплив на батарею смартфона, але для тривалих подорожей бажано було б більш ефективно – тому ми створили це."
Останній TrulyHandsfree постачається з підтримкою кількох типів параметрів слів пробудження, включаючи фіксовані слова та визначені користувачем слова пробудження. Моделі слів Wake для Alexa, Siri, Google Assistant, Cortana від Microsoft і систем від Baidu, Alibaba та Tencent. Багаторазове розпізнавання слів і підтримка кількох мов, включаючи англійську, голландську, французьку, італійську, японську, іспанську та турецьку.
Sensory каже, що оновлений SDK для Android та iOS буде випущено до кінця другого кварталу 2018 року.