Новейшая версия TrulyHandsFree от Sensory, кроссплатформенного пакета распознавания голоса для iOS и Android, может похвастаться значительно сниженным энергопотреблением.
Вы когда-нибудь задумывались, как такие смартфоны, как Huawei Mate 9, реагируют на Амазонка Алекса и Google Ассистент команды («Алекса», «ОК, Google»), даже когда экран выключен и заблокирован? Это происходит благодаря аппаратному компоненту, называемому DSP, или цифровому сигнальному процессору, специальному аудиочипу, который выполняет маломощное постоянное обнаружение фраз (и другие задачи). Это основа функциональности популярных голосовых помощников. Компания Sensory из Кремниевой долины заявляет, что ее программная альтернатива TrulyHandsfree дает DSP возможность заработать деньги.
TrulyHandsFree, который, по утверждению компании, является «наиболее широко используемым» механизмом распознавания речи в мире, является тревожным словом и пакет распознавания речи, предназначенный для поддержки распознавания голоса с низким энергопотреблением в приложениях на Android, iOS и других платформах. Sensory заявляет, что программное обеспечение было «переработано» для повышения точности, снижения энергопотребления и расширенной поддержки устройств.
«Работа без помощи рук для голосового управления стала нормой, и разработчики приложений теперь стремятся создавать слова пробуждения без помощи рук для своих собственных приложений», сказал Тодд Мозер, генеральный директор Sensory, в своем заявлении.
Разработка нового улучшенного TrulyHandsfree началась в 2017 году. Sensory объединилась с производителем чипов Qualcomm и ARM, чтобы выяснить, как снизить энергопотребление для слов пробуждения голосового помощника. Он реализовал три метода:
- «Маленькая-большая» функция постоянного прослушивания Sensory использует небольшую модель распознавания голоса для определения потенциальных слов пробуждения и повторной проверки этих слов на большой модели. У него нет высоких требований к питанию, но он более точен, не потребляя немного больше энергии.
- Укладка кадров — метод обучения нейронной сети, который приводит к созданию более точных моделей и более быстрому декодированию, — отсекает определенные слова пробуждения. MIPS функций обработки модели (миллионы инструкций в секунду, показатель производительности обработки) вдвое без ущерба точность.
- Многопоточность обеспечивает более эффективную обработку распознавания речи и сокращает время выполнения больших моделей слов пробуждения.
Sensory заявляет, что в совокупности эти улучшения снижают энергопотребление мобильных приложений более чем на 80%, что соответствует 200 мАч за 12-часовой рабочий день.
Если вы использовали последнюю версию навигационного приложения Waze, вы уже видели новый TrulyHandsfree в действии. «Недавно мы помогли Google Waze принимать голосовые команды без помощи рук, предоставив им слово пробуждения от Sensory «OK Waze», которое запускается, когда приложение открыто», Сказал г-н Мозер. «В предыдущих версиях TrulyHandsfree наш постоянно включенный механизм пробуждения прослушивал слово «ОК Waze» в течение короткого поездка оказала бы минимальное влияние на батарею смартфона, но для более длительных поездок хотелось бы более экономичный вариант, поэтому мы создали это."
Последняя версия TrulyHandsfree поставляется с поддержкой нескольких типов слов пробуждения, включая фиксированные слова и определяемые пользователем слова пробуждения. Модели слов пробуждения для Alexa, Siri, Google Assistant, Microsoft Cortana и систем Baidu, Alibaba и Tencent. Распознавание слов с несколькими пробуждениями и поддержка нескольких языков, включая английский, голландский, французский, итальянский, японский, испанский и турецкий.
Sensory сообщает, что обновленный SDK для Android и iOS выйдет до конца второго квартала 2018 года.