iOS および Android 用のクロスプラットフォーム音声認識スイートである Sensory の TrulyHandsFree の最新バージョンは、消費電力が大幅に削減されています。
Huawei Mate 9 などのスマートフォンがどのように反応するか疑問に思ったことはありませんか? アマゾンアレクサ そして Googleアシスタント 画面がオフになってロックされている場合でも、コマンド (「Alexa」、「OK、Google」) は使用できますか? これは、DSP (デジタル シグナル プロセッサ) と呼ばれるハードウェア コンポーネントのおかげで、低電力で常時オンのフレーズ検出 (およびその他のタスク) を処理する専用のオーディオ チップです。 これは、人気のある音声アシスタントの機能の中核です。 シリコンバレーに本拠を置く企業Sensoryは、同社のソフトウェアベースの代替品TrulyHandsfreeはDSPに十分な利益をもたらすと述べている。
TrulyHandsFree は、世界で「最も広く導入されている」音声認識エンジンであると同社が主張していますが、ウェイクワードと Android、iOS、その他のプラットフォームのアプリケーションで低電力音声認識をサポートするように設計された音声認識スイート。 Sensory によれば、このソフトウェアは精度の向上、消費電力の削減、デバイスのサポートの拡大のために「再設計」されたという。
「音声制御のためのハンズフリー操作は標準となっており、アプリケーション開発者は現在、独自のアプリケーション用にハンズフリーのウェイクワードを作成しようとしています。」 Sensory の CEO、Todd Mozer 氏は声明で次のように述べています。
新しく改良された TrulyHandsfree の開発は 2017 年に始まりました。 Sensory は、チップメーカーの Qualcomm および ARM と協力して、音声アシスタントのウェイクワードの消費電力を下げる方法を見つけ出しました。 次の 3 つのテクニックが実装されました。
- Sensory の「リトルビッグ」常時リスニング機能は、小さな音声認識モデルを使用して潜在的なウェイク ワードを特定し、それらのウェイク ワードを大規模なモデルで再検証します。 厳しい電力要件はありませんが、わずかに多くの電力を消費することなく、より正確になります。
- フレームスタッキングは、より正確なモデルとより高速なデコードにつながるニューラルネットワークトレーニングの方法であり、特定のウェイクワードをカットします 影響を与えることなく、処理関数の MIPS (1 秒あたり 100 万命令、処理パフォーマンスの尺度) を半分にモデル化します。 正確さ。
- マルチスレッドにより、より効率的な音声認識処理が可能になり、大規模なウェイク ワード モデルの実行時間が短縮されます。
Sensory によれば、これらの機能強化により、モバイル アプリの消費電力が 80% 以上削減され、これは 1 日 12 時間で 200mAh に相当します。
ナビゲーション アプリ Waze の最新バージョンを使用したことがある場合は、新しい TrulyHandsfree が実際に動作しているのをすでに見たことがあるでしょう。 「私たちは最近、アプリが開いているときに実行されるSensoryの『OK Waze』ウェイクワードを提供することで、GoogleのWazeがハンズフリー音声コマンドを受け入れるのを支援しました。」 モーザー氏はこう語った。 「以前のバージョンの TrulyHandsfree では、常時オンのウェイク ワード エンジンが短時間の間に OK Waze ウェイク ワードをリッスンしていました。 旅行ではスマートフォンのバッテリーへの影響は最小限に抑えられますが、長距離の旅行ではより効率的なバッテリーが求められるため、 それ。"
最新の TrulyHandsfree には、固定ワードやユーザー定義のウェイク ワードを含む、数種類のウェイク ワード オプションのサポートが付属しています。 Alexa、Siri、Google アシスタント、Microsoft の Cortana、Baidu、Alibaba、Tencent のシステムのウェイク ワード モデル。 マルチウェイクワード認識と、英語、オランダ語、フランス語、イタリア語、日本語、スペイン語、トルコ語を含む複数の言語のサポート。
Sensory によると、Android および iOS 用の更新された SDK は 2018 年第 2 四半期末までに公開される予定です。