Mit TrulyHandsfree wird die Hotword-Erkennung, die immer zuhört und keinen Strom verbraucht, bald auch für Android-Apps verfügbar sein

Die neueste Version von TrulyHandsFree von Sensory, einer plattformübergreifenden Spracherkennungssuite für iOS und Android, zeichnet sich durch einen drastisch reduzierten Stromverbrauch aus.

Haben Sie sich jemals gefragt, wie Smartphones wie das Huawei Mate 9 darauf reagieren? Amazon Alexa Und Google Assistant Befehle („Alexa“, „OK, Google“) auch bei ausgeschaltetem und gesperrtem Bildschirm ausführen? Dies ist einer Hardwarekomponente namens DSP oder digitalem Signalprozessor zu verdanken, einem dedizierten Audiochip, der die stromsparende, ständig aktive Phrasenerkennung (und andere Aufgaben) übernimmt. Es ist der Kern der Funktionalität beliebter Sprachassistenten. Das im Silicon Valley ansässige Unternehmen Sensory sagt, dass seine softwarebasierte Alternative TrulyHandsfree den DSPs Konkurrenz macht.

TrulyHandsFree, das nach Angaben des Unternehmens die „am weitesten verbreitete“ Spracherkennungs-Engine der Welt ist, ist ein Weckwort und Spracherkennungssuite zur Unterstützung der Spracherkennung mit geringem Stromverbrauch in Anwendungen auf Android, iOS und anderen Plattformen. Laut Sensory wurde die Software „überarbeitet“, um die Genauigkeit zu erhöhen, den Stromverbrauch zu senken und die Geräteunterstützung zu erweitern.

„Freihändige Bedienung für die Sprachsteuerung ist zur Norm geworden, und Anwendungsentwickler möchten nun freihändige Aktivierungswörter für ihre eigenen Apps erstellen.“ sagte Todd Mozer, CEO von Sensory, in einer Erklärung.

Die Entwicklung des neuen und verbesserten TrulyHandsfree begann im Jahr 2017. Sensory hat sich mit dem Chiphersteller Qualcomm und ARM zusammengetan, um herauszufinden, wie der Stromverbrauch für Weckwörter des Sprachassistenten gesenkt werden kann. Es wurden drei Techniken implementiert:

Die „kleine große“ Immer-Zuhören-Funktion von Sensory verwendet ein kleines Spracherkennungsmodell, um potenzielle Aktivierungswörter zu identifizieren und diese Aktivierungswörter auf einem großen Modell erneut zu validieren. Der Leistungsbedarf ist nicht besonders hoch, aber er ist präziser, ohne etwas mehr Strom zu verbrauchen.
Frame-Stacking, eine Methode zum Training neuronaler Netze, die zu genaueren Modellen und schnellerer Dekodierung führt, schneidet bestimmte Wake-Words ab Die MIPS (Millionen Anweisungen pro Sekunde, ein Maß für die Verarbeitungsleistung) der Modellverarbeitungsfunktionen werden ohne Auswirkungen halbiert Genauigkeit.
Multithreading ermöglicht eine effizientere Spracherkennungsverarbeitung und verbessert die Ausführungszeit für größere Wake-Word-Modelle.

Laut Sensory reduzieren die Verbesserungen zusammen den Stromverbrauch mobiler Apps um mehr als 80 %, was 200 mAh an einem 12-Stunden-Tag entspricht.

Wenn Sie die neueste Version der Navigations-App Waze verwendet haben, haben Sie das neue TrulyHandsfree bereits in Aktion gesehen. „Wir haben Googles Waze kürzlich dabei geholfen, Freisprech-Sprachbefehle zu akzeptieren, indem wir ihnen Sensorys ‚OK Waze‘-Weckwort zur Verfügung gestellt haben, das ausgeführt wird, wenn die App geöffnet ist.“ Herr Mozer sagte. „Bei früheren Versionen von TrulyHandsfree wartete unsere ständig eingeschaltete Wake-Word-Engine während einer kurzen Zeit auf das OK-Waze-Wake-Wort Eine Reise hätte nur minimale Auswirkungen auf den Akku eines Smartphones gehabt, aber für längere Reisen war eine effizientere Lösung gewünscht – also haben wir sie entwickelt Es."

Das neueste TrulyHandsfree wird mit Unterstützung für verschiedene Arten von Aktivierungswortoptionen geliefert, darunter feste Wörter und benutzerdefinierte Aktivierungswörter. Wake-Word-Modelle für Alexa, Siri, den Google Assistant, Microsoft Cortana und Systeme von Baidu, Alibaba und Tencent. Multi-Wake-Worterkennung und Unterstützung für mehrere Sprachen, darunter Englisch, Niederländisch, Französisch, Italienisch, Japanisch, Spanisch und Türkisch.

Laut Sensory wird vor Ende des zweiten Quartals 2018 ein aktualisiertes SDK für Android und iOS eingeführt.