Funkcja rozpoznawania słów kluczowych, która zawsze słucha, bez poboru mocy, może wkrótce pojawić się w aplikacjach na Androida dzięki technologii TrulyHandsfree

Najnowsza wersja TrulyHandsFree firmy Sensory, wieloplatformowego pakietu do rozpoznawania głosu dla systemów iOS i Android, oferuje znacznie zmniejszone zużycie energii.

Czy zastanawiałeś się kiedyś, jak reagują smartfony takie jak Huawei Mate 9 Amazonka Alexa I Asystent Google polecenia („Alexa”, „OK, Google”) nawet wtedy, gdy ekran jest wyłączony i zablokowany? Dzieje się tak dzięki komponentowi sprzętowemu zwanemu DSP lub cyfrowym procesorem sygnałowym, dedykowanemu układowi audio, który obsługuje ciągłe wykrywanie fraz przy niskim poborze mocy (i inne zadania). Jest to rdzeń funkcjonalności popularnych asystentów głosowych. Firma Sensory z Doliny Krzemowej twierdzi, że jej oparta na oprogramowaniu alternatywa TrulyHandsfree zapewnia producentom DSP szansę na odzyskanie pieniędzy.

TrulyHandsFree, który według firmy jest „najpowszechniej stosowanym” mechanizmem rozpoznawania mowy na świecie, to słowo budzące i pakiet rozpoznawania mowy zaprojektowany do obsługi rozpoznawania głosu o niskim poborze mocy w aplikacjach na Androida, iOS i inne platformy. Sensory twierdzi, że oprogramowanie zostało „przeprojektowane” w celu zwiększenia dokładności, mniejszego zużycia energii i rozszerzonej obsługi urządzeń.

„Obsługa głosowa bez użycia rąk stała się normą, a twórcy aplikacji chcą teraz tworzyć słowa aktywacji bez użycia rąk dla swoich własnych aplikacji” powiedział w oświadczeniu Todd Mozer, dyrektor generalny Sensory.

Prace nad nowym, ulepszonym zestawem TrulyHandsfree rozpoczęły się w 2017 roku. Sensory nawiązało współpracę z producentem chipów Qualcomm i ARM, aby dowiedzieć się, jak obniżyć zużycie energii przez słowa aktywujące asystenta głosowego. Wdrożył trzy techniki:

  • Funkcja „mały-duży” ciągłego słuchania firmy Sensory wykorzystuje model rozpoznawania małego głosu do identyfikowania potencjalnych słów aktywacji i ponownej weryfikacji tych słów na dużym modelu. Nie ma dużych wymagań dotyczących zasilania, ale jest dokładniejszy bez zużywania nieco większej mocy.
  • Układanie ramek, metoda uczenia sieci neuronowej, która prowadzi do dokładniejszych modeli i szybszego dekodowania, eliminuje niektóre słowa budzące modelowanie MIPS funkcji przetwarzania (milion instrukcji na sekundę, miara wydajności przetwarzania) o połowę bez wpływu dokładność.
  • Wielowątkowość umożliwia bardziej wydajne przetwarzanie rozpoznawania mowy i skraca czas wykonywania większych modeli słów aktywacji.

Sensory twierdzi, że łącznie te ulepszenia zmniejszają zużycie energii w aplikacjach mobilnych o ponad 80%, co odpowiada 200 mAh w 12-godzinnym dniu pracy.

Jeśli korzystałeś z najnowszej wersji aplikacji nawigacyjnej Waze, widziałeś już nowy TrulyHandsfree w akcji. „Niedawno pomogliśmy Google Waze akceptować polecenia głosowe bez użycia rąk, dostarczając im słowo budzenia „OK Waze” firmy Sensory, które jest uruchamiane, gdy aplikacja jest otwarta.” powiedział pan Mozer. „W poprzednich wersjach TrulyHandsfree nasz zawsze włączony silnik słów budzenia nasłuchiwał słowa OK Waze przez krótką chwilę podróż miałaby minimalny wpływ na baterię smartfona, ale w przypadku dłuższych podróży pożądana była bardziej wydajna - więc stworzyliśmy To."

Najnowsza wersja TrulyHandsfree obsługuje kilka typów opcji słów aktywacji, w tym słowa stałe i słowa aktywacji zdefiniowane przez użytkownika. Modele słów budzenia dla Alexy, Siri, Asystenta Google, Cortany Microsoftu i systemów Baidu, Alibaba i Tencent. Rozpoznawanie słów w trybie Multi-wake i obsługa wielu języków, w tym angielskiego, holenderskiego, francuskiego, włoskiego, japońskiego, hiszpańskiego i tureckiego.

Sensory twierdzi, że zaktualizowany pakiet SDK dla systemów Android i iOS zostanie udostępniony przed końcem drugiego kwartału 2018 r.