Η αναγνώριση λέξεων-κλειδιών που ακούγεται πάντα χωρίς εξάντληση ρεύματος μπορεί σύντομα να έρθει σε εφαρμογές Android με το TrulyHandsfree

Η πιο πρόσφατη έκδοση του TrulyHandsFree της Sensory, μιας σουίτας αναγνώρισης φωνής μεταξύ πλατφορμών για iOS και Android, μπορεί να υπερηφανεύεται για δραματικά μειωμένη κατανάλωση ενέργειας.

Αναρωτηθήκατε ποτέ πώς ανταποκρίνονται smartphone όπως το Huawei Mate 9 Amazon Alexa και Βοηθός Google εντολές ("Alexa", "OK, Google") ακόμα και όταν η οθόνη είναι απενεργοποιημένη και κλειδωμένη; Χάρη σε ένα εξάρτημα υλικού που ονομάζεται DSP, ή επεξεργαστής ψηφιακού σήματος, ένα αποκλειστικό τσιπ ήχου που χειρίζεται τον εντοπισμό φράσεων χαμηλής κατανάλωσης και πάντα ενεργό (και άλλες εργασίες). Είναι ο πυρήνας της λειτουργικότητας των δημοφιλών φωνητικών βοηθών. Η εταιρεία Sensory που εδρεύει στη Silicon Valley λέει ότι η εναλλακτική της που βασίζεται σε λογισμικό, η TrulyHandsfree, δίνει στους DSP μια καλή επιλογή για τα χρήματά τους.

Το TrulyHandsFree, το οποίο η εταιρεία ισχυρίζεται ότι είναι η «πιο ευρέως αναπτυγμένη» μηχανή αναγνώρισης ομιλίας στον κόσμο, είναι μια αφύπνιση και σουίτα αναγνώρισης ομιλίας που έχει σχεδιαστεί για να υποστηρίζει αναγνώριση φωνής χαμηλής κατανάλωσης σε εφαρμογές σε Android, iOS και άλλες πλατφόρμες. Η Sensory λέει ότι το λογισμικό έχει "επανασχεδιαστεί" για αυξημένη ακρίβεια, χαμηλότερη κατανάλωση ενέργειας και διευρυμένη υποστήριξη συσκευών.

"Η λειτουργία hands-free για φωνητικό έλεγχο έχει γίνει ο κανόνας και οι προγραμματιστές εφαρμογών προσπαθούν τώρα να δημιουργήσουν λέξεις αφύπνισης hands-free για τις δικές τους εφαρμογές." δήλωσε ο Todd Mozer, Διευθύνων Σύμβουλος της Sensory, σε μια δήλωση.

Η ανάπτυξη του νέου και βελτιωμένου TrulyHandsfree ξεκίνησε το 2017. Η Sensory συνεργάστηκε με τον κατασκευαστή τσιπ Qualcomm και την ARM για να ανακαλύψει πώς να μειώσει την κατανάλωση ενέργειας για τις λέξεις αφύπνισης του φωνητικού βοηθού. Εφάρμοσε τρεις τεχνικές:

  • Το χαρακτηριστικό "λίγο-μεγάλο" πάντα ακρόασης του Sensory χρησιμοποιεί ένα μικρό μοντέλο αναγνώρισης φωνής για να εντοπίσει πιθανές αφυπνιστικές λέξεις και να επικυρώσει ξανά αυτές τις αφυπνιστικές λέξεις σε ένα μεγάλο μοντέλο. Δεν έχει απαιτητικές απαιτήσεις ισχύος, αλλά είναι πιο ακριβές χωρίς να καταναλώνει λίγο περισσότερη ισχύ.
  • Η στοίβαξη πλαισίων, μια μέθοδος εκπαίδευσης νευρωνικών δικτύων που οδηγεί σε ακριβέστερα μοντέλα και ταχύτερη αποκωδικοποίηση, κόβει ορισμένες λέξεις αφύπνισης MIPS των λειτουργιών επεξεργασίας μοντέλου (εκατομμύρια εντολές ανά δευτερόλεπτο, ένα μέτρο της απόδοσης επεξεργασίας) στο μισό χωρίς επιπτώσεις ακρίβεια.
  • Το Multithreading επιτρέπει πιο αποτελεσματική επεξεργασία αναγνώρισης ομιλίας και βελτιώνει τον χρόνο εκτέλεσης για μεγαλύτερα μοντέλα wake word.

Η Sensory λέει ότι μαζί οι βελτιώσεις μειώνουν την κατανάλωση ενέργειας στις εφαρμογές για κινητά κατά περισσότερο από 80%, που ισοδυναμεί με 200 mAh σε μια ημέρα 12 ωρών.

Εάν έχετε χρησιμοποιήσει την πιο πρόσφατη έκδοση της εφαρμογής πλοήγησης Waze, έχετε ήδη δει το νέο TrulyHandsfree σε δράση. "Πρόσφατα βοηθήσαμε το Waze της Google να δέχεται φωνητικές εντολές hands-free παρέχοντάς τους τη λέξη αφύπνισης "OK Waze" του Sensory που εκτελείται όταν η εφαρμογή είναι ανοιχτή." είπε ο κύριος Μόζερ. "Με τις προηγούμενες εκδόσεις του TrulyHandsfree, η μηχανή αφύπνισης λέξεων πάντα ενεργοποιημένη ακούει τη λέξη αφύπνισης OK Waze κατά τη διάρκεια ενός σύντομου Το ταξίδι θα είχε ελάχιστη επίδραση στην μπαταρία ενός smartphone, αλλά για μεγαλύτερα ταξίδια, ήταν επιθυμητό ένα πιο αποτελεσματικό -- έτσι δημιουργήσαμε το."

Το πιο πρόσφατο TrulyHandsfree αποστέλλεται με υποστήριξη για διάφορους τύπους επιλογών λέξεων αφύπνισης, συμπεριλαμβανομένων σταθερών λέξεων και λέξεων αφύπνισης που ορίζονται από το χρήστη. Wake word μοντέλα για Alexa, Siri, Google Assistant, Cortana της Microsoft και συστήματα από Baidu, Alibaba και Tencent. Αναγνώριση λέξεων πολλαπλών αφύπνισης και υποστήριξη για πολλές γλώσσες, όπως Αγγλικά, Ολλανδικά, Γαλλικά, Ιταλικά, Ιαπωνικά, Ισπανικά και Τουρκικά.

Η Sensory λέει ότι ένα ενημερωμένο SDK για Android και iOS θα κυκλοφορήσει πριν από το τέλος του δεύτερου τριμήνου του 2018.