זיהוי מילות עזר שמקשיב תמיד ללא ניקוז חשמל עשוי להגיע בקרוב לאפליקציות אנדרואיד עם TrulyHandsfree

click fraud protection

הגרסה החדשה ביותר של TrulyHandsFree של Sensory, חבילת זיהוי קולי חוצה פלטפורמות עבור iOS ואנדרואיד, מתהדרת בצריכת חשמל מופחתת באופן דרמטי.

תהית אי פעם איך מגיבים סמארטפונים כמו Huawei Mate 9 אמזון אלקסה ו Google Assistant פקודות ("Alexa", "OK, Google") גם כשהמסך כבוי ונעול? זה הודות לרכיב חומרה הנקרא DSP, או מעבד אותות דיגיטלי, שבב אודיו ייעודי שמטפל בזיהוי ביטויים בעוצמה נמוכה ופועל תמיד (ומשימות אחרות). זה הליבה לפונקציונליות של עוזרי קול פופולריים. חברת Sensory, המבוססת על עמק הסיליקון, אומרת שהחלופה מבוססת התוכנה שלה, TrulyHandsfree, נותנת ל-DSP להרוויח כסף.

TrulyHandsFree, שהחברה טוענת שהוא מנוע זיהוי הדיבור "הנפוץ ביותר" בעולם, הוא מילת השקפה ו חבילת זיהוי דיבור שנועדה לתמוך בזיהוי קול בעוצמה נמוכה ביישומים ברחבי אנדרואיד, iOS ופלטפורמות אחרות. חושי אומר שהתוכנה "הונדסה מחדש" לדיוק מוגבר, צריכת חשמל נמוכה יותר ותמיכה מורחבת במכשירים.

"הפעלת דיבורית לשליטה קולית הפכה לנורמה, ומפתחי יישומים מחפשים כעת ליצור מילות התעוררות ללא ידיים עבור האפליקציות שלהם." אמר טוד מוזר, מנכ"ל סנסוריו, בהצהרה.

פיתוח ה-TrulyHandsfree החדש והמשופר החל ב-2017. חושי חברו ליצרנית השבבים קוואלקום ו-ARM כדי להבין כיצד להפחית את צריכת החשמל עבור מילות השכמה של עוזר הקולי. הוא יישם שלוש טכניקות:

  • תכונת ההקשבה התמידית "קטנה-גדולה" של Sensory משתמשת במודל זיהוי קול קטן כדי לזהות מילות ערות פוטנציאליות ולאמת את מילות הערות הללו בדגם גדול. אין לו דרישות כוח תובעניות, אבל הוא מדויק יותר מבלי לצרוך מעט יותר חשמל.
  • Frame stacking, שיטה לאימון רשתות עצביות שמובילה למודלים מדויקים יותר ולפענוח מהיר יותר, חותכת מילות ערות מסוימות MIPS של פונקציות עיבוד מודל (מיליון הוראות בשנייה, מדד לביצועי עיבוד) בחצי מבלי להשפיע דיוק.
  • ריבוי הליכי שרשור מאפשר עיבוד יעיל יותר של זיהוי דיבור ומשפר את זמן הביצוע עבור מודלים גדולים יותר של Wake Word.

חושי אומר ביחד שהשיפורים מפחיתים את צריכת החשמל באפליקציות לנייד ביותר מ-80%, מה שמשתווה ל-200mAh ביממה של 12 שעות.

אם השתמשת בגרסה העדכנית ביותר של אפליקציית הניווט Waze, כבר ראית את ה-TrulyHandsfree החדש בפעולה. "לאחרונה עזרנו ל-Waze של גוגל לקבל פקודות קוליות ללא ידיים בכך שסיפקנו להן את מילת ההתעוררות 'OK Waze' של Sensory שפועלת כשהאפליקציה פתוחה." אמר מר מוזר. "עם גרסאות קודמות של TrulyHandsfree, מנוע מילות ההתעוררות התמיד פועל שלנו מאזין למילת ההתעוררות OK Waze במהלך קצר לנסיעה הייתה השפעה מינימלית על הסוללה של הסמארטפון, אבל לנסיעות ארוכות יותר, היה רצוי יותר יעיל -- אז יצרנו זה."

ה-TrulyHandsfree העדכני ביותר מגיע עם תמיכה במספר סוגים של אפשרויות מילות התעוררות, כולל מילים קבועות ומילות התעוררות המוגדרות על ידי המשתמש. מודלים של Wake word עבור Alexa, Siri, Google Assistant, Cortana של Microsoft ומערכות מ-Baidu, Alibaba ו-Tencent. זיהוי מילים מרובות ערות ותמיכה במספר שפות כולל אנגלית, הולנדית, צרפתית, איטלקית, יפנית, ספרדית וטורקית.

Sensory אומר ש-SDK מעודכן עבור אנדרואיד ו-iOS יושק לפני סוף הרבעון השני של 2018.