Sensory's TrulyHandsFree-ის უახლესი ვერსია, ხმის ამოცნობის მრავალპლატფორმული კომპლექტი iOS და Android-ისთვის, გამოირჩევა ენერგიის მკვეთრად შემცირებული მოხმარებით.
ოდესმე გაინტერესებთ, როგორ რეაგირებენ სმარტფონები, როგორიცაა Huawei Mate 9 Amazon Alexa და Google ასისტენტი ბრძანებებს ("Alexa", "OK, Google") მაშინაც კი, როცა ეკრანი გამორთული და ჩაკეტილია? ეს არის ტექნიკური კომპონენტის წყალობით, რომელსაც ეწოდება DSP, ან ციფრული სიგნალის პროცესორი, გამოყოფილი აუდიო ჩიპი, რომელიც ამუშავებს დაბალი სიმძლავრის, მუდამ ჩართული ფრაზების ამოცნობას (და სხვა ამოცანებს). ეს არის პოპულარული ხმოვანი ასისტენტების ფუნქციონირების ძირითადი ნაწილი. Silicon Valley-ში დაფუძნებული კომპანია Sensory ამბობს, რომ მისი პროგრამულ უზრუნველყოფაზე დაფუძნებული ალტერნატივა, TrulyHandsfree, აძლევს DSP-ებს ფულს.
TrulyHandsFree, რომელიც კომპანიის მტკიცებით არის "ყველაზე ფართოდ განლაგებული" მეტყველების ამოცნობის სისტემა მსოფლიოში, არის გაღვიძებული სიტყვა და მეტყველების ამოცნობის კომპლექტი შექმნილია დაბალი სიმძლავრის ხმის ამოცნობის მხარდასაჭერად აპლიკაციებში Android, iOS და სხვა პლატფორმებზე. Sensory ამბობს, რომ პროგრამული უზრუნველყოფა "ხელახლა დაპროექტებულია" გაზრდილი სიზუსტისთვის, ენერგიის დაბალი მოხმარებისა და მოწყობილობის გაფართოებული მხარდაჭერისთვის.
„ხმოვანი კონტროლისთვის უკონტაქტო ოპერაცია ნორმად იქცა და აპლიკაციის შემქმნელები ახლა ცდილობენ შექმნან უკონტაქტო გაღვიძების სიტყვები საკუთარი აპებისთვის. თქვა სენსორის აღმასრულებელმა დირექტორმა ტოდ მოზერმა განცხადებაში.
ახალი და გაუმჯობესებული TrulyHandsfree-ის განვითარება 2017 წელს დაიწყო. Sensory გაერთიანდა ჩიპების მწარმოებელ Qualcomm-თან და ARM-თან, რათა გაერკვიათ, როგორ შეამცირონ ენერგიის მოხმარება ხმოვანი ასისტენტის გამოღვიძების სიტყვებისთვის. მან დანერგა სამი ტექნიკა:
- Sensory-ის "პატარა-დიდი" მუდამ მოსმენის ფუნქცია იყენებს ხმის ამოცნობის პატარა მოდელს პოტენციური გამოღვიძების სიტყვების იდენტიფიცირებისთვის და ამ მაღვიძარა სიტყვების ხელახლა გადამოწმებისთვის დიდ მოდელზე. მას არ აქვს მოთხოვნილი დენის მოთხოვნები, მაგრამ ის უფრო ზუსტია ოდნავ მეტი ენერგიის მოხმარების გარეშე.
- ჩარჩოს დაწყობა, ნერვული ქსელის ტრენინგის მეთოდი, რომელიც იწვევს უფრო ზუსტ მოდელებს და უფრო სწრაფ დეკოდირებას, წყვეტს გარკვეულ მაღვიძარას მოდელის დამუშავების ფუნქციების MIPS (მილიონი ინსტრუქცია წამში, დამუშავების შესრულების საზომი) განახევრებულია ზემოქმედების გარეშე სიზუსტე.
- Multithreading საშუალებას იძლევა უფრო ეფექტური მეტყველების ამოცნობის დამუშავება და აუმჯობესებს შესრულების დროს უფრო დიდი wake word მოდელებისთვის.
Sensory ამბობს, რომ გაუმჯობესებები ერთად ამცირებს ენერგიის მოხმარებას მობილურ აპებზე 80%-ზე მეტით, რაც უდრის 200 mAh-ს დღეში 12 საათში.
თუ თქვენ იყენებდით Waze ნავიგაციის აპის უახლეს ვერსიას, თქვენ უკვე ნახეთ ახალი TrulyHandsfree მოქმედებაში. „ჩვენ ახლახან დავეხმარეთ Google-ის Waze-ს, მიეღო უკონტაქტო ხმოვანი ბრძანებები, მივაწოდეთ მათ სენსორული სიტყვით „OK Waze“, რომელიც მუშაობს აპის გახსნის დროს. - თქვა მისტერ მოზერმა. "TrulyHandsfree-ის წინა ვერსიებით, ჩვენი მუდამ ჩართული wake word ძრავა უსმენს OK Waze wake სიტყვას მოკლე დროის განმავლობაში მოგზაურობა მინიმალურ გავლენას მოახდენდა სმარტფონის ბატარეაზე, მაგრამ გრძელი მოგზაურობისთვის სასურველი იყო უფრო ეფექტური -- ასე რომ, ჩვენ შევქმენით ის."
უახლესი TrulyHandsfree იგზავნება რამდენიმე ტიპის wake word ოფციების მხარდაჭერით, მათ შორის ფიქსირებული სიტყვებისა და მომხმარებლის მიერ განსაზღვრული wake სიტყვების ჩათვლით. Wake Word-ის მოდელები Alexa-სთვის, Siri-სთვის, Google Assistant-ისთვის, Microsoft-ის Cortana-სთვის და Baidu-ს, Alibaba-სა და Tencent-ის სისტემებისთვის. მრავალჯერადი სიტყვების ამოცნობა და მრავალი ენის მხარდაჭერა, მათ შორის ინგლისური, ჰოლანდიური, ფრანგული, იტალიური, იაპონური, ესპანური და თურქული.
Sensory ამბობს, რომ განახლებული SDK Android-ისთვის და iOS-ისთვის გამოვა 2018 წლის მეორე კვარტალამდე.