Qualcomm-ის Hexagon 685 DSP არის მანქანათმცოდნეობის ძრავა

Qualcomm-ის Snapdragon 845 შეიცავს მძლავრი მანქანათმცოდნეობის ჩიპს შიგნით. მას ჰქვია Hexagon 685 DSP და ეს არის მნიშვნელოვანი წინგადადგმული ნაბიჯი AI აპარატურაში.

Snapdragon 845 - უახლესი სისტემა ჩიპზე Qualcomm-ის Snapdragon-ის ოჯახში - არის პროცესორის სიმძლავრე. ის ამაყობს სწრაფი CPU ბირთვით, მესამე თაობის Spectra გამოსახულების სიგნალის პროცესორით (ISP) და არქიტექტურით, რომელიც 30 პროცენტით უფრო ენერგოეფექტურია, ვიდრე წინა თაობა. მაგრამ, სავარაუდოდ, მისი ყველაზე შთამბეჭდავი კომპონენტია თანაპროცესორი - Hexagon 685 DSP - რომელიც შექმნილია ხელოვნური ინტელექტისა და მანქანათმცოდნეობისთვის.

რა ხდის Qualcomm-ის Hexagon 685 DSP-ს?

ექვსკუთხა DSP არქიტექტურა Snapdragon 835-ში. წყარო: Qualcomm

ვექტორული მათემატიკა ღრმა სწავლის საფუძველია. - ტრევის ლანიერი, Qualcomm-ის პროდუქტის მენეჯმენტის უფროსი დირექტორი

იმის გასაგებად, თუ რა ხდის Hexagon DSP-ს ასე უნიკალურს, დაგვეხმარება იმის ცოდნა, რომ AI ამოძრავებს მათემატიკის კოლეჯის ინჟინერიის სპეციალობებს. მანქანური სწავლება მოიცავს გამოთვლას დიდი ვექტორებით, რაც გამოწვევას უქმნის სმარტფონის, ტაბლეტის და კომპიუტერის პროცესორებს. ზოგადი დანიშნულების ჩიპებისთვის რთულია ისეთი ალგორითმების გამოთვლა, როგორიცაა სტოქასტური გრადიენტური წარმოშობა - ალგორითმები, რომლებიც ხელოვნური ინტელექტის მქონე აპლიკაციების ბირთვია - სწრაფად და ეფექტურად. Qualcomm-ის Hexagon DSP ნაწილობრივ დაინერგა ამის გადასაჭრელად: ის შესანიშნავია გამოსახულების და სენსორის მონაცემების, განსაკუთრებით ფოტოგრაფიის დამუშავებაში.

მაგრამ Hexagon DSP-ს შეუძლია ბევრად მეტი, ვიდრე სელფის შექმნა. ჩართული HVX კონტექსტი (უფრო შემდგომში) აძლევს მას უპირატესობას როგორც ზოგადი დანიშნულების პროცესორების, ასევე ფიქსირებული ფუნქციის ბირთვების მიმართ; Hexagon 685 DSP საოცრად ეფექტურია მოწყობილობაზე მანქანური სწავლის მიღმა მათემატიკის გამოთვლაში, მაგრამ ინარჩუნებს უფრო პროგრამირებადი პროცესორების მოქნილობას.

ხელოვნური ინტელექტის ჩიპები, როგორიცაა Hexagon 685 DSP, რომლებსაც ზოგჯერ „ნერვული დამუშავების ერთეულებად“ მოიხსენიებენ. „ნერვული ძრავები“ ან „მანქანების სწავლის ბირთვები“ მორგებულია სპეციალურად ხელოვნური ინტელექტის ალგორითმების მათემატიკისთვის. საჭიროებებს. ისინი ბევრად უფრო ხისტია დიზაინით, ვიდრე ტრადიციული პროცესორები და შეიცავს სპეციალურ ინსტრუქციებსა და მოწყობილობებს (Hexagon 685 DSP-ის შემთხვევაში, ზემოხსენებული HVX არქიტექტურა), რომელიც აჩქარებს გარკვეულ სკალარულ და ვექტორულ ოპერაციებს, რომლებიც შესამჩნევი ხდება ფართომასშტაბში განხორციელებები.

Snapdragon 845-ის Hexagon 685 DSP-ს შეუძლია ათასობით ბიტი ვექტორული ერთეულის დამუშავება თითო დამუშავების ციკლზე, შედარებით საშუალო CPU ბირთვის ასობით ბიტი ციკლში. ეს დიზაინით. ოთხი პარალელური სკალარული ძაფით Very Long Instruction Word (VLIW) ოპერაციებისთვის და მრავალი HVX კონტექსტით, DSP არის შეუძლია მრავალჯერადი შესრულების ერთეულის ერთ ინსტრუქციაზე ჟონგლირება და მთელი და ფიქსირებული ათწილადის მეშვეობით ოპერაციები.

იმის ნაცვლად, რომ გაზარდოს შესრულება ნედლეული MHz-ით, Hexagon 685-ის დიზაინი მიზნად ისახავს მუშაობის მაღალ დონეს ციკლზე შემცირებული საათის სიჩქარით. იგი მოიცავს ტექნიკის მრავალ ძაფს, რომელიც კარგად მუშაობს VLIW-სთვის, რადგან მრავალძაფიანი მილსადენის შეყოვნება მალავს VLIW პაკეტების უკეთ გამოყენებას. DSP-ის მრავალსართულიანი ნაკადი ნიშნავს, რომ მას შეუძლია მრავალი გადმოტვირთვის სესიის მომსახურება - ანუ, აუდიო, კამერის ერთდროული აპლიკაციები, კომპიუტერული ხედვა და ასე შემდეგ -- და აჩქარებს სხვადასხვა ამოცანებს ერთდროულად, რაც ხელს უშლის აპლიკაციებს ბრძოლას აღსრულების დრო.

წყარო: Qualcomm

მაგრამ ეს არ არის Hexagon DSP-ის ერთადერთი ძლიერი მხარე. მისი ინსტრუქციების ნაკრების არქიტექტურა (ISA) გამოირჩევა გაუმჯობესებული ეფექტურობით ტრადიციულ VLIW-თან შედარებით გაუმჯობესებული საკონტროლო კოდი და ის იყენებს ჭკვიან ხრიკებს უმოქმედო და გაჩერებულიდან მუშაობის აღსადგენად ძაფები. ის ასევე ახორციელებს ნულოვანი შეყოვნების მრგვალი ძაფების დაგეგმვას, რაც იმას ნიშნავს, რომ DSP-ის ძაფები ამუშავებენ ახალ ინსტრუქციებს წინა მონაცემთა პაკეტის დასრულებისთანავე.

წყარო: Qualcomm

არცერთი ეს არ არის ახალი, გასაგები რომ იყოს. Qualcomm-მა წარმოადგინა "პირველი თაობის" (ან სათანადო) Hexagon DSP -- Hexagon 680, ან QDSP6 v6 -- Snapdragon 820-თან ერთად 2015 წელს და Hexagon 680-ს მოჰყვა ოდნავ გაუმჯობესებული ექვსკუთხედი 682. მაგრამ უახლესი თაობა ჯერ კიდევ ყველაზე დახვეწილია და სამჯერ აღემატება Snapdragon 835-ის DSP-ის მთლიან შესრულებას.

ეს დიდწილად HVX-ის დამსახურებაა, რომელიც ძალიან კარგად მუშაობდა გამოსახულების დამუშავებისთვის (იფიქრეთ გაძლიერებული რეალობა, კომპიუტერული ხედვა, ვიდეო და სურათები). DSP-ის HVX რეგისტრები შეიძლება კონტროლდებოდეს ნებისმიერი ორი სკალარული რეგისტრით, ხოლო HVX ერთეულები და სკალარული ერთეულები შეიძლება გამოყენებულ იქნას ერთდროულად, რაც გამოიწვევს შესრულების მნიშვნელოვან ზრდას და კონკურენტულობას.

აი Qualcomm-ის განმარტება:

„თქვით, რომ თქვენ ამუშავებთ მობილურ პროცესორზე საკონტროლო კოდის რეჟიმში და გადადიხართ გამოთვლით რეჟიმზე კოპროცესორზე. თუ გჭირდებათ რაიმე საკონტროლო კოდი, თქვენ უნდა გაჩერდეთ და დაბრუნდეთ კოპროცესორიდან მთავარ პროცესორზე. ექვსკუთხედთან ერთად, კონტროლის კოდის პროცესორი DSP-ზე და გამოთვლითი კოდის პროცესორი HVX-ზე შეიძლება ერთდროულად იმუშაოს კონტროლისა და გამოთვლითი კოდის მჭიდრო შეერთებისთვის. ეს საშუალებას აძლევს DSP-ს მიიღოს HVX გამოთვლის შედეგი და გამოიყენოს იგი საკონტროლო კოდის გადაწყვეტილების მისაღებად მომდევნო საათის ციკლში.

HVX იძლევა კიდევ ერთ დიდ უპირატესობას გამოსახულების სენსორის დამუშავებაში. Snapdragon მოწყობილობებს Hexagon 685 DSP-ით შეუძლიათ მონაცემების გადატანა პირდაპირ გამოსახულების სენსორიდან DSP-ის ლოკალურ მეხსიერებაში (L2 Cache), მოწყობილობის DDR მეხსიერების კონტროლერის გვერდის ავლით. ეს ამცირებს შეყოვნებას, რა თქმა უნდა, მაგრამ ასევე აუმჯობესებს ბატარეის ხანგრძლივობას - Snapdragon პროცესორი შექმნილია უმოქმედოდ მთელი ოპერაციის განმავლობაში.

ის სპეციალურად ოპტიმიზებულია 16-ბიტიანი მცურავი წერტილის ქსელებისთვის და აკონტროლებს Qualcomm-ის მანქანური სწავლების პროგრამულ უზრუნველყოფას: Snapdragon Neural Processing Engine.

”ჩვენ ეს ძალიან სერიოზულად მივიღეთ,” - თქვა Qualcomm-ის წარმომადგენელმა. ”ჩვენ ვმუშაობთ პარტნიორებთან ბოლო სამი წლის განმავლობაში, რათა მათ გამოიყენონ [...] ჩვენი სილიკონი ხელოვნური ინტელექტისა და გამოსახულების შესაქმნელად.”

ამ პარტნიორებს შორისაა Google, რომელმაც გამოიყენა Hexagon DSP-ის გამოსახულების დამუშავების ნაწილი Pixel-ისა და Pixel 2-ის HDR+ ალგორითმის გასაძლიერებლად, მაგალითად. მიუხედავად იმისა, რომ Google-მა წარმოადგინა საკუთარი Pixel Core ასევე, აღსანიშნავია, რომ Hexagon 685 DSP ჩართული მოწყობილობებია. ისინი, რომლებიც ხედავენ საუკეთესო შედეგებს ცნობილი Google Camera პორტით, ნაწილობრივ იმის გამო (როგორც ჩვენ დავადასტურეთ) HVX უტილიზაცია. Facebook, კიდევ ერთი პარტნიორი, მჭიდროდ თანამშრომლობდა Qualcomm-თან, რათა დაეჩქარებინა მესენჯერის რეალურ დროში კამერის ფილტრები და ეფექტები.

Oppo-მ მოახდინა სახის განბლოკვის ტექნოლოგიის ოპტიმიზაცია Hexagon 685 DSP-ისთვის და Lenovo-მა შეიმუშავა მის გარშემო Landmark Detection ფუნქცია.

პლატფორმის მხარდაჭერის ერთ-ერთი მიზეზი მისი სიმარტივეა. Qualcomm-ის ვრცელი Hexagon SDK მხარს უჭერს Halide ენას მაღალი ხარისხის გამოსახულების დამუშავებისთვის და არ არის საჭირო ინერვიულოთ მანქანური სწავლების ტრენინგის ჩარჩოებზე -- მოდელის დანერგვა ისეთივე მარტივია, როგორც API ზარის განხორციელება, უმეტეს შემთხვევაში შემთხვევები.

„ჩვენ [...] კონკურენციას არ ვუწევთ ისეთ IBM-სა და Nvidia-ს [AI-ში], მაგრამ ჩვენ გვაქვს სფეროები, რომლებზეც დეველოპერებს შეუძლიათ და უკვე აქვთ“, განუცხადა Qualcomm-მა XDA Developers-ს.

ექვსკუთხედი vs. შეჯიბრი

Snapdragon 845-ის Hexagon 685 DSP მოდის, რადგან ორიგინალური აღჭურვილობის მწარმოებლების (OEM) მზარდი რაოდენობა ეძებს მობილურ და მოწყობილობაზე AI გადაწყვეტილებებს. Huawei-ს კირინი 970 -- სისტემა-ჩიპზე შიგნით მათე 10 და Mate 10 Pro -- აქვს "ნერვული დამუშავების განყოფილება" (NPU), რომელსაც შეუძლია ამოიცნოს 2000-ზე მეტი სურათი წამში საშუალო სმარტფონის CPU-ის ენერგიის მოხმარების მხოლოდ 1/50-ით. ხოლო Apple A11 Bionic სისტემა-ჩიპს iPhone 8-ში, iPhone 8 Plus-სა და iPhone X-ში აქვს "ნერვული ძრავა", რომელიც ასრულებს რეალურ დროში სახის მოდელირებას და 600 მილიარდამდე ოპერაციას წამში.

მაგრამ Qualcomm ამბობს, რომ Hexagon-ის პლატფორმის აგნოსტიციზმი მას უპირატესობას ანიჭებს. Apple-ისა და Huawei-სგან განსხვავებით, რომლებიც დიდწილად აიძულებენ დეველოპერებს გამოიყენონ საკუთრების API-ები, Qualcomm ცდილობდა დაეხმარა ზოგიერთი ყველაზე პოპულარული ღია კოდის ფრეიმვორს. მაგალითად, ის მუშაობდა Google-თან ოპტიმიზაციისთვის TensorFlow, Google-ის მანქანათმცოდნეობის პლატფორმა, Hexagon 685 DSP-ისთვის - Qualcomm ამბობს, რომ ის მუშაობს რვაჯერ უფრო სწრაფად და 25-ჯერ უფრო ენერგოეფექტურად, ვიდრე არაჰექსაგონურ მოწყობილობებზე.

წყარო: Qualcomm

Qualcomm-ის DSP არქიტექტურაზე, Google-ის GoogLeNet Inception ღრმა ნერვული ქსელი -- მანქანათმცოდნეობის ალგორითმი შექმნილია ობიექტების აღმოჩენისა და კლასიფიკაციის სისტემების ხარისხის შესაფასებლად -- აჩვენა მიღწევები დემო ჩვენებაში ერთი TensorFlow-ზე მომუშავე გამოსახულების ამოცნობის აპი ორ სმარტფონზე: ერთი, რომელიც ამუშავებს აპს CPU-ზე, მეორე კი Qualcomm-ის Hexagon-ზე. DSP. DSP-ით დაჩქარებული სმარტფონის აპლიკაცია წამში მეტ სურათს იღებდა, ობიექტებს უფრო სწრაფად იდენტიფიცირებდა და უფრო მეტად სჯეროდა მის დასკვნაში, თუ რა იყო ობიექტი, ვიდრე მხოლოდ CPU-ის აპლიკაცია.

Google ასევე იყენებს Hexagon 685 DSP-ს, რათა დააჩქაროს Project Tango, მისი გაძლიერებული რეალობის პლატფორმა სმარტფონებისთვის. Lenovo-ს Phab 2 Pro, Asus-ის ZenFone AR და სხვა მოწყობილობები Tango-ს სიღრმის სენსორული IR მოდულით და გამოსახულების თვალთვალის კამერებით სარგებლობენ Qualcomm-ის შესაძლებლობებით. ჰეტეროგენული დამუშავების არქიტექტურა, რომელიც გადასცემს დამუშავების ამოცანებს Snapdragon ჩიპსეტის Hexagon 685 DSP-ს, სენსორის კერას და გამოსახულების სიგნალს შორის პროცესორი (ISP). Qualcomm-ის თანახმად, შედეგი არის "10 პროცენტზე ნაკლები" ზედნადები სისტემის ჩიპზე CPU-ზე.

„რამდენადაც ჩვენ ვიცით, ჩვენ ვართ ერთადერთი მობილური ბიჭები, რომლებიც [ახორციელებენ] ოპტიმიზაციას შესრულებისა და ენერგიის ეფექტურობისთვის“, - თქვა Qualcomm-ის წარმომადგენელმა.

რა თქმა უნდა, კონკურენტები ასევე მუშაობენ თავიანთი გავლენის სფეროს გაფართოებაზე და დეველოპერების მხარდაჭერაზე თავიანთ პლატფორმებზე. Kirin 970-ის ნერვული ჩიპი გაშვებულია TensorFlow-ის მხარდაჭერით და კაფე (ფეისბუქის ღია API ჩარჩო) Huawei-ს Kirin API-ების გარდა, ერთად TensorFlow Lite და კაფე 2 ინტეგრაცია ამ წლის ბოლოს იქნება. და Huawei მუშაობდა Microsoft-თან, რათა მოეხდინა AI-ით აღჭურვილი მთარგმნელის ოპტიმიზაცია Mate 10-ისთვის.

მაგრამ Qualcomm-ს კიდევ ერთი უპირატესობა აქვს: Reach. ჩიპების მწარმოებელი ფლობდა სმარტფონების ჩიპების ბაზრის 42 პროცენტს 2017 წლის პირველ ნახევარში, რასაც მოჰყვა Apple და MediaTek თითო 18 პროცენტით, Strategy Analytics-ის თანახმად. საკმარისია ითქვას, რომ ის ჯერ არ ირხევა ჩექმებში.

და Qualcomm პროგნოზირებს, რომ ის მხოლოდ გაიზრდება. ჩიპების მწარმოებელი გეგმავს $160 მილიარდის შემოსავალს 2025 წლისთვის ხელოვნური ინტელექტის პროგრამული ტექნოლოგიებით, როგორიცაა კომპიუტერული ხედვა და სმარტფონების ბაზარს - რომელიც, სავარაუდოდ, 2021 წლისთვის 8,6 მილიარდ ერთეულს მიაღწევს - უმსხვილეს ხედავს პლატფორმა.

Hexagon 685 DSP-ით და სხვა „მესამე“ გაუმჯობესებებით, რომლებიც მუდმივად აგრძელებენ გზას ქვემოდან საშუალო დიაპაზონში. აპარატურა, ასევე უფრო ადვილია Qualcomm ჩიპებისთვის მოწყობილობაზე მანქანური სწავლების მიწოდება ყველა სახის მოწყობილობაზე უახლოესი მომავალი. ისინი ასევე სთავაზობენ ხელსაყრელ SDK-ს დეველოპერებისთვის (არ არის საჭირო DSP ასამბლეის ენაზე ჩხუბი), რათა ისარგებლონ Hexagon 685 DSP და HVX აპლიკაციებსა და სერვისებში.

„აუცილებელია ამ გამოყოფილი გადამამუშავებელი ერთეულები ნერვული დამუშავებისთვის, მაგრამ თქვენ ასევე გჭირდებათ მისი გაფართოება, რათა შეძლოთ [ღია კოდის] ჩარჩოების მხარდაჭერა“, - თქვა Qualcomm-ის წარმომადგენელმა. ”თუ თქვენ არ შექმნით ამ ეკოსისტემას, არ არსებობს გზა [...] დეველოპერები მასზე შექმნიან.”