Hexagon 685 DSP на Qualcomm е мощна машина за обучение

click fraud protection

Snapdragon 845 на Qualcomm разполага с мощен чип за машинно обучение. Нарича се Hexagon 685 DSP и е голяма стъпка напред в AI хардуера.

Snapdragon 845 – най-новата система върху чип в семейството Snapdragon на Qualcomm – е мощен процесор. Той може да се похвали с бързи CPU ядра, трето поколение Spectra сигнален процесор (ISP) и архитектура, която е с 30 процента по-енергийно ефективна от предишното поколение. Но може би най-впечатляващият му компонент е копроцесор - Hexagon 685 DSP - който е специално създаден за изкуствен интелект и машинно обучение.

Какво точно прави Hexagon 685 DSP на Qualcomm?

Архитектурата Hexagon DSP в Snapdragon 835. Източник: Qualcomm

„Векторната математика е в основата на дълбокото обучение.“ - Травис Лание, старши директор продуктов мениджмънт в Qualcomm

За да разберем какво прави Hexagon DSP толкова уникален, е полезно да знаем, че AI се ръководи от типа инженерни специалности в математическите колежи, с които са добре запознати. Машинното обучение включва изчисление с големи вектори, което представлява предизвикателство за процесорите за смартфони, таблети и компютри. Трудно е за чипове с общо предназначение да изчисляват алгоритми като стохастичен градиентен спускане – видовете алгоритми, които са в основата на приложенията, захранвани с AI – бързо и ефективно. Hexagon DSP на Qualcomm беше въведен отчасти, за да реши това: той е страхотен при обработка на изображения и данни от сензори, особено фотография.

Но Hexagon DSP е способен на много повече от хубави селфита. Включените HVX контексти (повече за тях по-късно) му дават предимството както на процесори с общо предназначение, така и на ядра с фиксирана функция; Hexagon 685 DSP е страхотно ефективен при изчисляването на математиката зад машинното обучение на устройството, но запазва гъвкавостта на по-програмируемите процесори.

AI чипове като Hexagon 685 DSP, които понякога се наричат ​​„невронни процесори“, „невронни двигатели“ или „ядра за машинно обучение“ са пригодени специално за математическите алгоритми на AI потребности. Те са много по-твърди като дизайн от традиционните процесори и съдържат специални инструкции и договорености (в случая на Hexagon 685 DSP, гореспоменатата HVX архитектура), които ускоряват определени скаларни и векторни операции, които стават забележими в голям мащаб изпълнения.

Hexagon 685 DSP на Snapdragon 845 може да обработва хиляди битове векторни единици на цикъл на обработка, в сравнение със стотици битове на цикъл на средно процесорно ядро. Това е по дизайн. С четири паралелни скаларни нишки за операции с много дълга инструкционна дума (VLIW) и множество HVX контексти, DSP е способен да жонглира с множество изпълнителни единици на една инструкция и да преминава през цяло число и десетична запетая операции.

Вместо да повишава производителността чрез сурови MHz, дизайнът на Hexagon 685 цели високи нива на работа на цикъл при намалена тактова честота. Той включва хардуерна многонишковост, която работи добре за VLIW, тъй като многонишковостта скрива закъсненията на конвейера, позволявайки по-добро използване на VLIW пакетите. Многонишковостта на DSP означава, че може да обслужва множество сесии за разтоварване -- т.е. едновременни приложения за аудио, камера, компютърно зрение и така нататък -- и ускоряват различни задачи едновременно, като предотвратяват борбата на приложенията време за изпълнение.

Източник: Qualcomm

Но това не са единствените силни страни на Hexagon DSP. Неговата архитектура на набор от инструкции (ISA) може да се похвали с подобрена ефективност спрямо традиционния VLIW благодарение на подобрен контролен код и използва хитри трикове за възстановяване на производителността от празен ход и застой нишки. Той също така прилага кръгово планиране на нишки с нулева латентност, което означава, че нишките на DSP обработват нови инструкции веднага след завършване на предишния пакет данни.

Източник: Qualcomm

Нищо от това не е ново, за да бъде ясно. Qualcomm представи „първото поколение“ (или истински) Hexagon DSP -- Hexagon 680 или QDSP6 v6 -- заедно със Snapdragon 820 през 2015 г., а Hexagon 680 беше последван от все толкова леко подобрения Шестоъгълник 682. Но последното поколение е най-усъвършенстваното досега и осигурява до три пъти по-висока обща производителност от DSP на Snapdragon 835.

Това е благодарение до голяма степен на HVX, който работи много добре за обработка на изображения (помислете за разширена реалност, компютърно зрение, видео и снимки). HVX регистрите на DSP могат да се управляват от всеки два от скаларните регистри, а HVX единиците и скаларните единици могат да се използват едновременно, което води до значителни печалби в производителността и паралелност.

Ето Обяснението на Qualcomm:

„Да кажем, че обработвате на мобилния процесор в режим на контролен код и превключвате на изчислителен режим на копроцесора. Ако имате нужда от контролен код, трябва да спрете и да се върнете от копроцесора към главния процесор. С Hexagon както процесорът за контролен код на DSP, така и процесорът за изчислителен код на HVX могат да работят едновременно за тясно свързване на контролен и изчислителен код. Това позволява на DSP да вземе резултата от HVX изчисление и да го използва в решение за контролен код в следващия тактов цикъл.

HVX предлага друго голямо предимство при обработката на сензора за изображения. Устройствата Snapdragon с Hexagon 685 DSP могат да предават данни директно от сензора за изображения към локалната памет на DSP (L2 Cache), заобикаляйки контролера на DDR паметта на устройството. Това, разбира се, намалява латентността, но също така подобрява живота на батерията - процесорът Snapdragon е проектиран да работи на празен ход през цялата операция.

Той е специално оптимизиран за 16-битови мрежи с плаваща запетая и се контролира от софтуера за машинно обучение на Qualcomm: Snapdragon Neural Processing Engine.

„Приехме го много сериозно“, каза говорител на Qualcomm. „През последните три години работим с партньори, за да ги накараме да използват [...] нашия силиций за AI и изображения.“

Тези партньори включват Google, който използва частта за обработка на изображения на Hexagon DSP, за да захрани например алгоритъма HDR+ на Pixel и Pixel 2. Въпреки че Google също представи своя собствен Pixel Core, заслужава да се отбележи, че устройствата с активиран DSP Hexagon 685 са такива, които показват най-добри резултати с известния порт на Google Camera, отчасти поради (както потвърдихме) на HVX използване. Facebook, друг партньор, работи в тясно сътрудничество с Qualcomm, за да ускори филтрите и ефектите на камерата в реално време на Messenger.

Oppo оптимизира своята технология за отключване с лице за Hexagon 685 DSP, а Lenovo разработи своята функция за разпознаване на забележителности около него.

Една от причините за богатата поддръжка на платформата е нейната простота. Обширният Hexagon SDK на Qualcomm поддържа езика Halide за високопроизводителна обработка на изображения и няма нужда да се притеснявате за рамки за обучение на машинно обучение - внедряването на модел е толкова просто, колкото и извикване на API, в повечето случаи случаи.

„Ние [...] не се конкурираме с подобни на IBM и Nvidia [в AI], но имаме области, в които разработчиците могат да се възползват – и вече имат“, каза Qualcomm пред XDA Developers.

Шестоъгълник срещу. състезанието

Hexagon 685 DSP на Snapdragon 845 се появява, тъй като все повече производители на оригинално оборудване (OEM) преследват свои собствени решения за AI за мобилни устройства и устройства. на Huawei Кирин 970 -- системата-върху-чипа вътре в Mate 10 и Mate 10 Pro – има „невронен процесор“ (NPU), който според съобщенията може да разпознае повече от 2000 изображения в секунда при само 1/50 от консумацията на енергия на среден процесор на смартфон. А системата-върху-чипа Apple A11 Bionic в iPhone 8, iPhone 8 Plus и iPhone X има „Neural Engine“, който извършва лицево моделиране в реално време и до 600 милиарда операции в секунда.

Но Qualcomm казва, че агностицизмът на платформата на Hexagon му дава предимство. За разлика от Apple и Huawei, които до голяма степен принуждават разработчиците да използват собствени API, Qualcomm се стреми да поддържа някои от най-популярните рамки с отворен код от самото начало. Например работи с Google за оптимизиране TensorFlow, платформата за машинно обучение на Google, за Hexagon 685 DSP – Qualcomm казва, че работи до осем пъти по-бързо и 25 пъти по-енергоефективно, отколкото на устройства, различни от Hexagon.

Източник: Qualcomm

На DSP архитектурата на Qualcomm, тази на Google Дълбока невронна мрежа за начало на GoogLeNet -- алгоритъм за машинно обучение, предназначен да оцени качеството на системите за откриване и класифициране на обекти -- демонстрирани печалби в демонстрация, показваща едно приложение за разпознаване на изображения, задвижвано от TensorFlow, на два смартфона: единият, който изпълнява приложението на процесора, а другият, който го изпълнява на Hexagon на Qualcomm DSP. Ускореното с DSP приложение за смартфон засне повече изображения в секунда, идентифицира обектите по-бързо и имаше по-голяма увереност в заключението си за това какъв е обектът, отколкото приложението само за процесора.

Google също използва Hexagon 685 DSP, за да ускори Project Tango, своята платформа за добавена реалност за смартфони. Phab 2 Pro на Lenovo, ZenFone AR на Asus и други устройства с инфрачервения модул за разпознаване на дълбочина на Tango и камери за проследяване на изображения се възползват от предимствата на Qualcomm Архитектура за хетерогенна обработка, която делегира задачи за обработка между Hexagon 685 DSP на чипсета Snapdragon, хъба на сензора и сигнала на изображението процесор (ISP). Резултатът е „по-малко от 10 процента“ режийни разходи за процесора на системата върху чипа, според Qualcomm.

„Доколкото знаем, ние сме единствените мобилни момчета, които оптимизират за производителност и енергийна ефективност“, каза говорител на Qualcomm.

Разбира се, конкурентите също работят, за да разширят сферата си на влияние и да насърчат подкрепата на разработчиците на своите платформи. Невронният чип на Kirin 970 стартира с поддръжка на TensorFlow и Кафе (Отворената API рамка на Facebook) в допълнение към API на Kirin на Huawei, с TensorFlow Lite и Кафе 2 интеграция предстои по-късно тази година. И Huawei работи с Microsoft, за да оптимизира своя преводач, работещ с AI за Mate 10.

Но Qualcomm има друго предимство: Обхват. Производителят на чипове контролираше 42 процента от пазара на чипове за смартфони през първата половина на 2017 г., следван от Apple и MediaTek с по 18 процента, според Strategy Analytics. Достатъчно е да се каже, че все още не се тресе в ботушите си.

И Qualcomm прогнозира, че само ще расте. Производителят на чипове предвижда 160 милиарда долара приходи до 2025 г. със софтуерни технологии за изкуствен интелект като компютърно зрение и вижда пазара на смартфони – който се очаква да достигне 8,6 милиарда доставени единици до 2021 г. – като най-големия платформа.

С Hexagon 685 DSP и други „третични“ подобрения, непрекъснато си проправят път надолу по веригата към средния клас хардуер, също така е по-лесно за чиповете на Qualcomm да внесат машинно обучение на устройството за всички видове устройства в близко бъдеще бъдеще. Те също така предлагат удобен SDK за разработчици (няма нужда да се занимавате с DSP асемблер), за да се възползват от Hexagon 685 DSP и HVX в своите приложения и услуги.

„Има нужда от тези специализирани процесорни единици за невронна обработка, но вие също трябва да ги разширите, така че да можете да поддържате рамки с [отворен код]“, каза говорител на Qualcomm. „Ако не създадете тази екосистема, няма начин [...] разработчиците да създават върху нея.“