Qualcomm Hexagon 685 DSP yra mašininio mokymosi jėgainė

click fraud protection

„Qualcomm“ „Snapdragon 845“ viduje yra galingas mašininio mokymosi lustas. Jis vadinamas Hexagon 685 DSP ir yra didelis žingsnis į priekį AI aparatūros srityje.

„Snapdragon 845“ – naujausia „Qualcomm“ „Snapdragon“ šeimos lusto sistema – yra procesoriaus galia. Jis gali pasigirti sparčiais procesoriaus branduoliais, trečios kartos Spectra vaizdo signalo procesoriumi (ISP) ir architektūra, kuri yra 30 procentų efektyvesnė nei ankstesnės kartos. Tačiau, ko gero, įspūdingiausias jo komponentas yra bendras procesorius – Hexagon 685 DSP – pritaikytas dirbtiniam intelektui ir mašininiam mokymuisi.

Kas verčia Qualcomm Hexagon 685 DSP?

„Snapdragon 835“ šešiakampio DSP architektūra. Šaltinis: Qualcomm

„Vektorinė matematika yra gilaus mokymosi pagrindas“. – Travis Lanier, Qualcomm produktų valdymo vyresnysis direktorius

Norint suprasti, kuo šešiakampis DSP yra toks unikalus, naudinga žinoti, kad dirbtinį intelektą skatina matematikos koledžo inžinerijos specialybės studentai, kuriuos gerai pažįsta. Mašininis mokymasis apima skaičiavimą su dideliais vektoriais, o tai yra iššūkis išmaniųjų telefonų, planšetinių kompiuterių ir kompiuterių procesoriams. Bendrosios paskirties lustams sunku greitai ir efektyviai apskaičiuoti tokius algoritmus kaip stochastinis gradiento nusileidimas – tokius algoritmus, kurie yra AI valdomų programų pagrindas. „Qualcomm“ šešiakampis DSP buvo pristatytas iš dalies siekiant išspręsti šią problemą: puikiai tvarko vaizdo ir jutiklių duomenis, ypač fotografuojant.

Tačiau „Hexagon DSP“ gali daug daugiau nei patobulinti asmenukes. Įtraukti HVX kontekstai (daugiau apie juos vėliau) suteikia jam tiek bendrosios paskirties procesorių, tiek fiksuotų funkcijų branduolių pranašumą; „Hexagon 685 DSP“ yra nepaprastai efektyvus skaičiuojant matematiką, susijusį su mašininiu mokymusi įrenginyje, tačiau išlaikomas labiau programuojamų procesorių lankstumas.

AI lustai, tokie kaip Hexagon 685 DSP, kurie kartais vadinami „neuroniniais apdorojimo įrenginiais“, „neuroniniai varikliai“ arba „mašininio mokymosi branduoliai“ yra pritaikyti specialiai dirbtinio intelekto matematiniams algoritmams. poreikiai. Jie yra daug griežtesnio dizaino nei tradiciniai procesoriai, juose yra specialių nurodymų ir išdėstymo (Hexagon 685 DSP atveju, anksčiau minėta HVX architektūra), kurios pagreitina tam tikras skaliarines ir vektorines operacijas, kurios tampa pastebimos atliekant didelio masto įgyvendinimai.

Snapdragon 845 Hexagon 685 DSP gali apdoroti tūkstančius vektorinių vienetų bitų per apdorojimo ciklą, palyginti su vidutiniu procesoriaus branduoliu šimtais bitų per ciklą. Tai pagal dizainą. Su keturiomis lygiagrečiomis skaliarinėmis gijomis labai ilgo nurodymo žodžio (VLIW) operacijoms ir keliais HVX kontekstais, DSP yra gali žongliruoti su keliais vykdymo vienetais pagal vieną komandą ir žaibuoti sveikaisiais skaičiais ir fiksuoto kablelio dešimtainėmis dalimis operacijos.

Užuot didinant našumą per neapdorotus MHz, „Hexagon 685“ dizainas siekia aukšto darbo lygio per ciklą esant sumažintam laikrodžio greičiui. Tai apima aparatinę kelių gijų funkciją, kuri puikiai tinka VLIW, nes kelių gijų naudojimas paslepia dujotiekio delsą, leidžiančią geriau panaudoti VLIW paketus. DSP daugiagija reiškia, kad jis gali aptarnauti kelis iškrovimo seansus, t. y. vienu metu veikiančias garso, fotoaparato, kompiuterinis matymas ir tt – ir vienu metu paspartinti įvairias užduotis, neleidžiant programoms kovoti vykdymo laikas.

Šaltinis: Qualcomm

Tačiau tai nėra vieninteliai šešiakampio DSP pranašumai. Jo instrukcijų rinkinio architektūra (ISA) gali pasigirti geresniu efektyvumu, palyginti su tradiciniu VLIW patobulintas valdymo kodas ir jame naudojami protingi triukai, kad būtų atkurtas našumas tuščiąja eiga ir sustojus siūlai. Tai taip pat įgyvendina nulinės delsos apvalų gijų planavimą, o tai reiškia, kad DSP gijos apdoroja naujas instrukcijas iškart po to, kai užbaigia ankstesnį duomenų paketą.

Šaltinis: Qualcomm

Kad būtų aišku, tai nėra nauja. „Qualcomm“ pristatė „pirmosios kartos“ (arba tinkamą) šešiakampį DSP – „Hexagon 680“ arba QDSP6 v6. kartu su „Snapdragon 820“ 2015 m., o „Hexagon 680“ sekė vis tiek šiek tiek patobulintas Šešiakampis 682. Tačiau naujausia karta yra pati moderniausia ir užtikrina iki trijų kartų didesnį našumą nei „Snapdragon 835“ DSP.

Taip yra daugiausia dėl HVX, kuris labai gerai veikė vaizdų apdorojimui (pagalvokite apie papildytą realybę, kompiuterinį matymą, vaizdo įrašus ir nuotraukas). DSP HVX registrus galima valdyti bet kuriais dviem skaliariniais registrais, o HVX ir skaliarinius vienetus galima naudoti vienu metu, todėl labai padidėja našumas ir vienu metu.

Štai Qualcomm paaiškinimas:

„Tarkime, kad apdorojate mobiliajame CPU valdymo kodo režimu ir perjungiate į skaičiavimo režimą koprocesoriuje. Jei jums reikia bet kokio valdymo kodo, turite sustoti ir grįžti iš bendro procesoriaus į pagrindinį procesorių. Naudojant šešiakampį, DSP valdymo kodo procesorius ir HVX skaičiavimo kodo procesorius gali veikti tuo pačiu metu, kad būtų glaudžiai sujungtas valdymo ir skaičiavimo kodas. Tai leidžia DSP paimti HVX skaičiavimo rezultatą ir panaudoti jį priimant sprendimą dėl valdymo kodo kitame laikrodžio cikle.

HVX suteikia dar vieną didelį vaizdo jutiklio apdorojimo pranašumą. Snapdragon įrenginiai su Hexagon 685 DSP gali srautu perduoti duomenis tiesiai iš vaizdo jutiklio į DSP vietinę atmintį (L2 talpyklą), apeinant įrenginio DDR atminties valdiklį. Tai, žinoma, sumažina delsą, bet taip pat pagerina baterijos veikimo laiką – „Snapdragon“ procesorius sukurtas veikti tuščiąja eiga viso veikimo metu.

Jis specialiai optimizuotas 16 bitų slankiojo kablelio tinklams ir valdomas naudojant Qualcomm mašininio mokymosi programinę įrangą: Snapdragon Neural Processing Engine.

„Į tai žiūrėjome labai rimtai“, – sakė „Qualcomm“ atstovas. „Pastaruosius trejus metus dirbome su partneriais, kad jie panaudotų [...] mūsų silicį dirbtiniam intelektui ir vaizdavimui.

Tarp šių partnerių yra „Google“, kuri, pavyzdžiui, naudojo „Hexagon DSP“ vaizdo apdorojimo dalį, kad palaikytų „Pixel“ ir „Pixel 2“ HDR+ algoritmą. Nors „Google“ taip pat pristatė savo „Pixel Core“, verta paminėti, kad „Hexagon 685“ DSP palaikantys įrenginiai yra kurie mato geriausius rezultatus naudojant garsųjį „Google“ fotoaparato prievadą, iš dalies dėl (kaip patvirtinome) HVX panaudojimas. Kitas partneris „Facebook“ glaudžiai bendradarbiavo su „Qualcomm“, kad paspartintų „Messenger“ kameros filtrus ir efektus realiuoju laiku.

„Oppo“ optimizavo veido atrakinimo technologiją „Hexagon 685 DSP“, o „Lenovo“ sukūrė orientyrų aptikimo funkciją.

Viena iš daugybės platformos palaikymo priežasčių yra jos paprastumas. Platus „Qualcomm“ šešiakampis SDK palaiko „Halide“ kalbą, užtikrinančią didelio našumo vaizdų apdorojimą, todėl nereikia nerimauti dėl mašininio mokymosi mokymo sistemų – modelio įdiegimas daugeliu atvejų yra toks pat paprastas kaip API iškvietimas atvejų.

„Mes [...] nekonkuruojame su tokiais kaip IBM ir Nvidia [AI], bet turime sričių, kurias kūrėjai gali pasiekti – ir jau turi“, – „XDA Developers“ sakė „Qualcomm“.

Šešiakampis vs. varžybos

„Snapdragon 845“ „Hexagon 685 DSP“ ateina, nes vis daugiau originalios įrangos gamintojų (OĮG) imasi savo mobiliųjų ir įrenginių AI sprendimų. Huawei Kirin 970 - sistema lusto viduje Draugas 10 ir Mate 10 Pro - turi „neuroninį apdorojimo bloką“ (NPU), kuris, kaip pranešama, gali atpažinti daugiau nei 2000 vaizdų per sekundę, sunaudodamas tik 1/50 vidutinio išmaniojo telefono procesoriaus energijos. O „Apple A11 Bionic“ sistema „iPhone 8“, „iPhone 8 Plus“ ir „iPhone X“ turi „Neural Engine“, kuris realiuoju laiku atlieka veido modeliavimą ir iki 600 milijardų operacijų per sekundę.

Tačiau „Qualcomm“ teigia, kad „Hexagon“ platformos agnosticizmas suteikia jai pranašumą. Skirtingai nei „Apple“ ir „Huawei“, kurios daugiausia verčia kūrėjus naudoti patentuotas API, „Qualcomm“ siekė palaikyti kai kurias populiariausias atvirojo kodo sistemas nuo pat pradžių. Pavyzdžiui, optimizavimas dirbo su „Google“. TensorFlow, „Google“ mašininio mokymosi platforma, skirta „Hexagon 685 DSP“ – „Qualcomm“ teigia, kad ji veikia iki aštuonių kartų greičiau ir 25 kartus efektyviau nei naudojant ne „Hexagon“ įrenginius.

Šaltinis: Qualcomm

„Qualcomm“ DSP architektūroje „Google“. GoogLeNet Inception Deep Neural Network – mašininio mokymosi algoritmas, sukurtas objektų aptikimo ir klasifikavimo sistemų kokybei įvertinti – demonstracinėje demonstracijoje įrodytas pranašumas viena „TensorFlow“ varoma vaizdo atpažinimo programa dviejuose išmaniuosiuose telefonuose: viena, kuri paleidžia programą CPU, o kita – „Qualcomm“ šešiakampyje. DSP. DSP pagreitinta išmaniojo telefono programa užfiksavo daugiau vaizdų per sekundę, greičiau identifikavo objektus ir labiau pasitikėjo savo išvadomis apie tai, kas tai yra, nei tik CPU programėlė.

„Google“ taip pat naudoja „Hexagon 685 DSP“, kad paspartintų „Project Tango“ – papildytos realybės platformą išmaniesiems telefonams. „Lenovo“ „Phab 2 Pro“, „Asus“ „ZenFone AR“ ir kiti įrenginiai su „Tango“ gylio jutimo IR moduliu ir vaizdo stebėjimo kameromis naudojasi „Qualcomm“ pranašumais. Heterogeninė apdorojimo architektūra, kuri perduoda apdorojimo užduotis tarp Snapdragon mikroschemų rinkinio Hexagon 685 DSP, jutiklio šakotuvo ir vaizdo signalo procesorius (ISP). Rezultatas yra „mažiau nei 10 procentų“ pridėtinės sistemos lusto procesoriaus, kaip teigia „Qualcomm“.

„Kiek žinome, esame vieninteliai mobilūs vaikinai, kurie optimizuoja našumą ir energijos vartojimo efektyvumą“, – sakė „Qualcomm“ atstovas.

Žinoma, konkurentai taip pat stengiasi išplėsti savo įtakos sferą ir skatinti kūrėjų palaikymą savo platformose. „Kirin 970“ neuroninis lustas paleistas palaikant „TensorFlow“ ir Kavinė („Facebook“ atvira API sistema), be „Huawei“ Kirin API, su TensorFlow Lite ir Kavinė 2 integracija vyks vėliau šiais metais. „Huawei“ bendradarbiavo su „Microsoft“, kad optimizuotų savo dirbtinio intelekto vertėją, skirtą „Mate 10“.

Tačiau „Qualcomm“ turi dar vieną pranašumą: „Reach“. „Strategy Analytics“ duomenimis, lustų gamintojas 2017 m. pirmąjį pusmetį užėmė 42 procentus išmaniųjų telefonų lustų rinkos, o po 18 procentų – „Apple“ ir „MediaTek“. Pakanka pasakyti, kad jis dar nedreba batais.

Ir Qualcomm prognozuoja, kad jis tik augs. Lustų gamintojas planuoja gauti 160 milijardų dolerių pajamų iki 2025 m., naudodamas dirbtinio intelekto programinės įrangos technologijas, pvz. mano, kad išmaniųjų telefonų rinka, kuri, kaip tikimasi, iki 2021 m. pasieks 8,6 mlrd. vienetų, yra didžiausia platforma.

Su Hexagon 685 DSP ir kitais „tretiniais“ patobulinimais, kurie nuolat patenka į vidutinį diapazoną aparatinė įranga, „Qualcomm“ lustams taip pat lengviau pritaikyti mašininį mokymąsi įrenginyje į visus netoliese esančius įrenginius ateities. Jie taip pat siūlo patogų SDK kūrėjams (nereikia vargti su DSP surinkimo kalba), kad galėtų naudotis Hexagon 685 DSP ir HVX teikiamomis programomis ir paslaugomis.

„Neuroniniam apdorojimui reikia šių specialių apdorojimo vienetų, bet jūs taip pat turite juos išplėsti, kad galėtumėte palaikyti [atvirojo kodo] sistemas“, – sakė „Qualcomm“ atstovas. „Jei nesukuriate tos ekosistemos, [...] kūrėjai negali joje kurti.