Qualcomm Hexagon 685 DSP ir mašīnmācīšanās spēkstacija

click fraud protection

Qualcomm Snapdragon 845 iekšpusē ir jaudīga mašīnmācīšanās mikroshēma. To sauc par Hexagon 685 DSP, un tas ir nozīmīgs solis uz priekšu AI aparatūrā.

Snapdragon 845 — jaunākā sistēma mikroshēmā Qualcomm Snapdragon saimē — ir procesora spēkstacija. Tam ir ātri CPU kodoli, trešās paaudzes Spectra attēla signālu procesors (ISP) un arhitektūra, kas ir par 30 procentiem efektīvāka nekā iepriekšējā paaudze. Taču neapšaubāmi tā iespaidīgākā sastāvdaļa ir kopprocesors — Hexagon 685 DSP —, kas ir īpaši izstrādāts mākslīgajam intelektam un mašīnmācībai.

Kas liek Qualcomm Hexagon 685 DSP atzīmēt?

Sešstūra DSP arhitektūra Snapdragon 835. Avots: Qualcomm

"Vektormatemātika ir dziļas mācīšanās pamats." - Treviss Lanjē, Qualcomm produktu pārvaldības vecākais direktors

Lai saprastu, kas padara Hexagon DSP tik unikālu, ir noderīgi zināt, ka AI virza tas, kāds matemātikas koledžas inženierzinātņu augstskolas ir labi pazīstamas. Mašīnmācība ietver aprēķinus ar lieliem vektoriem, kas rada izaicinājumu viedtālruņu, planšetdatoru un datoru procesoriem. Universālām mikroshēmām ir grūti ātri un efektīvi aprēķināt tādus algoritmus kā stohastiskā gradienta nolaišanās — tādus algoritmus, kas ir AI darbināmu lietotņu pamatā. Qualcomm Hexagon DSP tika ieviests daļēji, lai atrisinātu šo problēmu: tas lieliski apstrādā attēlu un sensoru datus, īpaši fotografējot.

Taču Hexagon DSP spēj daudz vairāk nekā pašbildes. Iekļautie HVX konteksti (vairāk par tiem vēlāk) nodrošina gan vispārējas nozīmes procesoru, gan fiksētas funkcijas kodolu priekšrocības; Hexagon 685 DSP ir ārkārtīgi efektīva, lai aprēķinātu matemātiku, kas ir saistīta ar mašīnmācīšanos ierīcē, bet saglabā vairāk programmējamu procesoru elastību.

AI mikroshēmas, piemēram, Hexagon 685 DSP, kuras dažreiz dēvē par “neironu apstrādes vienībām”, “neironu dzinēji” vai “mašīnmācīšanās kodoli” ir īpaši pielāgoti mākslīgā intelekta algoritmu matemātikai vajadzībām. Tiem ir daudz stingrāka konstrukcija nekā tradicionālajiem CPU, un tajos ir īpašas instrukcijas un izkārtojumi (Hexagon 685 DSP gadījumā, iepriekšminētā HVX arhitektūra), kas paātrina noteiktas skalārās un vektora darbības, kas kļūst pamanāmas liela mēroga īstenošanas.

Snapdragon 845 Hexagon 685 DSP var apstrādāt tūkstošiem bitu vektora vienību apstrādes ciklā, salīdzinot ar vidējo CPU kodolu simtiem bitu ciklā. Tas ir pēc dizaina. Ar četriem paralēliem skalārajiem pavedieniem ļoti garu instrukciju vārdu (VLIW) operācijām un vairākiem HVX kontekstiem, DSP ir spēj žonglēt ar vairākām izpildes vienībām ar vienu instrukciju un izskanēt caur veseliem skaitļiem un fiksēta komata decimāldaļām operācijas.

Tā vietā, lai palielinātu veiktspēju, izmantojot neapstrādātus MHz, Hexagon 685 dizaina mērķis ir nodrošināt augstu darba līmeni ciklā ar samazinātu pulksteņa ātrumu. Tas ietver aparatūras daudzpavedienu izmantošanu, kas labi darbojas VLIW, jo vairāku vītņu izmantošana slēpj konveijera latentumus, kas ļauj labāk izmantot VLIW paketes. DSP daudzpavedienu izmantošana nozīmē, ka tas var apkalpot vairākas izkraušanas sesijas, t.i., vienlaikus lietotnes audio, kamerai, datorredze utt. — un vienlaikus paātrina dažādus uzdevumus, neļaujot lietojumprogrammām cīnīties par izpildes laiks.

Avots: Qualcomm

Taču tās nav vienīgās Hexagon DSP stiprās puses. Tā instrukciju kopas arhitektūra (ISA) lepojas ar uzlabotu efektivitāti salīdzinājumā ar tradicionālo VLIW, pateicoties uzlabots vadības kods, un tajā tiek izmantoti gudri triki, lai atgūtu veiktspēju no dīkstāves un apstāšanās pavedieni. Tas arī ievieš nulles latentuma apļveida pavedienu plānošanu, kas nozīmē, ka DSP pavedieni apstrādā jaunas instrukcijas tūlīt pēc iepriekšējās datu paketes pabeigšanas.

Avots: Qualcomm

Nekas no tā nav jauns, lai būtu skaidrs. Qualcomm ieviesa “pirmās paaudzes” (vai pareizu) Hexagon DSP — Hexagon 680 vai QDSP6 v6. līdzās Snapdragon 820 2015. gadā, un Hexagon 680 sekoja arvien tik nedaudz uzlabotais Sešstūris 682. Taču jaunākā paaudze ir līdz šim vismodernākā, un tā nodrošina līdz pat trīs reizēm lielāku veiktspēju nekā Snapdragon 835 DSP.

Tas lielā mērā ir pateicoties HVX, kas ļoti labi darbojās attēlu apstrādē (domājiet par paplašināto realitāti, datorredzi, video un attēliem). DSP HVX reģistrus var kontrolēt ar jebkuriem diviem skalārajiem reģistriem, un HVX vienības un skalārās vienības var izmantot vienlaikus, tādējādi nodrošinot ievērojamu veiktspējas pieaugumu un vienlaicīgumu.

Lūk Qualcomm skaidrojums:

“Pieņemsim, ka apstrādi veicat mobilajā CPU vadības koda režīmā un pārslēdzaties uz kopprocesora skaitļošanas režīmu. Ja jums ir nepieciešams vadības kods, jums ir jāapstājas un jāatgriežas no kopprocesora uz galveno centrālo procesoru. Izmantojot Hexagon, gan vadības koda procesors DSP, gan HVX skaitļošanas koda procesors var darboties vienlaikus, lai nodrošinātu ciešu vadības un skaitļošanas koda savienojumu. Tas ļauj DSP ņemt HVX aprēķina rezultātu un izmantot to vadības koda lēmumā nākamajā pulksteņa ciklā.

HVX sniedz vēl vienu lielu priekšrocību attēla sensora apstrādē. Snapdragon ierīces ar Hexagon 685 DSP var straumēt datus tieši no attēlveidošanas sensora uz DSP vietējo atmiņu (L2 Cache), apejot ierīces DDR atmiņas kontrolieri. Tas, protams, samazina latentumu, bet arī uzlabo akumulatora darbības laiku — Snapdragon procesors ir paredzēts dīkstāvē visas darbības laikā.

Tas ir īpaši optimizēts 16 bitu peldošā komata tīkliem, un to kontrolē Qualcomm mašīnmācīšanās programmatūra: Snapdragon Neural Processing Engine.

"Mēs to [uztvērām] ļoti nopietni," sacīja Qualcomm pārstāvis. "Mēs esam strādājuši ar partneriem pēdējos trīs gadus, lai viņi izmantotu [...] mūsu silīciju AI un attēlveidošanai."

Šo partneru vidū ir Google, kas, piemēram, izmantoja sešstūra DSP attēlu apstrādes daļu, lai darbinātu Pixel un Pixel 2 HDR+ algoritmu. Lai gan Google ir ieviesis arī savu Pixel Core, ir vērts atzīmēt, ka Hexagon 685 DSP iespējotas ierīces ir tiem, kuriem ir vislabākie rezultāti, izmantojot slaveno Google kameras portu, daļēji HVX dēļ (kā mēs esam apstiprinājuši) izmantošana. Facebook, vēl viens partneris, cieši sadarbojās ar Qualcomm, lai paātrinātu Messenger reāllaika kameru filtrus un efektus.

Uzņēmums Oppo ir optimizējis savu sejas atbloķēšanas tehnoloģiju Hexagon 685 DSP, un Lenovo ap to izstrādāja savu orientieru noteikšanas funkciju.

Viens no platformas plašā atbalsta iemesliem ir tās vienkāršība. Qualcomm plašais Hexagon SDK atbalsta valodu Halide augstas veiktspējas attēlu apstrādei, un tas nav nepieciešams jāuztraucas par mašīnmācīšanās apmācības ietvariem — modeļa ieviešana vairumā gadījumu ir tikpat vienkārša kā API izsaukšana gadījumiem.

"Mēs [...] nekonkurējam ar tādiem kā IBM un Nvidia [AI], taču mums ir jomas, kurās izstrādātāji var izmantot — un jau ir," Qualcomm teica XDA Developers.

Sešstūris vs. sacensības

Snapdragon 845 Hexagon 685 DSP tiek piedāvāts, jo arvien vairāk oriģinālo iekārtu ražotāju (OEM) izmanto savus mobilos un ierīcēs pieejamos AI risinājumus. Huawei Kirin 970 -- sistēma mikroshēmā iekšpusē Māte 10 un Mate 10 Pro -- ir "neironu apstrādes vienība" (NPU), kas, kā ziņots, spēj atpazīt vairāk nekā 2000 attēlu sekundē ar tikai 1/50 daļa no vidējā viedtālruņa CPU enerģijas patēriņa. Un Apple A11 Bionic sistēmas mikroshēmā iPhone 8, iPhone 8 Plus un iPhone X ir “Neiral Engine”, kas veic sejas modelēšanu reāllaikā un līdz 600 miljardiem darbību sekundē.

Taču Qualcomm saka, ka sešstūra platformas agnosticisms dod tai priekšrocības. Atšķirībā no Apple un Huawei, kas lielākoties liek izstrādātājiem izmantot patentētas API, Qualcomm centās atbalstīt dažas no populārākajām atvērtā pirmkoda ietvariem no sākuma. Piemēram, tas sadarbojās ar Google, lai optimizētu TensorFlow, Google mašīnmācīšanās platforma, kas paredzēta Hexagon 685 DSP — Qualcomm saka, ka tā darbojas līdz pat astoņām reizēm ātrāk un 25 reizes efektīvāk nekā ierīcēs, kas nav Hexagon.

Avots: Qualcomm

Qualcomm DSP arhitektūrā Google GoogLeNet sākuma dziļais neironu tīkls - mašīnmācīšanās algoritms, kas izstrādāts, lai novērtētu objektu noteikšanas un klasifikācijas sistēmu kvalitāti. Demonstrācijas demonstrācijā tika parādīti ieguvumi viena ar TensorFlow darbināma attēlu atpazīšanas lietotne divos viedtālruņos: viena, kas palaiž lietotni CPU, un otra, kas to darbina Qualcomm Hexagon. DSP. DSP paātrinātā viedtālruņa lietotne uztvēra vairāk attēlu sekundē, ātrāk identificēja objektus un tai bija lielāka pārliecība par to, kas ir objekts, nekā tikai CPU lietotne.

Google arī izmanto Hexagon 685 DSP, lai paātrinātu Project Tango, tās paplašinātās realitātes platformu viedtālruņiem. Lenovo Phab 2 Pro, Asus ZenFone AR un citas ierīces ar Tango dziļuma noteikšanas IR moduli un attēla izsekošanas kamerām izmanto Qualcomm priekšrocības. Heterogēnā apstrādes arhitektūra, kas deleģē apstrādes uzdevumus starp Snapdragon mikroshēmojuma Hexagon 685 DSP, sensora centrmezglu un attēla signālu procesors (ISP). Rezultāts ir "mazāk nekā 10 procenti" pieskaitāmās sistēmas mikroshēmas CPU, saskaņā ar Qualcomm.

"Cik mēs zinām, mēs esam vienīgie mobilie puiši, kas optimizē veiktspēju un enerģijas efektivitāti," sacīja Qualcomm pārstāvis.

Protams, arī konkurenti strādā, lai paplašinātu savu ietekmes sfēru un veicinātu izstrādātāju atbalstu savās platformās. Kirin 970 neironu mikroshēma tika palaista ar atbalstu TensorFlow un Kafejnīca (Facebook atvērtā API ietvars) papildus Huawei Kirin API, ar TensorFlow Lite un Kafejnīca2 integrācija notiks vēlāk šogad. Un Huawei sadarbojās ar Microsoft, lai optimizētu savu ar AI darbināmo tulkotāju Mate 10.

Bet Qualcomm ir vēl viena priekšrocība: Reach. Saskaņā ar Strategy Analytics datiem mikroshēmu ražotājs pārņēma 42 procentus no viedtālruņu mikroshēmu tirgus 2017. gada pirmajā pusē, kam sekoja Apple un MediaTek ar 18 procentiem katrs. Pietiek pateikt, tas vēl nedreb zābakos.

Un Qualcomm prognozē, ka tas tikai augs. Mikroshēmu ražotājs līdz 2025. gadam plāno ieņēmumus 160 miljardu ASV dolāru apmērā, izmantojot AI programmatūras tehnoloģijas, piemēram, datorredzi un uzskata, ka viedtālruņu tirgus, kas līdz 2021. gadam sasniegs 8,6 miljardus vienību, ir lielākais platforma.

Ar Hexagon 685 DSP un citiem “terciārajiem” uzlabojumiem, kas nepārtraukti virzās lejup pa straumi uz vidējo diapazonu aparatūru, Qualcomm mikroshēmām ir arī vienkāršāk nodrošināt mašīnmācīšanos ierīcēs visās tuvākajās ierīcēs. nākotnē. Tie piedāvā arī parocīgu SDK izstrādātājiem (nav jāmācās ar DSP montāžas valodu), lai savās lietojumprogrammās un pakalpojumos izmantotu Hexagon 685 DSP un HVX priekšrocības.

"Neironu apstrādei ir vajadzīgas šīs specializētās apstrādes vienības, taču jums tās ir arī jāpaplašina, lai jūs varētu atbalstīt [atvērtā koda] ietvarus," sacīja Qualcomm pārstāvis. "Ja jūs neizveidojat šo ekosistēmu, [...] izstrādātāji nevarēs tajā izveidot."