Kā Qualcomm uzlaboja Snapdragon 855 veiktspēju, spēles un AI

Jaunā Qualcomm Snapdragon 855 mobilā platforma nodrošina lieliskus veiktspējas, spēļu un AI uzlabojumus, un mēs noskaidrojam, kā viņi to ir izdarījuši.

Qualcomm Snapdragon augstākā līmeņa sanāksmē 2018 uzņēmums paziņoja par savu jaunāko premium līmeņa vadošo mikroshēmojumu: Snapdragon 855 platformu. Šis jaunais produkts būs pamatā lielākajai daļai 2019. gada ražīgo flagmaņu, nodrošinot neticamu datu ātrumu, izmantojot Snapdragon X50 modemu. Tomēr papildus tam Snapdragon 855 nodrošina virkni uzlabojumu katrā sistēmas mikroshēmas blokā, dažās skaitļošanas vienībās pēdējā laikā ir vērojami vislielākie veiktspējas un jaudas efektivitātes uzlabojumi salīdzinājumā ar iepriekšējo gadu vēsture.

Mēs jau esam detalizēti aprakstījuši Spectra 380 ISP-CVPiemēram, kas vēl vairāk uzlabo viedtālruņa fotografēšanu, vienlaikus nodrošinot lietotājiem veselīgu akumulatora ietaupījumu. Kamēr mēs arvien vairāk pievēršam uzmanību perifērijas komponentiem, piemēram, Hexagon DSP, galvenie bloki, par kuriem entuziasti maksā visvairāk uzmanība, proti, CPU un GPU, ir arī piedzīvojuši vairāk nekā pieticīgus ieguvumus ar arhitektūras uzlabojumiem un pāreju uz jaunu procesu. mezgls. Šajā rakstā mēs ātri apkoposim, kas ir jauns un kas ir zināms par Snapdragon 855 centrālo procesoru, GPU un DSP, kā arī to, kā uzlabojumi un jaunās funkcijas varētu ietekmēt.

jūsu lietotāja pieredze 2019. gadā.


A76 bāzes Kryo 485 centrālais procesors un pāreja uz 7nm

Snapdragon 855 pāriet uz TSMC jaunāko 7nm FinFET ražošanas procesu. Mēs parasti redzam mezglu pārskatīšanu reizi divos gados ar samazināšanu vai cikla vidus optimizāciju (piemēram, pāreju no mazjaudas agrīna) (LPE) uz "Low-Power Plus" (LPP) Samsung-LSI mezglos), tāpēc jūs, iespējams, esat dzirdējuši par šiem rādītājiem dažās vai citās ziņās. rakstu. Bet ko tas nozīmē? Šajā kontekstā tas apraksta procesora tranzistora funkciju lielumu, kas savukārt ļauj mums saprast, kādus tranzistora blīvuma uzlabojumus mēs varam sagaidīt ar katru jauno paaudzi. Izmantojot vairāk tranzistoru uz laukuma vienību, procesora veiktspēju var palielināt. Šī funkcija ir svarīga arī tāpēc, ka mazāki procesa mezgli ļauj procesora dizainu ieviest mazākā mērogā, kas ir intuitīvi samazina atstarpi starp procesora elementiem, savukārt saīsina attālumu, kas elektroniem jānobrauc, lai to paveiktu aprēķins. Tas nodrošina veiktspējas uzlabojumus, un mazākiem procesiem ir arī mazāka kapacitāte, kas nozīmē, ka tranzistori var ieslēgties un izslēgties ar mazāku latentumu un mazāku enerģiju. Uzziņai TSMC apgalvo, ka tiek panākta pāreja uz 7 nm procesu veiktspēja un jaudas efektivitāte attiecīgi aptuveni 20% un 40%., lai gan tas ir salīdzināts ar paša TSMC 10 nm FinFET procesu.

Dažu pēdējo Snapdragon vadošo mikroshēmojumu laikā mēs esam redzējuši, ka Qualcomm sadarbojas ar Samsung un ievieš savu 14 nm un 10 nm LPP/LPE procesu. Tomēr pāreja uz TSMC 7 nm Snapdragon 855 nav negaidīta, ņemot vērā, ka Samsung 7 nm procesam bija oktobrī tikko sāka masveida ražošanu, lai gan tajā laikā tika ziņots, ka uz tā tiks uzbūvēts 5G Qualcomm mikroshēmojums. Turklāt Samsung 7LPP dizains ir ražots, izmantojot uzlabotu litogrāfijas tehniku, kas pazīstama kā ekstremālā ultravioletā litogrāfija (EUVL), nodrošina laukuma samazinājumu par 40% ar vienādu dizaina sarežģītību, ar 20% lielāku ātrumu vai 50% mazāku enerģijas patēriņu salīdzinājumā ar 10nm FinFET priekšteči. Katrs jauns lēciens uz mazākiem procesa mezgliem tiek atzīmēts tieši tāpēc, ka tos ir tik grūti sasniegt. Piemēram, tranzistori kļūst mazāki, tie var parādīt lielāku "noplūdi" vai strāvu, kas plūst caur tranzistoriem, kas ir "izslēgti", palielinot statiskās enerģijas patēriņu dīkstāves stāvokļos. Un, lai gan mazākas mikroshēmas ar blīvāku tranzistoru skaitu varētu ļaut maksimāli izmantot konkrēto silīcija plāksni, raža mēdz būt mazāka iepriekš minētās noplūdes dēļ, kā arī grūtības iegūt “augstākas nosūtīšanas” procesorus, kas darbojas ar to (augsto) atsauci frekvences. Šīs ir tikai daži no daudzajiem attīstības šķēršļiem, kas, protams, tiek novērsti laikā, kad jauns procesa mezgls nonāk masveida ražošanā, bet Īsāk sakot, pastāv daudzas pētniecības un attīstības, kā arī ražošanas problēmas, kas palielina izmaksas, kas saistītas ar jauna procesa apjoma ieviešanu tirgus.

Jaunākā ARM A76 arhitektūra, kas licencēta Kryo 485, ir vēl viens lielisks ieguldījums būtiskajos uzlabojumos, ko mēs redzam Qualcomm Snapdragon 855, katru gadu. A76 kodols ir pavisam jauns, tukšs dizains no ARM Ostinas birojiem, un tajā ir jauna mikroarhitektūra, kas izveidota no nulles, lai nodrošinātu to, ko ARM sauc par "klēpjdatoru klases veiktspēju ar mobilā efektivitāte." Tas joprojām ir daļēji pielāgots dizains, un Qualcomm ir veicis tādus uzlabojumus kā optimizēta datu iepriekšēja ielāde, lai uzlabotu efektivitāti, un lielāka ārpuskārtas izpilde. logs. Šis jaunais dizains piedāvā dažus milzīgus veiktspējas uzlabojumus salīdzinājumā ar A75, uz kura balstījās Snapdragon 845 zelta kodoli: tas sola 35% veiktspējas uzlabojums un 40% labāka jaudas efektivitāte. Salīdzinot A75 ar 10 nm procesu ar A76 ar 7 nm procesu ar tādu pašu jaudu 750 mW uz kodolu, veiktspējas priekšrocības pieaug līdz 40% par labu jaunajam kodolam, un arī enerģijas ietaupījums var pieaugt līdz 50%. Turklāt citi uzlabojumi asimetrisko vienas instrukcijas vairāku datu (ASIMD) cauruļvados un dot-product instrukcijas apkopot līdz ~3,9x uzlabojumiem mašīnmācīšanās uzdevumu izpildē, piemēram, secinājumi konvolucionālajos neironu tīklos. Tas viss nozīmē nozarē vadošo veiktspēju katrā apgabalā un lieliski papildina jauno 7 nm procesu, jo Qualcomm 2,84 GHz “galvenais kodols” tuvojas 3 GHz atsauces pulksteņa ātrumam ARM. bija lietojis detalizējot jauno kodolu. Visā visumā, Qualcomm sola absolūti milzīgu 45% CPU veiktspējas uzlabojumu vairāk nekā 845, kas ir lielākais pieaugums salīdzinājumā ar iepriekšējo gadu.

Runājot par Snapdragon 855 “prime core”, nav arī pārsteidzoši redzēt, ka Qualcomm pievienojas šim jaunajam klastera iestatījumam, ņemot vērā uzlabojumus salīdzinājumā ar lielajiem. LITTLE iespējojis ARM's DynamIQ tehnoloģiju platformas. Būtībā DynamIQ nodrošina lielāku elastību un mērogojamību vairāku kodolu procesoru dizainā, ļaujot izmantot vairākus kodolu dizainus noteiktā klasterī, kā arī smalkgraudainu katra kodola sprieguma kontroli. (EDIT: Q&A sadaļā Qualcomm apstiprināja, ka Prime kodols koplieto savu jaudas domēnu ar veiktspējas kopu, ierobežojot šeit aprakstīto utilītu). A76 ir īpaši piemērots šādam atsevišķam premium kodolam ar savu pulksteni, ņemot vērā, ka tas nospiež aploksni, kad runa ir par vienu pavedienu veiktspēja ar par 25% vairāk veselu skaitļu instrukciju pulkstenī nekā A75 un par 35% augstāku ASIMD un peldošā komata veiktspēju, vienlaikus piedāvājot par 90% augstāku atmiņas joslas platums. Īsāk sakot, A76 piedāvā lielāku paaudžu pieaugumu nekā iepriekšējās paaudzes, kas, bez šaubām, veicināja arī Qualcomm lielāks nekā parasti Snapdragon 855 veiktspējas pieaugums salīdzinājumā ar gadu (uzziņai Qualcomm minēja 25 līdz 30% pieaugumu 845 vairāk 835). Ar to varētu pietikt, lai Qualcomm Snapdragon 855 veiktspēju apsteigtu Samsung LSI Mongoose 3 (M3) kodolā, kas atrodams Exynos 9810. lai gan šis konkrētais dizains cieta no jaudas efektivitātes tādā veidā, kā Qualcomm mikroshēmām nav, un ka Snapdragon 855, visticamāk, to nedarīs. arī.

Ko tas nozīmē galalietotājam? Protams, mums vajadzētu sagaidīt palielinātus etalonkodolus — ARM paredz par 28% augstākus Geekbench rādītājus mobilajām ierīcēm un par 35% uzlabotu Javascript veiktspēju. Papildus etaloniem, kas varētu būt maz saistīti ar galalietotāja pieredzi, A76 turpina A75 uzmanību noturīgu sniegumu, kas nozīmē, ka ilgstošu spēļu sesiju laikā lietotājiem vajadzētu sagaidīt mazāku bremzēšanu. Pāreja uz 7 nm apvienojumā ar jauno kodola dizainu noteikti radīs ievērojamu akumulatoru dzīves uzlabojumi galalietotājiem, un tā, iespējams, ir šī komplekta pievilcīgākā funkcija jauninājumiem. Jaunais “Prime” kodols ir arī interesants, ņemot vērā, ka vientuļš kodols, kas koncentrējas uz augstāko viena vītnes veiktspēju, varētu izrādīties noderīgs visās lietojumprogrammās un procesos, kas nav iestatīti, lai izmantotu to priekšrocības vairāku vītņu. Protams, 7 nm ražošanas process vēl vairāk ietekmē arī citus Snapdragon 855 blokus, nodrošinot tādu pašu enerģijas ietaupījumu. citām skaitļošanas vienībām, kas arī ir saistītas ar ikdienas lietotāja pieredzi, piemēram, attēlu apstrādi viedtālruņu fotografēšanai.


“Snapdragon Elite Gaming Experience” un Adreno 640 GPU

Qualcomm Snapdragon 855 šoreiz lielā mērā koncentrējas uz spēlēm, kas ir nepārsteidzošs notikumu pavērsiens, ņemot vērā nosaukumu popularitāti. piemēram, Fortnite un PlayerUnknown’s Battlegrounds, kā arī pieaugošā mobilā eSporta popularitāte (jā, tā ir lieta) Āzijā. Saskaņā ar Qualcomm parādītajiem skaitļiem no Newzoo 2017. gada globālā spēļu tirgus pārskats, mobilajām spēlēm ir tendence pieaugt, paredzot 2018. gada kopējos ieņēmumus 70,3 miljardu dolāru apmērā, kas veido 51% no visiem spēļu ieņēmumiem, pateicoties 25,5% pieaugumam salīdzinājumā ar iepriekšējā gada atbilstošo periodu.

Adreno 640 GPU nodrošina veselīgu Grafikas veiktspējas palielinājums par 20%., vēl vairāk palielinot Qualcomm pārsvaru pār konkurenci šajā konkrētajā jomā. Tomēr atsaucei Snapdragon 845 palielināja 30% salīdzinājumā ar Snapdragon 835, kas arī piedāvāja 30% uzlabojumu salīdzinājumā ar Snapdragon 821. Tomēr tam vajadzētu saglabāt Qualcomm priekšā grafikas veiktspēju un, pats galvenais, veiktspēju uz vatu, ja viņiem izdosies uzlabot arī šajā jomā. Papildus šim skaitlim Qualcomm ir tikpat noslēpumains kā jebkad, kad runa ir par Adreno: mēs dzirdējām par integrēto. mikrokontrolleris jaudas pārvaldībai un kā 640 ir viszemākais draiveris, lai gan uzņēmums minēja iekļaušana Par 50% vairāk aritmētisko loģisko vienību (ALU), kas vēl vairāk paātrinātu AI veiktspēju.

Viena lieta, par ko Qualcomm pavadīja daudz laika, runājot par instruktāžām, ir viņu vēlme nodrošināt “fiziski balstītu renderēšanu” (PBR) vairāk mobilo spēļu pieredzē. PBR ir ēnojuma modelis, kas nodrošina reālistisku grafikas atveidi, precīzi modelējot gaismas plūsmu atbilstoši faktūrās attēlotajam materiālam vai virsmas teselācijai. Tas ļauj spēles objektiem pareizi atdarināt reālās pasaules materiālu vizuālās īpašības, tostarp pareizu mikrovirsmu, piemēram, nobrāzumu un spoguļu izcēlumu, atveidošanu. Tomēr visievērojamākie uzlabojumi ir saistīti ar to, ka tas ļauj precīzāk attēlot visu virsmu atstarošanos un spīdumu, pat uz plakaniem un necaurspīdīgiem (imitētiem) materiāliem.

Qualcomm un populārā Unity Engine izstrādātāji ir strādājuši, lai padarītu PBR pieejamāku, taču uzņēmums sadarbojas arī ar citiem dzinēju un spēļu izstrādātājiem, optimizējot mobilās spēles Snapdragon ierīces. Spēļu dzinēji, piemēram, Unity, Unreal, Messiah un NeoX, jau ir optimizēti, piemēram, Snapdragon ierīcēm, un Snapdragon 855 atbalsta jaunākās grafikas API, piemēram, jauno. Vulkāns 1.1. Tādas studijas kā NetMarble, kas ir aiz Lineage II: Revolutions, arī iepriekš ir sadarbojušās ar Qualcomm, lai vislabāk demonstrētu Snapdragon platformas stiprās puses. Turklāt ar Snapdragon 675, mēs redzējām sarunas par pielāgotu algoritmu, kas sasniedza līdz pat Par 90% mazāk džeku salīdzinot ar to pašu platformu bez optimizācijas, un tās pašas izmaiņas ir veiktas arī Snapdragon 855. Joprojām nav skaidrs, ko nozīmē šīs optimizācijas, un mēs negaidām, ka tās būs piemērojamas katrā spēlē, bet tas noteikti nozīmēs labāku sniegumu vismaz lielākajos titulos Android.

Papildus tam, kamēr Snapdragon 835 un 845 ļāva atskaņot un uzņemt (attiecīgi) 10 bitu īsts HDR video, Qualcomm Snapdragon 855 būs pirmais mobilais mikroshēmojums, kas ļauj īstas HDR spēles. Tam būs nepieciešami īsti HDR spējīgi displeji, kas par laimi arvien biežāk sastopami vadošo viedtālruņu vidū. Šī iemesla dēļ lietotāji var sagaidīt bagātīgākas krāsas ar lielāku toņu dziļumu, lielāku dinamisko diapazonu (kā norāda nosaukums) un uzlabotu kontrastu. Šī funkcija ne vienmēr ir obligāta, taču noteikti ir patīkami, ka esam ņēmuši vērā pašreizējo HDR spēļu iestatījumos ir nepieciešami dārgi HDR gatavi televizori un monitori, kā arī spējīgi datori un īpašas spēles konsolēm. Izmantojot Qualcomm Snapdragon 855, HDR spēlēs, iespējams, būs pieejamāks un ērtāks (protams, bez skārienekrāna vadības ierīcēm).


Jauns Hexagon 690 DSP AI darba slodzēm

Lai gan uzņēmums savos mārketinga materiālos to nepārprotami nenosauc par “neironu apstrādes vienību”, AI darba slodze arī gūs labumu no jaunā un uzlabotā Hexagon 690 DSP. Qualcomm klusi ieviesa šos līdzprocesorus pirms daudzām paaudzēm (pareizi ieviešot QDSP6 v6 līdzās 820), taču tikai nesen viņi sāka tos piedāvāt kā dažus no labākajiem SoC blokiem AI. Sākotnēji izstrādāta attēlveidošanas darba slodzes paātrināšanai, DSP arhitektūra, jo īpaši ar sešstūra vektoru paplašinājumu (HVX) iekļaušanu, kļuva lieliski piemērota ML uzdevumiem. DSP ir vairāk programmējams nekā fiksētas funkcijas aparatūra, vienlaikus saglabājot daļu veiktspējas un efektivitātes priekšrocības, kas raksturo lietojumprogrammas procesoru blokus, ievērojami paātrinot skalāru un vektoru operācijas. Tas izrādījās lieliski piemērots pastāvīgi mainīgajiem attēlu apstrādes algoritmiem, kurus var izlādēt uz DSP, taču tie, protams, ir piemēroti AI darba slodzei. Sešstūra DSP ir bijis a svētīgs mašīnmācībai malu ierīcēs, pateicoties lieliskajai aparatūras līmeņa daudzpavedienu un paralēlajai skaitļošanai, kas spēj apstrādāt tūkstošiem bitu vektoru vienības apstrādes ciklā, salīdzinot ar vidējā CPU kodola simtiem bitu ciklā un vairāku izkraušanas apkalpošanu sesijas.

Hexagon DSP ir īpaši piemērots attēlveidošanas uzdevumiem, jo ​​tas var straumēt datus tieši no attēlveidošanas sensora uz DSP vietējo atmiņu (L2 Cache), apejot ierīces DDR atmiņas kontrolieri. Piemēram, Google izmantoja Hexagon DSP attēlu apstrādi, lai darbinātu Pixel un Pixel 2 HDR+ algoritmus, pirms ieviesa savus. Pixel Visual Core. Tās ir arī sešstūriem gatavas ierīces, kas nodrošina labākos rezultātus no populārajiem Google kameras portiem, kurus varat izpētīt šeit. Tas ir izmantots virtuālās un paplašinātās realitātes darba slodzēm, lieliski nodrošinot enerģiju tagad-beigusies Projekts Tango uz Lenovo Phab 2 Pro un ASUS ZenFone AR. Tomēr lielākā daļa oriģinālo iekārtu ražotāju, kas ievieš Snapdragon vadošās ierīces, vienā vai otrā veidā izmanto Hexagon DSP attēlu apstrādei, ko varat pārbaudīt, izmantojot tādus rīkus kā Snapdragon profilētājs.

Tātad, kas jauns ar jauno DSP? Hexagon 690 dubultoja vektoru paātrinātāju (HVX) skaitu no diviem līdz četriem, lai strādātu kopā ar četriem skalārajiem pavedieniem, kas arī uzlabo veiktspēju par 20%. Turklāt Hexagon 690 piedāvā pirmo tenzora paātrinātāju mobilajām ierīcēm ar Sešstūra tensora paātrinātājs (HTA). Tas ir būtisks papildinājums: tas kalpo kā aparatūras paātrinājums dārgai matricas reizināšanai un arī integrē nelinearitātes funkcijas (piemēram, sigmoid un ReLU) aparatūras līmenī, vēl vairāk paātrinot secinājums. Šīs izmaiņas DSP būtu jāpārvērš labāka balss asistenta veiktspēja, sākot no karsto vārdu noteikšanas līdz ierīces komandu parsēšanai, piedāvājot, piemēram, uzlabotu atbalss slāpēšanu un trokšņu slāpēšanu. Qualcomm uzsver, ka tie nodrošina pilnīgu neviendabīgu skaitļošanas platformu, kas ļauj izmantot AI darba slodzi CPU, GPU vai DSP, vai jebkura trīs bloku kombinācija — Qualcomm Gerija Brotmena vārdiem sakot, šis tas ir "vairāk nekā viens kodols, tas ir vairāk nekā aparatūra, tā ir pilnīga sistēma". Viņu ceturtās paaudzes "Qualcomm AI Engine" sniedz ne tikai aparatūru, bet arī atbalstu, lai piekļūtu Snapdragon Neural Processing SDK un Hexagon NN. iepriekš minētie bloki, kā arī Android NN API un populāri ML ietvari, piemēram, Caffe/Caffe 2, TensorFlow/Lite un ONNX (Open Neural Network) apmaiņa). Kopumā Snapdragon 855 var piedāvāt trīs reizes pārsniedz AI veiktspēju no tā priekšgājēja (un divreiz salīdzinājumā ar Huawei), pārsniedzot 7 triljoni darbību sekundē (TOP). Tomēr paturiet prātā, ka Qualcomm turpina koncentrēties uz neviendabīgu skaitļošanas risinājumu, nevis koncentrējoties uz vienu īpašu bloku.

Lai uzzinātu vairāk par Hexagon DSP, pārbaudiet pagājušā gada gabals sīki izklāstot, kā tas palīdz ar AI darba slodzi.


Rezumējot, Snapdragon 855 skaitļošanas pakotne sniedz dažus no ietekmīgākajiem uzlabojumiem, ko esam redzējuši pēdējos gados. Spectra 380 ISP-CV, par kuru mēs runājām atsevišķā rakstā, arī sniedz milzīgus uzlabojumus veiktspējai un enerģijas efektivitātei, nodrošinot lieliskas jaunas funkcijas, piemēram, 4K 60 FPS HDR video ierakstīšanu. ar portreta režīms vai fona maiņa (diezgan elastīga!).

Kā paskaidrots šajā rakstā, šiem uzlabojumiem un jaunajām funkcijām vajadzētu būt jūtāmām visā lietotāja pieredzē. Mēs ar nepacietību gaidām Qualcomm Snapdragon 855 un drīzumā varēsim to padziļināti pārbaudīt, tāpēc sekojiet līdzi XDA-Developers jaunākajām ziņām un analīzi par Snapdragon 855!