Kako je Qualcomm izboljšal zmogljivost, igranje iger in umetno inteligenco na Snapdragon 855

Nova mobilna platforma Qualcomm Snapdragon 855 prinaša velike izboljšave v smislu zmogljivosti, iger in umetne inteligence, mi pa pojasnjujemo, kako so to storili.

Na Qualcommovem srečanju Snapdragon Summit 2018 je podjetje napovedali svoj najnovejši vrhunski nabor čipov: platformo Snapdragon 855. Ta novi izdelek bo v središču večine uspešnih vodilnih modelov leta 2019, s seboj pa prinaša obljubo neverjetnih podatkovnih hitrosti prek modema Snapdragon X50. Poleg tega pa Snapdragon 855 prinaša kopico izboljšav za vsak blok sistema na čipu, z nekatere računalniške enote v zadnjem času beležijo največje medletne izboljšave zmogljivosti in energetske učinkovitosti zgodovina.

Spectra 380 ISP-CV smo že opisali, na primer, ki dodatno izboljša fotografijo s pametnim telefonom, hkrati pa uporabnikom omogoča zdravo varčevanje z baterijo. Medtem ko vse bolj posvečamo pozornost perifernim komponentam, kot je Hexagon DSP, jedrnim blokom, ki jih navdušenci plačajo največ pozornost – in sicer CPU in GPU – sta z arhitekturnimi izboljšavami in prehodom na nov proces prav tako zabeležila več kot skromne koristi. vozlišče. V tem članku bomo na hitro povzeli, kaj je novega in kaj je znanega o CPU, GPU in DSP procesorja Snapdragon 855 ter kako bi lahko izboljšave in nove funkcije vplivale na

tvoje uporabniška izkušnja v letu 2019.


Kryo 485 CPU na osnovi A76 in prehod na 7nm

Snapdragon 855 prehaja na najnovejši 7nm FinFET proizvodni proces TSMC. Običajno opazimo revizijo vozlišča vsako leto ali dve, z zmanjšanjem velikosti ali optimizacijami sredi cikla (kot je premik iz »Zgodnje nizke porabe« (LPE) v "Low-Power Plus" (LPP) v vozliščih Samsung-LSI), zato ste verjetno že slišali za te meritve v nekaterih novicah. Članek. Toda kaj to pomeni? V tem kontekstu opisuje velikost funkcij procesorjevega tranzistorja, ki nam nato pokažejo, kakšne izboljšave gostote tranzistorjev lahko pričakujemo z vsako novo generacijo. Z več tranzistorji na enoto površine je mogoče povečati posledično zmogljivost procesorja. Ta funkcija je prav tako pomembna, saj manjša procesna vozlišča omogočajo implementacijo procesorjev v manjšem obsegu, kar intuitivno skrči prostor med elementi procesorja in posledično skrajša razdaljo, ki jo morajo prepotovati elektroni računanje. To omogoča izboljšanje zmogljivosti, manjši procesi pa imajo tudi nižjo kapacitivnost, kar pomeni, da se lahko tranzistorji vklopijo in izklopijo z nižjo zakasnitvijo in pri nižji energiji. Za referenco TSMC trdi, da prehod na njihov 7nm proces doseže zmogljivost in energetska učinkovitost reda 20 % oziroma 40 %, čeprav je to v primerjavi z lastnim TSMC-jevim 10nm procesom FinFET.

Pri zadnjih nekaj vodilnih naborih čipov Snapdragon smo videli, kako Qualcomm sodeluje s Samsungom in izvaja njihov 14nm in 10nm LPP/LPE proces. Prehod na TSMC-jev 7nm za Snapdragon 855 pa ni nepričakovan, glede na to, da je imel Samsungov 7nm proces šele oktobra je vstopil v množično proizvodnjo, čeprav so takrat poročali, da bo na njem zgrajen nabor čipov 5G Qualcomm. Poleg tega je Samsungova zasnova 7LPP izdelana z izboljšano tehniko litografije, znano kot ekstremna ultravijolična litografija (EUVL), zagotavlja 40-odstotno zmanjšanje površine pri enaki kompleksnosti zasnove, z 20-odstotnimi višjimi hitrostmi ali 50-odstotno manjšo porabo energije v primerjavi z 10-nanometrskim FinFET predhodniki. Vsak nov skok na manjša procesna vozlišča slavimo prav zato, ker jih je tako težko doseči. Na primer, ko se tranzistorji zmanjšajo, lahko pokažejo večje "puščanje" ali tok, ki teče skozi tranzistorje, ki so "izklopljeni", kar poveča statično porabo energije v stanju mirovanja. Medtem ko lahko manjši čipi z gostejšim številom tranzistorjev omogočijo, da kar najbolje izkoristite dano silicijevo rezino, je izkoristek običajno nižji zaradi prej omenjenega uhajanja in težav pri pridobivanju procesorjev z "višjo zaporednostjo", ki delujejo pri (visoki) referenci frekvence. To so samo nekaj številnih razvojnih ovir, ki so seveda odpravljene, ko novo procesno vozlišče zadene množično proizvodnjo, vendar v skratka, obstaja veliko izzivov na področju raziskav in razvoja ter proizvodnje, ki povečajo stroške uvedbe nove velikosti procesa v trgu.

Najnovejša arhitektura ARM A76, licencirana za Kryo 485, je še en velik prispevek k bistvenim izboljšavam iz leta v leto, ki jih vidimo pri Qualcomm Snapdragon 855. Jedro A76 je povsem nova zasnova praznega lista iz ARM-ovih pisarn v Austinu, ki vključuje novo mikroarhitekturo, zgrajeno iz nič, ki zagotavlja, kar ARM imenuje "zmogljivost prenosnega razreda z mobilna učinkovitost." Še vedno gre za delno prilagojeno zasnovo, Qualcomm pa je naredil izboljšave, kot je optimizirano vnaprejšnje pridobivanje podatkov za večjo učinkovitost, in večja izvedba izven vrstnega reda okno. Ta nova zasnova ponuja nekaj izjemnih izboljšav zmogljivosti v primerjavi z A75, na katerem so temeljila zlata jedra procesorja Snapdragon 845: obljublja 35 % izboljšana zmogljivost in 40 % boljša energetska učinkovitost. Če primerjate A75 po 10nm postopku z A76 po 7nm procesu pri enaki ovojnici moči 750 mW/jedro, prednost v zmogljivosti naraste na 40 % v korist novega jedra, prav tako se lahko povečajo prihranki energije do 50 %. Še več, druge izboljšave v cevovodih Asymmetric Single Instruction Multiple Data (ASIMD) in navodila za pikčasti produkt skupaj do približno 3,9-kratnih izboljšav pri izvajanju nalog strojnega učenja, kot je sklepanje v konvolucijskih nevronskih mrežah. Vse to predstavlja vodilno zmogljivost na območje v panogi in odlično dopolnilo k novemu 7nm procesu, s Qualcommovim 2,84 GHz 'prime jedrom', ki se približuje referenčnim taktom 3 GHz ARM uporabljal pri detajlu novega jedra. Glede na vse, Qualcomm obljublja izjemno 45-odstotno izboljšanje zmogljivosti procesorja več kot 845, največje medletno povečanje doslej.

Ko že govorimo o "glavnem jedru" procesorja Snapdragon 855, prav tako ni presenetljivo, da Qualcomm uporablja to novo nastavitev gruče glede na izboljšave v primerjavi z velikimi. LITTLE omogoča ARM DynamIQ tehnološke platforme. V bistvu DynamIQ omogoča večjo prilagodljivost in razširljivost pri zasnovi večjedrnega procesorja, kar omogoča zasnovo več jeder v dani gruči, kot tudi natančno krmiljenje napetosti na jedro. (UREJANJE: V vprašanjih in odgovorih je Qualcomm potrdil, da si jedro Prime deli svojo domeno moči z gručo zmogljivosti, kar omejuje tukaj opisani pripomoček). A76 je še posebej primeren za tako osamljeno vrhunsko jedro z lastno uro, glede na to, da premika ovojnico, ko gre za enonit zmogljivost s 25 % več celoštevilskimi navodili na uro kot A75 in 35 % višjo zmogljivostjo ASIMD in plavajoče vejice, hkrati pa ponuja 90 % večjo pasovna širina pomnilnika. Skratka, A76 predstavlja večji generacijski dvig kot prejšnje generacije, kar je nedvomno prispevalo tudi k Qualcommovemu večje kot običajno medletno povečanje zmogljivosti za Snapdragon 855 (za referenco je Qualcomm navedel 25- do 30-odstotno povečanje za 845 835). To bi morda zadostovalo, da bi rezultat Qualcomm Snapdragon 855 postavil pred jedro Mongoose 3 (M3) Samsung LSI, ki ga najdemo v Exynosu 9810, čeprav je ta posebna zasnova trpela zaradi energetske učinkovitosti na način, ki ga čipi Qualcomm nimajo, in česar Snapdragon 855 najverjetneje ne bo bodisi.

Kaj to pomeni za končnega uporabnika? Seveda bi morali pričakovati povečana primerjalna jedra – ARM predvideva 28 % višje rezultate Geekbench za mobilne naprave in 35 % izboljšano delovanje Javascripta. Poleg meril uspešnosti, ki morda niso zelo povezana z izkušnjo končnega uporabnika, A76 nadaljuje osredotočenost A75 na trajno delovanje, kar pomeni, da bi morali uporabniki pričakovati manjše dušenje med dolgotrajnimi igralnimi sejami. Prehod na 7nm v kombinaciji z novo zasnovo jedra bo vsekakor povzročil opazno baterijo izboljšave življenja za končne uporabnike in to je morda najbolj privlačna lastnost tega nabora nadgradnje. Novo jedro 'Prime' je prav tako zanimivo, glede na to, da bi lahko samotno jedro, ki se osredotoča na vrhunsko enonitno zmogljivost izkazali za koristne v aplikacijah in procesih, ki niso nastavljeni za ustrezno izkoriščanje prednosti večnitnost. Seveda 7nm proizvodni proces dodatno vpliva tudi na druge bloke procesorja Snapdragon 855, ki zagotavljajo enake prihranke energije na druge računalniške enote, ki so prav tako vključene v vsakodnevno uporabniško izkušnjo, kot je obdelava slik za fotografiranje s pametnimi telefoni.


'Snapdragon Elite Gaming Experience' in Adreno 640 GPU

Qualcomm Snapdragon 855 se tokrat močno osredotoča na igranje iger, kar ni presenetljiv preobrat glede na priljubljenost naslovov kot sta Fortnite in PlayerUnknown's Battlegrounds ter vse večja priljubljenost mobilnih e-športov (ja, to je stvar) v Aziji. Glede na številke, ki jih je predstavil Qualcomm iz Poročilo o svetovnem trgu iger Newzoo 2017, mobilne igre na srečo naraščajo s pričakovanim skupnim prihodkom v letu 2018 v višini 70,3 milijarde USD, kar predstavlja 51 % vseh prihodkov od iger na srečo zaradi 25,5-odstotnega medletnega povečanja.

GPE Adreno 640 prinaša zdravo 20 % povečanje grafične zmogljivosti, kar še dodatno povečuje prednost Qualcomma pred konkurenco na tem področju. Za referenco pa je Snapdragon 845 prinesel 30-odstotno izboljšanje v primerjavi s Snapdragonom 835, ki je sam ponudil tudi 30-odstotno izboljšanje v primerjavi s Snapdragonom 821. Kljub temu bi to moralo ohraniti Qualcomm prednost pri grafični zmogljivosti in, kar je najpomembneje, pri zmogljivosti na vat, če jim uspe izboljšati tudi to fronto. Poleg tega je Qualcomm skrivnosten kot vedno, ko gre za Adreno: slišali smo za integrirano mikrokrmilnik za upravljanje porabe energije in kako ima 640 najmanjšo obremenitev gonilnikov, čeprav je podjetje omenilo vključitev 50 % več aritmetično logičnih enot (ALU), ki bi še pospešila delovanje AI.

Ena stvar, o kateri je Qualcomm veliko časa govoril na sestankih, je njihova želja, da bi "fizično zasnovano upodabljanje" (PBR) prinesli več izkušenj mobilnih iger. PBR je model senčenja, ki omogoča realistično grafično upodabljanje, natančno modeliranje svetlobnega toka v skladu z materialom, predstavljenim v teksturah ali teselacijo površine. To omogoča predmetom v igri, da pravilno posnemajo vizualne lastnosti materialov iz resničnega sveta, vključno s pravilnim upodabljanjem mikropovršin, kot so odrgnine in zrcalni poudarki. Najbolj opazne izboljšave pa so v tem, da omogoča natančnejši prikaz odbojnosti in sijaja vseh površin, tudi tistih iz ravnih in neprozornih (simuliranih) materialov.

Qualcomm in razvijalci za priljubljenim motorjem Unity Engine so delali na tem, da bi PBR postal bolj dostopen, vendar podjetje sodeluje tudi z drugimi razvijalci motorjev in iger pri optimizaciji mobilnih iger za Snapdragon naprave. Igralni motorji, kot so Unity, Unreal, Messiah in NeoX, so na primer že optimizirani za naprave Snapdragon, Snapdragon 855 pa podpira najnovejše grafične API-je, kot je novi Vulkan 1.1. Studii, kot je NetMarble, ki stoji za Lineage II: Revolutions, so v preteklosti prav tako sodelovali s Qualcommom, da bi najbolje predstavili prednosti platforme Snapdragon. Še več, z Snapdragon 675, videli smo pogovore o algoritmu po meri, ki je dosegel do 90 % manj jankov v primerjavi z isto platformo brez optimizacij in enake spremembe so prišle do Snapdragon 855. Še vedno ni jasno, kaj te optimizacije vključujejo, in ne pričakujemo, da bodo uporabne v vsaki igri, vendar bo zagotovo pomenilo boljšo zmogljivost vsaj v večjih naslovih Android.

Poleg vsega tega sta Snapdragon 835 in 845 omogočala predvajanje in zajem (oziroma) 10-bitni, pravi HDR video, bo Qualcomm Snapdragon 855 prvi mobilni nabor čipov, ki omogoča pravo HDR igranje. To bo zahtevalo prave zaslone, ki podpirajo HDR, ki so na srečo vse bolj pogosti med vodilnimi pametnimi telefoni. Zaradi tega lahko uporabniki pričakujejo bogatejše barve z večjo tonsko globino, višjim dinamičnim razponom (kot nakazuje ime) in izboljšanim kontrastom. To ni nujno obvezna funkcija, vendar je vsekakor lepo, da imamo glede na trenutno igranje HDR nastavitve zahtevajo drage televizorje in monitorje, pripravljene na HDR, pa tudi zmogljive računalnike in posebne igre konzole. S procesorjem Qualcomm Snapdragon 855 bo HDR pri igranju verjetno bolj dostopen in priročen (seveda brez kontrol na zaslonu na dotik).


Nov Hexagon 690 DSP za delovne obremenitve z umetno inteligenco

Medtem ko ga podjetje v svojih trženjskih gradivih izrecno ne imenuje "enota za nevronsko obdelavo", bodo delovne obremenitve AI prav tako imele koristi od novega in izboljšanega Hexagon 690 DSP. Qualcomm je te koprocesorje tiho predstavil pred mnogimi generacijami (z ustrezno uvedbo QDSP6 v6 poleg 820), vendar so jih šele pred kratkim začeli predstavljati kot nekatere boljše bloke SoC za AI. Arhitektura DSP, ki je bila prvotno zasnovana za pospeševanje delovnih obremenitev pri slikanju, je postala odlična za naloge ML, zlasti z vključitvijo Hexagon Vector eXtensions (HVX). DSP je bolj programabilen kot strojna oprema s fiksnimi funkcijami, medtem ko še vedno ohranja nekaj zmogljivosti in prednosti učinkovitosti, ki so značilne za posamezne procesorske bloke, ki močno pospešujejo skalarno in vektorsko operacije. To se je izkazalo za odlično pri nenehno spreminjajočih se algoritmih za obdelavo slik, ki jih je mogoče prenesti na DSP, seveda pa so primerni tudi za delovne obremenitve AI. Hexagon DSP je bil a ugodnost za strojno učenje na robnih napravah zaradi odličnega večnitnega in vzporednega računalništva na ravni strojne opreme, ki lahko obdeluje na tisoče bitov vektorskih enot na cikel obdelave v primerjavi s povprečnimi stotinami bitov jedra CPE na cikel in servisiranjem večkratne razbremenitve sej.

Hexagon DSP je še posebej primeren za slikovne naloge, saj lahko pretaka podatke neposredno iz slikovnega senzorja v lokalni pomnilnik DSP (predpomnilnik L2), mimo pomnilniškega krmilnika DDR naprave. Google je na primer uporabil obdelavo slik Hexagon DSP za napajanje algoritmov HDR+ Pixel in Pixel 2, preden je predstavil svoje Pixel Visual Core. Naprave, pripravljene na Hexagon, dajejo najboljše rezultate s priljubljenimi vrati Google Camera, ki jih lahko raziščete tukaj. Uporabljali so ga v delovnih obremenitvah navidezne in razširjene resničnosti, kar slavno poganja zdaj ne deluje Projekt Tango na Lenovo Phab 2 Pro in ASUS ZenFone AR. Kljub temu večina proizvajalcev originalne opreme, ki uporabljajo vodilne naprave Snapdragon, na tak ali drugačen način uporablja Hexagon DSP za obdelavo slik, kar lahko preverite z orodji, kot je Snapdragon Profiler.

Kaj je torej novega z novim DSP? Hexagon 690 je podvojil število vektorskih pospeševalnikov (HVX) z dveh na štiri za delo v tandemu s štirimi skalarnimi nitmi, ki prav tako vidijo izboljšano zmogljivost za 20 %. Poleg tega Hexagon 690 prinaša prvi tenzorski pospeševalnik za mobilne naprave z Hexagon Tensor Accelerator (HTA). To je pomemben dodatek: služi kot strojni pospešek za drago matrično množenje in vključuje tudi funkcije nelinearnosti (kot sta sigmoid in ReLU) na ravni strojne opreme, kar dodatno pospeši sklepanje. Te spremembe DSP bi se morale prevesti v boljše delovanje glasovnega pomočnika, od zaznavanja vročih besed do razčlenjevanja ukazov v napravi, ki na primer ponuja izboljšano odpravljanje odmeva in dušenje hrupa. Qualcomm poudarja, da zagotavlja popolno heterogeno računalniško platformo, ki omogoča izkoriščanje delovne obremenitve AI CPE, GPE ali DSP ali katera koli kombinacija treh blokov – po besedah ​​Garyja Brotmana iz Qualcomma je to to je "več kot eno jedro, je več kot strojna oprema, je popoln sistem". Njihova 4. generacija "Qualcomm AI Engine" presega tudi strojno opremo, saj najdemo tudi podporo za SDK Snapdragon Neural Processing in Hexagon NN za dostop zgoraj omenjene bloke, pa tudi Android NN API in priljubljena ogrodja ML, kot so Caffe/Caffe 2, TensorFlow/Lite in ONNX (odprto nevronsko omrežje). Menjava). Skupaj lahko ponudi Snapdragon 855 trikrat večja zmogljivost surovega umetne inteligence njegovega predhodnika (in dvakrat v primerjavi s Huaweiem), ki preliva 7 bilijonov operacij na sekundo (TOP). Ne pozabite pa, da se Qualcomm še naprej osredotoča na heterogeno računalniško rešitev namesto na en namenski blok.

Če želite izvedeti več o Hexagon DSP, si oglejte lanski komad s podrobnostmi o tem, kako pomaga pri delovnih obremenitvah AI.


Če povzamemo, računalniški paket Snapdragon 855 prinaša nekaj bolj vplivnih izboljšav iz leta v leto, ki smo jih videli v zadnjih letih. Spectra 380 ISP-CV, ki smo jih obravnavali v posebnem članku, prinaša tudi izjemne izboljšave zmogljivosti in energetske učinkovitosti, kar omogoča odlične nove funkcije, kot je snemanje videa 4K 60FPS HDR z pokončni način ali zamenjava ozadja (precej prilagodljiv!).

Kot je pojasnjeno v tem članku, bi se morali ti napredki in nove funkcije oprijemljivo čutiti v celotni uporabniški izkušnji. Veselimo se Qualcomm Snapdragon 855 in ga bomo kmalu lahko poglobljeno preizkusili, zato spremljajte XDA-Developers za najnovejše novice in analize o Snapdragon 855!