Ako Qualcomm zlepšil výkon, hry a AI na Snapdragon 855

click fraud protection

Nová mobilná platforma Qualcomm Snapdragon 855 prináša skvelé vylepšenia z hľadiska výkonu, hrania a AI a rozoberáme, ako sa im to podarilo.

Na samite Qualcomm's Snapdragon Summit 2018 spoločnosť oznámili svoj najnovší vlajkový čipset prémiovej úrovne: platformu Snapdragon 855. Tento nový produkt bude jadrom väčšiny plodných vlajkových lodí roku 2019 a prinesie so sebou prísľub neuveriteľných dátových rýchlostí prostredníctvom modemu Snapdragon X50. Okrem toho však Snapdragon 855 prináša množstvo vylepšení do každého bloku systému na čipe. niektoré výpočtové jednotky zaznamenali za posledné obdobie najväčšie medziročné zlepšenie výkonu a energetickej účinnosti histórie.

Už sme podrobne opísali Spectra 380 ISP-CV, ktorá napríklad ďalej zlepšuje fotografovanie smartfónom a zároveň prináša používateľom zdravé úspory batérie. Aj keď sme stále viac venovali pozornosť periférnym komponentom, ako je Hexagon DSP, základné bloky, ktoré nadšenci platia najviac pozornosť venovaná – menovite CPU a GPU – tiež zaznamenala viac než mierny nárast vďaka architektonickým vylepšeniam a prechodu na nový proces uzol. V tomto článku rýchlo zhrnieme, čo je nové a čo je známe o CPU, GPU a DSP Snapdragon 855 a ako môžu vylepšenia a nové funkcie ovplyvniť

tvoj používateľské skúsenosti v roku 2019.


CPU Kryo 485 na báze A76 a prechod na 7nm

Snapdragon 855 prechádza na najnovší 7nm FinFET výrobný proces TSMC. Každý rok alebo dva sa zvyčajne stretávame s revíziou uzla so znížením veľkosti alebo optimalizáciou v strede cyklu (ako je prechod z „Low-Power Early“ (LPE) na „Low-Power Plus“ (LPP) v uzloch Samsung-LSI), takže o týchto metrikách ste už pravdepodobne počuli v niektorých alebo iných správach článok. Ale čo to znamená? V tomto kontexte popisuje veľkosť vlastností tranzistora procesora, čo nám zase ukazuje, aké vylepšenia hustoty tranzistorov môžeme očakávať s každou novou generáciou. S väčším počtom tranzistorov na jednotku plochy sa dá výsledný výkon procesora škálovať. Táto funkcia je tiež dôležitá, pretože menšie procesné uzly umožňujú implementáciu návrhov procesorov v menšom rozsahu, čo je intuitívne zmenšuje priestor medzi prvkami procesora, čím sa skracuje vzdialenosť, ktorú musia elektróny prekonať výpočet. To prináša zlepšenie výkonu a menšie procesy majú tiež nižšiu kapacitu, čo znamená, že tranzistory sa môžu zapínať a vypínať s nižšou latenciou a nižšou energiou. Pre porovnanie, TSMC tvrdí, že prechod na ich 7nm proces dosahuje výkon a energetická účinnosť rádovo 20 % a 40 %., aj keď je to v porovnaní s vlastným 10nm FinFET procesom TSMC.

Počas niekoľkých posledných vlajkových čipsetov Snapdragon sme videli, ako Qualcomm spolupracuje so spoločnosťou Samsung a implementuje ich 14nm a 10nm LPP/LPE proces. Prechod na 7nm od TSMC pre Snapdragon 855 však nie je neočakávaný vzhľadom na to, že 7nm proces Samsungu mal práve vstúpil do sériovej výroby v októbri, hoci v tom čase sa uvádzalo, že na ňom bude postavený 5G čipset Qualcomm. Dizajn 7LPP od spoločnosti Samsung je navyše vyrobený vylepšenou litografickou technikou známou ako extrémna ultrafialová litografia (EUVL), prináša 40 % zmenšenie plochy pri rovnakej zložitosti dizajnu, s o 20 % vyššími rýchlosťami alebo o 50 % menšou spotrebou energie v porovnaní s 10nm FinFET predchodcov. Každý nový skok do menších procesných uzlov je oslavovaný práve preto, že je tak ťažké ich dosiahnuť. Napríklad, keď sa tranzistory zmenšujú, môžu vykazovať väčší „únik“ alebo prúd pretekajúci cez „vypnuté“ tranzistory, čím sa zvyšuje statická spotreba energie v stave nečinnosti. A zatiaľ čo menšie čipy s hustejším počtom tranzistorov môžu umožniť maximálne využitie daného kremíkového plátku, výťažnosť má tendenciu byť nižšia. kvôli vyššie uvedenému úniku plus ťažkostiam pri získavaní procesorov s „vyšším binovaním“, ktoré bežia na svojej (vysokej) referencii frekvencie. Toto sú len niektoré z mnohých vývojových prekážok, ktoré sa samozrejme odstránia v čase, keď nový procesný uzol zasiahne masovú výrobu, ale v Stručne povedané, existuje veľa výziev v oblasti výskumu a vývoja, ako aj výrobných problémov, ktoré zvyšujú náklady na zavedenie novej veľkosti procesu trhu.

Najnovšia architektúra ARM A76 licencovaná pre Kryo 485 je ďalším veľkým prispievateľom k podstatným medziročným zlepšeniam, ktoré vidíme u Qualcomm Snapdragon 855. Jadro A76 je úplne nový dizajn bez bridlice z pobočiek ARM v Austine, ktorý obsahuje novú mikroarchitektúru postavenú od nuly, aby poskytoval to, čo ARM nazýva „výkon triedy notebookov s mobilná efektivita." Stále ide o čiastočne prispôsobený dizajn a spoločnosť Qualcomm urobila vylepšenia, ako je optimalizované predbežné načítanie údajov pre lepšiu efektivitu a väčšie spustenie mimo objednávky. okno. Tento nový dizajn ponúka obrovské vylepšenia výkonu oproti A75, na ktorých boli založené zlaté jadrá Snapdragon 845: sľubuje 35% zlepšenie výkonu a o 40% lepšia energetická účinnosť. Pri porovnaní A75 na 10nm procese oproti A76 na 7nm procese pri rovnakej výkonovej obálke 750 mW/jadro, výkonnostná výhoda vzrastie na 40 % v prospech nového jadra a môže sa zvýšiť aj úspora energie na 50 %. A čo viac, ďalšie vylepšenia v asymetrických potrubiach s jednou inštrukciou s viacerými údajmi (ASIMD) a dot-product pokyny agregovať do ~3,9-násobného zlepšenia výkonu úloh strojového učenia, ako je inferencia v konvolučných neurónových sieťach. To všetko predstavuje špičkový výkon na plochu a skvelý doplnok k novému 7nm procesu, pričom 2,84 GHz „primárne jadro“ Qualcomm sa približuje k referenčným frekvenciám 3 GHz ARM. používal pri detailovaní nového jadra. Všetko vo všetkom, Qualcomm sľubuje absolútne masívne zlepšenie výkonu procesora o 45 %. nad 845, čo je zatiaľ najväčší medziročný nárast.

Keď už hovoríme o „primárnom jadre“ Snapdragon 855, nie je prekvapujúce, že Qualcomm prešiel s týmto novým nastavením klastra vzhľadom na veľké vylepšenia. LITTLE povolené pomocou ARM DynamIQ technologické platformy. DynamIQ v podstate umožňuje väčšiu flexibilitu a škálovateľnosť v dizajne viacjadrových procesorov, čo umožňuje návrh viacerých jadier v danom klastri, ako aj jemné riadenie napätia na jadro. (EDIT: V Q&A Qualcomm potvrdil, že jadro Prime zdieľa svoju výkonovú doménu s výkonnostným klastrom, čo obmedzuje tu opísanú pomôcku). A76 sa obzvlášť dobre hodí pre také osamelé prémiové jadro s vlastným taktom, keďže ide o jednovláknové maximum. výkon s o 25 % viac celočíselných inštrukcií za hodinu ako A75 a o 35 % vyšší výkon ASIMD a pohyblivej rádovej čiarky, pričom ponúka o 90 % vyšší šírka pásma pamäte. Stručne povedané, A76 predstavuje väčší generačný vzostup ako predchádzajúce generácie, čo nepochybne prispelo k tomu, že Qualcomm medziročný nárast výkonu pre Snapdragon 855 väčší ako zvyčajne (pre referenciu Qualcomm uviedol nárast o 25 až 30 % pre model 845 oproti 835). To by mohlo stačiť na to, aby bol výsledný výkon Qualcomm Snapdragon 855 pred jadrom Samsung LSI Mongoose 3 (M3), ktoré sa nachádza v Exynos 9810, hoci tento konkrétny dizajn trpel energetickou účinnosťou spôsobom, akým čipy Qualcomm netrpeli a že Snapdragon 855 s najväčšou pravdepodobnosťou nebude buď.

Čo to znamená pre koncového užívateľa? Samozrejme, mali by sme očakávať vylepšené benchmarkové jadrá – projekty ARM o 28 % vyššie skóre Geekbench pre mobilné zariadenia a o 35 % lepší výkon Javascriptu. Okrem štandardov, ktoré môžu mať malý súvis so skúsenosťami koncového používateľa, A76 pokračuje v zameraní A75 na trvalý výkon, čo znamená, že používatelia by mali počas dlhších herných relácií očakávať menšie škrtenie. Prechod na 7nm v kombinácii s novým dizajnom jadra určite povedie k viditeľnej batérii zlepšenie života pre koncových používateľov, a to je možno najatraktívnejšia vlastnosť tejto sady upgrady. Nové jadro „Prime“ je tiež zaujímavé vzhľadom na to, že osamelé jadro zamerané na špičkový výkon s jedným vláknom by mohlo ukázať ako prospešné v aplikáciách a procesoch, ktoré nie sú nastavené tak, aby ich náležite využívali viacvláknové. Samozrejme, 7nm výrobný proces má vplyv aj na ďalšie bloky Snapdragon 855 a prináša rovnakú úsporu energie. na iné výpočtové jednotky, ktoré sa tiež podieľajú na každodennej používateľskej skúsenosti, ako je napríklad spracovanie obrazu pri fotografovaní smartfónom.


„Snapdragon Elite Gaming Experience“ a GPU Adreno 640

Qualcomm Snapdragon 855 sa tentoraz výrazne zameriava na hranie, čo je vzhľadom na popularitu titulov neprekvapivý zvrat udalostí. ako Fortnite a PlayerUnknown’s Battlegrounds, ako aj rastúca popularita mobilných eSports (áno, ide o vec) v Ázii. Podľa údajov spoločnosti Qualcomm z Správa o celosvetovom trhu hier Newzoo 2017, mobilné hranie má stúpajúci trend s očakávaným celkovým príjmom v roku 2018 vo výške 70,3 miliardy USD, čo predstavuje 51 % všetkých príjmov z hier vďaka 25,5 % medziročnému nárastu.

GPU Adreno 640 prináša zdravé 20% zvýšenie grafického výkonu, čím ďalej zvyšuje náskok Qualcommu pred konkurenciou v tejto konkrétnej oblasti. Pre porovnanie, Snapdragon 845 priniesol 30% nárast oproti Snapdragonu 835, ktorý sám ponúkal 30% zlepšenie oproti Snapdragonu 821. Napriek tomu by to malo Qualcommu udržať náskok v grafickom výkone, a čo je najdôležitejšie, v výkone na watt, ak sa mu podarí zlepšiť aj v tomto smere. Okrem tohto čísla je Qualcomm rovnako tajný ako kedykoľvek predtým, pokiaľ ide o Adreno: počuli sme o integrovanom mikrokontrolér pre správu napájania a ako má 640 najnižšiu réžiu ovládača, hoci spoločnosť spomenula zahrnutie O 50 % viac aritmetických logických jednotiek (ALU), ktoré by ešte viac zrýchlili výkon AI.

Jedna vec, o ktorej Qualcomm strávil veľa času rozprávaním na briefingoch, je ich túžba priniesť „fyzikálne založené vykresľovanie“ (PBR) do mobilnejších herných zážitkov. PBR je tieňovací model, ktorý umožňuje realistické stvárnenie grafiky, presné modelovanie svetelného toku v súlade s materiálom zastúpeným v textúrach alebo mozaikovaním povrchu. To umožňuje, aby objekty v hre správne napodobňovali vizuálne vlastnosti materiálov v reálnom svete, vrátane správneho vykreslenia mikropovrchov, ako sú odreniny a zrkadlové zvýraznenia. Najvýraznejšie vylepšenia však prichádzajú v tom, že umožňuje presnejšie zobrazenie odrazivosti a lesku všetkých povrchov, dokonca aj tých z plochých a nepriehľadných (simulovaných) materiálov.

Qualcomm a vývojári stojaci za populárnym Unity Engine pracujú na tom, aby bol PBR prístupnejší, ale spoločnosť spolupracuje aj s ďalšími vývojármi motorov a hier pri optimalizácii mobilných hier pre Snapdragon zariadení. Herné motory ako Unity, Unreal, Messiah a NeoX sú už optimalizované napríklad pre zariadenia Snapdragon a Snapdragon 855 podporuje najnovšie grafické rozhrania API, ako je napr. Vulkan 1.1. Štúdiá ako NetMarble, ktoré stojí za Lineage II: Revolutions, tiež v minulosti spolupracovali so spoločnosťou Qualcomm, aby čo najlepšie predviedli silné stránky platformy Snapdragon. Navyše s Snapdragon 675, videli sme rozhovory o vlastnom algoritme, ktorý dosiahol až O 90 % menej džanov v porovnaní s rovnakou platformou bez optimalizácií a rovnaké zmeny sa dostali aj na Snapdragon 855. Stále nie je jasné, čo tieto optimalizácie znamenajú, a neočakávame, že budú použiteľné každej hre, ale určite to bude znamenať lepší výkon aspoň vo väčších tituloch Android.

Navyše, zatiaľ čo Snapdragon 835 a 845 umožňovali prehrávanie a zachytávanie (v tomto poradí) 10-bitové, skutočné HDR video, Qualcomm Snapdragon 855 bude prvým mobilným čipsetom, ktorý umožňuje skutočné HDR hranie. To si vyžiada skutočné displeje s podporou HDR, ktoré sú našťastie medzi vlajkovými smartfónmi čoraz bežnejšie. Z tohto dôvodu môžu používatelia očakávať bohatšie farby s väčšou hĺbkou tónov, vyšším dynamickým rozsahom (ako naznačuje názov) a vylepšeným kontrastom. Nie je to nevyhnutne nevyhnutná funkcia, ale určite je pekné mať k dispozícii súčasné HDR hry nastavenia vyžadujú drahé televízory a monitory s podporou HDR, ako aj schopné počítače a špecifické hry konzol. S Qualcomm Snapdragon 855 bude HDR v hrách pravdepodobne dostupnejšie a pohodlnejšie (samozrejme bez ovládacích prvkov na dotykovej obrazovke).


Nový Hexagon 690 DSP pre pracovné zaťaženie AI

Aj keď ju spoločnosť vo svojich marketingových materiáloch výslovne nenazýva „jednotkou na spracovanie neurónov“, nový a vylepšený Hexagon 690 DSP bude profitovať aj z pracovného zaťaženia AI. Qualcomm v tichosti predstavil tieto koprocesory pred mnohými generáciami (s riadnym uvedením QDSP6 v6 popri 820), ale až nedávno ich začali prezentovať ako niektoré z lepších blokov SoC pre AI. Architektúra DSP, ktorá bola pôvodne navrhnutá na urýchlenie pracovných zaťažení zobrazovania, – najmä so zahrnutím Hexagon Vector eXtensions (HVX) – sa stala skvelou voľbou pre úlohy ML. DSP je viac programovateľný ako hardvér s pevnou funkciou, pričom si stále zachováva časť výkonu a výhody efektívnosti, ktoré charakterizujú bloky procesorov špecifické pre aplikáciu, výrazne zrýchľujú skalárne a vektorové operácií. To sa ukázalo ako vynikajúce pre neustále sa meniace algoritmy spracovania obrazu, ktoré možno preniesť na DSP, ale tiež sa prirodzene hodí na pracovné zaťaženie AI. Hexagon DSP bol a prínos pre strojové učenie na okrajových zariadeniach vďaka vynikajúcemu viacvláknovému a paralelnému výpočtovému výkonu na hardvérovej úrovni, ktorý dokáže spracovať tisíce bitov vektorových jednotiek na cyklus spracovania v porovnaní so stovkami bitov za cyklus priemerného jadra CPU a s viacnásobným zaťažením relácií.

Hexagon DSP je obzvlášť vhodný pre zobrazovacie úlohy, pretože dokáže prenášať údaje priamo zo zobrazovacieho snímača do lokálnej pamäte DSP (L2 Cache), čím obchádza radič pamäte DDR zariadenia. Spoločnosť Google napríklad použila spracovanie obrazu Hexagon DSP na napájanie algoritmov HDR+ Pixel a Pixel 2 predtým, ako predstavil svoje vlastné Pixel Visual Core. Sú to tiež zariadenia pripravené pre Hexagon, ktoré dosahujú najlepšie výsledky z populárnych portov Google Camera, ktoré môžete preskúmať tu. Používa sa pri pracovných zaťaženiach vo virtuálnej a rozšírenej realite, čo je slávne napájanie dnes už neexistujúce Projekt Tango na Lenovo Phab 2 Pro a ASUS ZenFone AR. To znamená, že väčšina OEM implementujúcich vlajkové zariadenia Snapdragon využíva Hexagon DSP na spracovanie obrazu tak či onak, čo si môžete overiť pomocou nástrojov ako Snapdragon Profiler.

Čo je teda nové s novým DSP? Hexagon 690 zdvojnásobil počet vektorových urýchľovačov (HVX) z dvoch na štyri, aby pracovali v tandeme so štyrmi skalárnymi vláknami, ktoré tiež zaznamenali lepší výkon o 20 %. Okrem toho Hexagon 690 prináša prvý urýchľovač tenzorov pre mobilné zariadenia s Hexagon Tensor Accelerator (HTA). Toto je významný doplnok: slúži ako hardvérová akcelerácia pre drahé násobenie matíc a tiež integruje nelineárne funkcie (ako sigmoid a ReLU) na hardvérovej úrovni, čím ďalej zrýchľuje záver. Tieto zmeny v DSP by sa mali premietnuť do lepší výkon hlasového asistenta, od detekcie horúcich slov až po analýzu príkazov na zariadení, ktoré ponúkajú napríklad vylepšené potlačenie ozveny a šumu. Qualcomm zdôrazňuje, že poskytujú kompletnú heterogénnu výpočtovú platformu, ktorá umožňuje využívať pracovnú záťaž AI. buď CPU, GPU alebo DSP, alebo akákoľvek kombinácia týchto troch blokov – slovami Garyho Brotmana z Qualcommu, toto to je "viac ako jedno jadro, je to viac ako hardvér, je to kompletný systém". Ich 4. generácia „Qualcomm AI Engine“ presahuje aj hardvér, pretože nájdeme aj podporu pre Snapdragon Neural Processing SDK a Hexagon NN na prístup vyššie uvedené bloky, ako aj Android NN API a populárne rámce ML ako Caffe/Caffe 2, TensorFlow/Lite a ONNX (Open Neural Network výmena). Celkovo môže Snapdragon 855 ponúknuť trikrát vyšší výkon AI svojho predchodcu (a dvakrát v porovnaní s Huawei), prevyšuje 7 biliónov operácií za sekundu (TOP). Majte však na pamäti, že Qualcomm sa naďalej zameriava na heterogénne výpočtové riešenie namiesto zamerania sa na jeden vyhradený blok.

Ak sa chcete dozvedieť viac o Hexagon DSP, pozrite sa minuloročný kúsok podrobne o tom, ako pomáha s pracovným zaťažením AI.


Stručne povedané, výpočtový balík Snapdragon 855 prináša niektoré z najvplyvnejších medziročných vylepšení, ktoré sme videli v posledných rokoch. Spectra 380 ISP-CV, ktorým sme sa venovali v samostatnom článku, tiež prináša obrovské zvýšenie výkonu a energetickej účinnosti, čo umožňuje vynikajúce nové funkcie, ako je nahrávanie videa 4K 60FPS HDR s režim na výšku alebo výmena pozadia (dosť flexibilné!).

Ako je vysvetlené v tomto článku, tieto vylepšenia a nové funkcie by sa mali hmatateľne prejaviť v používateľskej skúsenosti. Tešíme sa na Qualcomm Snapdragon 855 a čoskoro ho dôkladne otestujeme, takže zostaňte naladení na XDA-Developers pre najnovšie správy a analýzy Snapdragon 855!