Hogyan javította a Qualcomm a teljesítményt, a játékot és az AI-t a Snapdragon 855-ön

click fraud protection

Az új Qualcomm Snapdragon 855 mobilplatform jelentős javulást hoz a teljesítmény, a játék és a mesterséges intelligencia terén, és leírjuk, hogyan tették ezt.

A Qualcomm Snapdragon Summit 2018-as rendezvényén a vállalat bejelentette legújabb prémium szintű, zászlóshajó chipkészletét: a Snapdragon 855 platformot. Ez az új termék lesz a legtöbb 2019-es csúcsmodell középpontjában, és magával hozza a hihetetlen adatsebesség ígéretét a Snapdragon X50 modemen keresztül. Ezen túlmenően azonban a Snapdragon 855 egy csomó fejlesztést hoz minden chip-alapú blokkba. egyes számítási egységek az utóbbi időben a legnagyobb teljesítmény- és energiahatékonysági javulást tapasztalták éves szinten történelem.

Már részleteztük a Spectra 380 ISP-CV-tpéldául, amely tovább javítja az okostelefonos fotózást, miközben a felhasználóknak egészséges akkumulátor-megtakarítást is biztosít. Miközben egyre nagyobb figyelmet szentelünk az olyan perifériás alkatrészeknek, mint a Hexagon DSP, a lelkesek által leginkább fizetett magblokkok A figyelem – nevezetesen a CPU-ra és a GPU-ra – szintén szerényebb javulást tapasztalt az építészeti fejlesztésekkel és az új folyamatra való átállással. csomópont. Ebben a cikkben gyorsan összefoglaljuk a Snapdragon 855 CPU-jával, GPU-jával és DSP-jével kapcsolatos újdonságokat és ismereteket, valamint azt, hogy a fejlesztések és az új funkciók hogyan befolyásolhatják

a te felhasználói élmény 2019-ben.


A76-alapú Kryo 485 CPU és a 7nm-re való átállás

A Snapdragon 855 áttér a TSMC legújabb, 7 nm-es FinFET gyártási folyamatára. Általában évente vagy kétévente látunk egy csomópont-revíziót, méretcsökkentéssel vagy ciklusközi optimalizálással (például a „Low-Power Early”-ról való átállással) (LPE) a „Low-Power Plus” (LPP) értékre a Samsung-LSI csomópontokban), így valószínűleg hallott már ezekről a mutatókról bizonyos hírekben cikk. De mit jelent ez? Ebben az összefüggésben leírja a processzor tranzisztor tulajdonságainak méretét, ami viszont rámutat arra, hogy milyen tranzisztorsűrűség-javulásra számíthatunk minden új generációval. Területegységenként több tranzisztorral a processzor teljesítménye növelhető. Ez a funkció azért is fontos, mert a kisebb folyamatcsomópontok lehetővé teszik a processzortervek kisebb léptékű megvalósítását, ami intuitív módon csökkenti a processzor elemei közötti teret, lerövidíti azt a távolságot, amelyet az elektronoknak meg kell tenniük, hogy elérjék számítás. Ez javítja a teljesítményt, és a kisebb folyamatok kisebb kapacitással is rendelkeznek, ami azt jelenti, hogy a tranzisztorok alacsonyabb késleltetéssel és alacsonyabb energiával kapcsolhatnak be és ki. Referenciaként a TSMC azt állítja, hogy a 7 nm-es eljárásukra való átállás elérte teljesítmény és energiahatékonyság 20%, illetve 40% nagyságrendű, bár ez a TSMC saját 10 nm-es FinFET folyamatához képest.

Az elmúlt néhány Snapdragon zászlóshajó lapkakészlet esetében láthattuk, hogy a Qualcomm együttműködött a Samsunggal, és megvalósította a 14 nm-es és 10 nm-es LPP/LPE folyamatukat. A TSMC 7 nm-es Snapdragon 855-re való áttérés azonban nem váratlan, mivel a Samsung 7 nm-es eljárása októberben kezdte meg a tömeggyártást, pedig akkoriban arról számoltak be, hogy egy 5G Qualcomm lapkakészletet építenek rá. Ezenkívül a Samsung 7LPP dizájnja továbbfejlesztett litográfiai technikával, az extrém ultraibolya litográfia (EUVL) néven ismert. 40%-os területcsökkentést eredményez azonos tervezési komplexitás mellett, 20%-kal nagyobb sebességgel vagy 50%-kal kisebb energiafogyasztással a 10 nm-es FinFET-hez képest elődök. Minden új ugrás a kisebb folyamatcsomópontokra éppen azért ünnepelhető, mert olyan nehéz elérni őket. Például, ahogy a tranzisztorok kisebbek, nagyobb „szivárgást” mutathatnak ki, vagy a „kikapcsolt” tranzisztorokon átfolyó áramot, ami növeli a statikus energiafogyasztást tétlen állapotban. És bár a kisebb, sűrűbb tranzisztorszámú chipek lehetővé teszik, hogy a legtöbbet hozzuk ki egy adott szilícium lapkából, a hozam általában alacsonyabb a fent említett szivárgás, valamint a (magas) referenciaértéken futó „magasabb bind” processzorok beszerzésének nehézségei frekvenciák. Ezek csak néhány a sok fejlesztési akadály közül, amelyek természetesen elhárulnak, mire egy új folyamatcsomópont tömeggyártásba kezd, de Röviden, számos kutatási és fejlesztési, valamint gyártási kihívás van, amelyek növelik az új folyamatméretek bevezetésének költségeit piac.

A Kryo 485-höz licencelt legújabb ARM A76 architektúra egy másik nagy mértékben hozzájárul a Qualcomm Snapdragon 855-nél tapasztalható évről évre jelentős fejlesztésekhez. Az A76 mag az ARM austini irodáinak vadonatúj, üres lapja, új mikro-architektúrával, amit a semmiből építenek fel, hogy az ARM által "laptop osztályú teljesítményt" biztosítsa. mobil hatékonyság." Ez továbbra is egy félig egyedi tervezés, és a Qualcomm olyan fejlesztéseket hajtott végre, mint például az optimalizált adatok előzetes lekérése a jobb hatékonyság érdekében, és nagyobb, nem megfelelő végrehajtás ablak. Ez az új dizájn néhány óriási teljesítményjavulást kínál az A75-höz képest, amelyre a Snapdragon 845 Gold magjai épültek: 35%-os teljesítménynövekedés és 40%-kal jobb energiahatékonyság. Ha összehasonlítjuk az A75-öt 10 nm-es folyamaton és az A76-ot 7 nm-es folyamaton, ugyanazon a teljesítményen. 750 mW/mag, a teljesítményelőny 40%-ra nő az új mag javára, és az energiamegtakarítás is megnőhet 50%-ra. Sőt, az aszimmetrikus egyutasításos többszörös adat (ASIMD) folyamatok egyéb fejlesztései és pont-termék utasításokat összesítve ~3,9-szeres javulást jelent a gépi tanulási feladatok teljesítményében, mint például a konvolúciós neurális hálózatokban való következtetés. Mindez az iparágban vezető területenkénti teljesítményt jelent, és nagyszerűen kiegészíti az új 7 nm-es eljárást, mivel a Qualcomm 2,84 GHz-es „elsődleges magja” közel kúszik a 3 GHz-es ARM referencia órajelekhez. használta az új mag részletezésekor. Összességében, A Qualcomm abszolút masszív, 45%-os CPU teljesítményjavulást ígér a 845 felett, ami az eddigi legnagyobb éves emelkedés.

Ha már a Snapdragon 855 „elsődleges magjáról” beszélünk, az sem meglepő, hogy a Qualcomm beköltözik az új fürtbeállításba, tekintettel a nagy fejlesztésekre. LITTLE-t az ARM engedélyezte DynamIQ technológiai platformok. Lényegében a DynamIQ nagyobb rugalmasságot és skálázhatóságot tesz lehetővé a többmagos processzorok tervezésében, lehetővé téve több magos kialakítást egy adott klaszterben, valamint a magonkénti feszültségszabályozást is. (SZERKESZTÉS: A Qualcomm egy Q&A-ban megerősítette, hogy a Prime mag megosztja a teljesítménytartományát a teljesítményfürttel, korlátozva az itt leírt segédprogramot). Az A76 különösen jól illeszkedik egy ilyen magányos prémium maghoz, saját órával, mivel az egyszálas szálaknál elnyomja a borítékot. teljesítmény az A75-höz képest 25%-kal több integer utasítással, és 35%-kal magasabb ASIMD és lebegőpontos teljesítmény, miközben 90%-kal jobb Memória sávszélesség. Röviden, az A76 nagyobb generációs felemelkedést mutat, mint az előző generációk, ami kétségtelenül hozzájárult a Qualcomm a szokásosnál nagyobb teljesítménycsökkenés a Snapdragon 855 esetében (referenciaként a Qualcomm 25-30%-os növekedést említett a 845 over esetében a 835). Ez elég lehet ahhoz, hogy a Qualcomm Snapdragon 855 teljesítménye megelőzze az Exynos 9810-ben található Samsung LSI Mongoose 3 (M3) magot. bár az adott kialakítás olyan energiahatékonyságot szenvedett el, amilyen módon a Qualcomm chipek nem, és a Snapdragon 855 valószínűleg nem. bármelyik.

Mit jelent ez a végfelhasználó számára? Természetesen megnövekedett benchmark magokra kell számítanunk – az ARM 28%-kal magasabb Geekbench-pontszámot vetít előre a mobileszközökön, és 35%-kal javult a Javascript teljesítménye. A benchmarkokon túl, amelyeknek alig van köze a végfelhasználói élményhez, az A76 továbbra is az A75-re összpontosít. tartós teljesítmény, ami azt jelenti, hogy a felhasználóknak kevesebb szabályozásra kell számítaniuk a hosszabb játékmenetek során. A 7 nm-re való átállás az új magkialakítással kombinálva minden bizonnyal észrevehető akkumulátort eredményez életminőség-javítások a végfelhasználók számára, és talán ez a legvonzóbb tulajdonsága ennek a készletnek frissítéseket. Az új „Prime” mag is érdekes, mivel egy magányos mag, amely a legjobb egyszálas teljesítményre összpontosít, hasznosnak bizonyulnak az olyan alkalmazásokban és folyamatokban, amelyek nincsenek beállítva a megfelelő előnyök kihasználására többszálú. Természetesen a 7 nm-es gyártási folyamat tovább hat a Snapdragon 855 többi blokkjára is, ugyanazzal az energiamegtakarítással más számítási egységekhez, amelyek szintén részt vesznek a napi felhasználói élményben, például az okostelefonos fotózás képfeldolgozásában.


„Snapdragon Elite Gaming Experience” és Adreno 640 GPU

A Qualcomm Snapdragon 855 ezúttal nagy hangsúlyt fektet a játékokra, ami a címek népszerűsége miatt nem meglepő fordulat. mint a Fortnite és a PlayerUnknown’s Battlegrounds, valamint a mobil eSport növekvő népszerűsége (igen, ez egy dolog) Ázsiában. A Qualcomm által bemutatott adatok szerint a A Newzoo 2017-es globális játékpiaci jelentése, a mobiljátékok felfelé ívelnek, 2018-ra várhatóan 70,3 milliárd dollár összbevétellel, ami az összes játékbevétel 51%-át teszi ki, köszönhetően az éves 25,5%-os növekedésnek.

Az Adreno 640 GPU egészséges 20%-os grafikai teljesítménynövekedés, ami tovább növeli a Qualcomm előnyét ezen a területen a versenytársakkal szemben. Referenciaként azonban a Snapdragon 845 30%-os emelkedést hozott a Snapdragon 835-höz képest, amely maga is 30%-os javulást kínált a Snapdragon 821-hez képest. Ennek ellenére a Qualcomm előrébb tarthatja a grafikus teljesítményt, és ami a legfontosabb, a wattonkénti teljesítményt, ha ezen a téren is sikerül javítani. Ezen túlmenően a Qualcomm olyan titokzatos, mint valaha, ami az Adrenót illeti: hallottunk az integrált mikrokontroller az energiagazdálkodáshoz, és hogy a 640-ben a legalacsonyabb az illesztőprogram-költség, bár a cég megemlítette szerepeltetése 50%-kal több aritmetikai logikai egység (ALU-k), amelyek tovább gyorsítanák az AI teljesítményét.

Az egyik dolog, amiről a Qualcomm sok időt töltött az eligazításokon, az az a vágy, hogy a „fizikai alapú renderelést” (PBR) még több mobil játékélményhez hozzák. A PBR egy árnyékoló modell, amely valósághű grafikai megjelenítést tesz lehetővé, pontosan modellezve a fényáramlást a textúrákban vagy a felület tesszellációjában megjelenített anyagnak megfelelően. Ez lehetővé teszi a játékon belüli objektumok számára, hogy megfelelően utánozzák a valós anyagok vizuális tulajdonságait, beleértve a mikrofelületek, például a kopások és a tükörfényességek megfelelő megjelenítését. A legszembetűnőbb fejlesztések azonban abban rejlenek, hogy lehetővé teszi az összes felület tükrözőképességének és fényességének pontosabb ábrázolását, még a lapos és átlátszatlan (szimulált) anyagok esetében is.

A Qualcomm és a népszerű Unity Engine mögött álló fejlesztők azon dolgoznak, hogy elérhetőbbé tegyék a PBR-t, de a cég más motor- és játékfejlesztőkkel is együttműködik a mobiljátékok Snapdragonra optimalizálása terén eszközöket. Az olyan játékmotorok, mint a Unity, az Unreal, a Messiah és a NeoX már optimalizálva vannak például a Snapdragon eszközökre, és a Snapdragon 855 támogatja a legújabb grafikus API-kat, például az új Vulkan 1.1. Az olyan stúdiók, mint a NetMarble, amely a Lineage II: Revolutions mögött áll, szintén együttműködött a Qualcommmal a múltban, hogy a legjobban bemutassák a Snapdragon platform erősségeit. Ráadásul azzal a Snapdragon 675, láttunk beszélni egy egyéni algoritmusról, amely akár 90%-kal kevesebb jank ugyanahhoz a platformhoz képest az optimalizálás nélkül, és ugyanazok a változtatások a Snapdragon 855-höz is eljutottak. Még mindig nem világos, hogy ezek az optimalizálások mit jelentenek, és nem számítunk arra, hogy alkalmazhatók lesznek minden játékban, de ez minden bizonnyal jobb teljesítményt jelent, legalábbis a nagyobb címeken Android.

Mindezeken felül, míg a Snapdragon 835 és 845 lehetővé tette a lejátszást és a rögzítést (illetve) 10 bites, valódi HDR videó, a Qualcomm Snapdragon 855 lesz az első olyan mobil lapkakészlet, amely lehetővé teszi igazi HDR játék. Ehhez valódi HDR-képes kijelzőkre lesz szükség, amelyek szerencsére egyre gyakoribbak a zászlóshajós okostelefonok között. Emiatt a felhasználók gazdagabb színekre számíthatnak, nagyobb tónusmélységgel, nagyobb dinamikatartománnyal (ahogyan a név is sugallja) és jobb kontraszttal. Ez nem feltétlenül kötelező funkció, de mindenképpen jó, hogy megadtuk ezt a jelenlegi HDR-játékot A beállításokhoz drága HDR-kompatibilis tévékre és monitorokra, valamint megfelelő számítógépekre és speciális játékra van szükség konzolok. A Qualcomm Snapdragon 855-tel a HDR a játékokban vitathatatlanul elérhetőbb és kényelmesebb lesz (természetesen az érintőképernyő vezérlése nélkül).


Új Hexagon 690 DSP az AI munkaterhelésekhez

Bár a cég nem nevezi kifejezetten „neurális feldolgozó egységnek” marketinganyagaiban, az AI munkaterhelése is előnyös lesz az új és továbbfejlesztett Hexagon 690 DSP-ből. A Qualcomm csendesen bemutatta ezeket a társprocesszorokat sok generációval ezelőtt (a QDSP6 v6 megfelelő bevezetésével a 820 mellett), de egészen a közelmúltig nem kezdték el ezeket a jobb SoC blokkok közé sorolni. AI. Az eredetileg a képalkotási munkaterhelések felgyorsítására tervezett DSP architektúrája – különösen a Hexagon Vector eXtensions (HVX) bevonásával – kiválóan illeszkedik az ML feladatokhoz. A DSP programozhatóbb, mint a fix funkciójú hardver, miközben megőrzi a teljesítmény és a teljesítmény egy részét az alkalmazás-specifikus processzorblokkokra jellemző hatékonysági előnyök, amelyek jelentősen felgyorsítják a skalárt és a vektort tevékenységek. Ez kiválónak bizonyult az állandóan változó képfeldolgozó algoritmusokhoz, amelyek lerakhatók a DSP-re, de természetesen alkalmasak az AI-munkaterhelésre is. A Hexagon DSP már a áldás a gépi tanuláshoz szélső eszközökön kiváló hardverszintű többszálú és párhuzamos számítási képességének köszönhetően, amely több ezer bit kezelésére képes vektoros egység feldolgozási ciklusonként, összehasonlítva egy átlagos CPU mag ciklusonkénti több száz bitjével, és többszörös tehermentesítést is kiszolgál üléseken.

A Hexagon DSP különösen alkalmas képalkotási feladatokra, mivel közvetlenül képes adatfolyamot továbbítani a képérzékelőről a DSP helyi memóriájába (L2 Cache), megkerülve az eszköz DDR memóriavezérlőjét. A Google például a Hexagon DSP képfeldolgozását használta a Pixel és a Pixel 2 HDR+ algoritmusainak működtetésére, mielőtt bemutatta volna a sajátját. Pixel Visual Core. Ezenkívül a hatszög-kompatibilis eszközök a legjobb eredményeket érik el a népszerű Google Camera portokkal, amelyeket felfedezhet itt. Virtuális és kiterjesztett valóság munkaterhelésekben használták, híresen táplálva a mára megszűnt Project Tango a Lenovo Phab 2 Pro és ASUS ZenFone AR. Ennek ellenére a legtöbb Snapdragon zászlóshajó eszközt megvalósító OEM valamilyen módon a Hexagon DSP-t használja a képfeldolgozáshoz, amelyet olyan eszközökkel ellenőrizhet, mint Snapdragon Profiler.

Tehát mi az újdonság az új DSP-vel? A Hexagon 690 megduplázta a vektorgyorsítók (HVX) számát kettőről négyre, hogy párhuzamosan működjön a négy skaláris szállal, amelyek teljesítménye is 20%-kal javult. Ráadásul a Hexagon 690 elhozza az első tenzorgyorsítót mobilokhoz. Hexagon Tensor Accelerator (HTA). Ez jelentős kiegészítés: hardveres gyorsításként szolgál a drága mátrixszorzáshoz, ill hardverszinten integrálja a nemlinearitási függvényeket (mint a sigmoid és a ReLU), tovább gyorsítva következtetés. A DSP-ben ezeknek a változtatásoknak a következőre kell következniük jobb hangsegéd teljesítmény, a gyorsszavak észlelésétől az eszközön belüli parancselemzésig, amely például továbbfejlesztett visszhang- és zajszűrést kínál. A Qualcomm hangsúlyozza, hogy teljes heterogén számítási platformot biztosítanak, amely lehetővé teszi az AI munkaterhelésének kihasználását. akár a CPU-t, a GPU-t vagy a DSP-t, akár a három blokk bármely kombinációját – a Qualcomm Gary Brotman szavaival élve ez ez van "Több mint egy mag, ez több, mint hardver, ez egy teljes rendszer". A 4. generációs „Qualcomm AI Engine” túlmutat a hardveren, mivel a Snapdragon Neural Processing SDK és a Hexagon NN is támogatja a hozzáférést. a fent említett blokkokat, valamint az Android NN API-t és a népszerű ML keretrendszereket, mint például a Caffe/Caffe 2, TensorFlow/Lite és ONNX (Open Neural Network) Csere). Összességében a Snapdragon 855 tud nyújtani háromszorosa a nyers mesterséges intelligencia teljesítményének elődjéhez képest (és a Huaweihez képest kétszer), felülmúlva 7 billió művelet másodpercenként (TOP). Ne feledje azonban, hogy a Qualcomm továbbra is egy heterogén számítástechnikai megoldásra összpontosít, nem pedig egyetlen dedikált blokkra.

Ha többet szeretne megtudni a Hexagon DSP-ről, nézze meg tavalyi darab részletezi, hogyan segíti az AI munkaterhelését.


Összefoglalva, a Snapdragon 855 számítási csomagja az elmúlt években tapasztalt évről évre hatásosabb fejlesztéseket hoz. A Spectra 380 ISP-CV, amivel külön cikkben foglalkoztunk, emellett óriási teljesítménynövekedést és energiahatékonyságot is hoz, lehetővé téve olyan kiváló új funkciókat, mint a 4K 60FPS HDR videofelvétel val vel portré mód vagy háttércsere (nagyon rugalmas!).

Amint azt ebben a cikkben kifejtettük, ezeknek a fejlesztéseknek és új funkcióknak kézzelfoghatóan éreztetniük kell magukat a felhasználói élmény során. Már nagyon várjuk a Qualcomm Snapdragon 855-öt, és hamarosan alaposan tesztelhetjük is, úgyhogy kövessétek az XDA-Developers oldalát a Snapdragon 855 legújabb híreiért és elemzéseiért!