Noua platformă mobilă Qualcomm Snapdragon 855 aduce îmbunătățiri mari în ceea ce privește performanța, jocurile și inteligența artificială, și detaliem modul în care au făcut-o.
La Qualcomm’s Snapdragon Summit 2018, compania și-au anunțat cel mai nou chipset de vârf de nivel premium: platforma Snapdragon 855. Acest nou produs va fi în centrul celor mai multe dintre produsele emblematice prolifice din 2019, aducând cu el promisiunea unor viteze incredibile de date prin modemul Snapdragon X50. Dincolo de asta, totuși, Snapdragon 855 aduce o serie de îmbunătățiri fiecărui bloc sistem pe cip, cu unele unități de calcul au înregistrat cele mai mari îmbunătățiri de la an la an a performanței și eficienței energetice din ultima vreme istorie.
Am detaliat deja Spectra 380 ISP-CV, de exemplu, care îmbunătățește și mai mult fotografia de pe smartphone, oferind și utilizatorilor economii sănătoase de baterie. Deși am acordat din ce în ce mai multă atenție componentelor periferice precum Hexagon DSP, blocurile de bază pe care pasionații le plătesc cel mai mult atenția asupra — și anume, CPU și GPU — au înregistrat, de asemenea, câștiguri mai mult decât modeste cu îmbunătățiri arhitecturale și trecerea la un nou proces nodul. În acest articol, vom recapitula rapid noutățile și ceea ce se știe despre procesorul, GPU-ul și DSP-ul Snapdragon 855 și modul în care îmbunătățirile și noile funcții ar putea avea impact
ta experiența utilizatorului în 2019.CPU Kryo 485 bazat pe A76 și trecerea la 7nm
Snapdragon 855 trece la cel mai recent proces de fabricație FinFET de 7 nm al TSMC. De obicei vedem o revizuire a nodului la fiecare an sau doi, cu reduceri sau optimizări la mijlocul ciclului (cum ar fi trecerea de la „Low-Power Early” (LPE) la „Low-Power Plus” (LPP) în nodurile Samsung-LSI), așa că probabil că ați auzit de aceste valori în unele știri articol. Dar ce înseamnă? În acest context, descrie dimensiunea caracteristicilor tranzistorului procesorului, care, la rândul lor, ne indică la ce fel de îmbunătățiri ale densității tranzistorului ne putem aștepta cu fiecare nouă generație. Cu mai mulți tranzistori pe unitate de suprafață, performanța rezultată a procesorului poate fi mărită. Această caracteristică este, de asemenea importantă, deoarece nodurile de proces mai mici permit implementarea proiectelor de procesoare la o scară mai mică, ceea ce intuitiv micșorează spațiul dintre elementele procesorului, scurtând, la rândul său, distanța pe care electronii trebuie să o parcurgă pentru a o îndeplini calcul. Acest lucru aduce îmbunătățiri ale performanței, iar procesele mai mici au, de asemenea, o capacitate mai mică, ceea ce înseamnă că tranzistorii se pot porni și se pot opri cu o latență mai mică și la o energie mai mică. Pentru referință, TSMC susține că trecerea la procesul lor de 7 nm realizează performanță și eficiență energetică de ordinul a 20% și, respectiv, 40%., deși acest lucru este comparat cu propriul proces FinFET de 10 nm al TSMC.
Pentru ultimele câteva chipset-uri emblematice Snapdragon, am văzut Qualcomm lucrând cu Samsung și implementând procesul lor LPP/LPE de 14 nm și 10 nm. Trecerea la 7nm al TSMC pentru Snapdragon 855 nu este însă neașteptată, având în vedere că procesul de 7nm al Samsung a avut tocmai a intrat în producția de masă în octombrie, deși la momentul respectiv a fost raportat că un chipset Qualcomm 5G ar fi construit pe el. În plus, designul Samsung 7LPP este fabricat conform unei tehnici de litografie îmbunătățite cunoscută sub numele de litografie ultravioletă extremă (EUVL), oferind o reducere de 40% a suprafeței la o complexitate egală a designului, cu viteze cu 20% mai mari sau cu 50% mai puțin consum de energie comparativ cu FinFET de 10 nm predecesorii. Fiecare nou salt la noduri de proces mai mici este celebrat tocmai pentru că sunt atât de greu de realizat. De exemplu, pe măsură ce tranzistoarele devin mai mici, ele pot prezenta o „scurgere” mai mare sau curent care curge prin tranzistoarele care sunt „închise”, crescând consumul de energie statică în stările inactiv. Și în timp ce cipurile mai mici cu număr mai dens de tranzistori ar putea permite să profitați la maximum de o anumită placă de siliciu, randamentul tinde să fie mai mic din cauza scurgerii menționate mai sus, plus dificultăți în obținerea procesoarelor „cu conținut mai mare” care rulează la referința lor (înaltă) frecvente. Acestea sunt doar niste dintre numeroasele obstacole de dezvoltare care sunt, desigur, eliminate până când un nou nod de proces atinge producția de masă, dar în Pe scurt, există multe provocări de cercetare și dezvoltare, precum și de producție, care se adaugă la costul aducerii unei noi dimensiuni a procesului la piaţă.
Cea mai recentă arhitectură ARM A76 cu licență pentru Kryo 485 este un alt contribuitor important la îmbunătățirile substanțiale de la an la an pe care le vedem cu Qualcomm Snapdragon 855. Miezul A76 este un design nou-nouț, de la birourile ARM din Austin, care prezintă o nouă micro-arhitectură construită de la zero pentru a oferi ceea ce ARM numește „performanță de clasă laptop cu eficiență mobilă.” Este încă un design semi-personalizat, iar Qualcomm a adus îmbunătățiri, cum ar fi preluarea optimizată a datelor pentru o eficiență mai bună și o execuție mai mare nerespectată. fereastră. Acest nou design oferă unele îmbunătățiri extraordinare de performanță față de A75, pe care s-au bazat nucleele Gold ale lui Snapdragon 845: promite un Îmbunătățirea performanței cu 35% și eficiența energetică cu 40% mai bună. Când se compară A75 pe un proces de 10 nm cu A76 pe un proces de 7 nm la același pachet de putere de 750 mW/nucleu, avantajul de performanță crește la 40% în favoarea noului nucleu, iar economiile de energie pot crește și ele la 50%. Mai mult decât atât, alte îmbunătățiri ale conductelor Asymmetric Single Instruction Multiple Data (ASIMD) și instrucțiuni de produs punct agregați la ~3,9x îmbunătățiri ale performanței sarcinilor de învățare automată, cum ar fi inferența în rețelele neuronale convoluționale. Toate acestea reprezintă o performanță pe zonă de vârf în industrie și o completare excelentă a noului proces de 7 nm, cu „Prime core” de 2,84 GHz al Qualcomm care se apropie de vitezele de referință ARM de 3 GHz. folosise la detalierea noului nucleu. În întregime, Qualcomm promite o îmbunătățire absolut masivă a performanței procesorului cu 45%. peste 845, cea mai mare creștere de la an la an de până acum.
Vorbind despre „nucleul principal” al lui Snapdragon 855, nu este de asemenea surprinzător să vedem că Qualcomm se mută cu această nouă configurație de cluster având în vedere îmbunătățirile mai mari. LITTLE activat de ARM DynamIQ platforme tehnologice. În esență, DynamIQ permite mai multă flexibilitate și scalabilitate în proiectarea procesorului cu mai multe nuclee, permițând mai multe modele de nuclee într-un anumit cluster, precum și un control fin al tensiunii pe nucleu. (EDIT: Într-un întrebări și răspunsuri, Qualcomm a confirmat că nucleul Prime își împărtășește domeniul de putere cu clusterul de performanță, limitând utilitatea descrisă aici). A76 se potrivește deosebit de bine pentru un astfel de nucleu premium singur, cu propriul ceas, având în vedere că împinge limitele atunci când vine vorba de un singur fir. performanță cu 25% mai multe instrucțiuni întregi pe ceas decât A75 și performanță ASIMD și în virgulă mobilă cu 35% mai mare, oferind în același timp cu 90% mai mare lățimea de bandă a memoriei. Pe scurt, A76 prezintă o creștere generațională mai mare decât generațiile anterioare, ceea ce, fără îndoială, a contribuit și la Qualcomm. creșterea performanței de la an la an mai mare decât de obicei pentru Snapdragon 855 (pentru referință, Qualcomm a citat o creștere de la 25 la 30% pentru 845 peste cel 835). Acest lucru ar putea fi suficient pentru a pune performanța rezultată a Qualcomm Snapdragon 855 înaintea nucleului Mongoose 3 (M3) de la Samsung LSI găsit în Exynos 9810, deși acel design special a suferit din cauza eficienței energetice într-un mod în care cipurile Qualcomm nu au și că cel mai probabil Snapdragon 855 nu o va face. fie.
Ce înseamnă pentru utilizatorul final? Desigur, ar trebui să ne așteptăm la creșterea nucleelor de referință — ARM proiectează scoruri Geekbench cu 28% mai mari pentru mobil și performanță Javascript îmbunătățită cu 35%. Dincolo de valorile de referință, care ar putea avea o legătură mică cu experiența utilizatorului final, A76 continuă concentrarea lui A75 asupra performanță susținută, ceea ce înseamnă că utilizatorii ar trebui să se aștepte la mai puține accelerații în timpul sesiunilor prelungite de joc. Trecerea la 7nm combinată cu noul design de bază va avea ca rezultat cu siguranță o baterie vizibilă îmbunătățiri de viață pentru utilizatorii finali și aceasta este poate cea mai atrăgătoare caracteristică a acestui set de upgrade-uri. Noul nucleu „Prime” este, de asemenea, interesant, având în vedere că un nucleu singur care se concentrează pe performanță de top cu un singur thread ar putea se dovedesc benefice pe parcursul aplicațiilor și proceselor care nu sunt configurate pentru a profita în mod corespunzător multi-threading. Desigur, procesul de fabricație de 7 nm afectează și mai mult alte blocuri ale Snapdragon 855, asigurând aceleași economii de energie. la alte unități de calcul care sunt, de asemenea, implicate în experiența de zi cu zi a utilizatorului, cum ar fi procesarea imaginilor pentru fotografia de smartphone.
„Snapdragon Elite Gaming Experience” și GPU Adreno 640
Qualcomm Snapdragon 855 se concentrează în mare măsură pe jocuri de data aceasta, o întorsătură deloc surprinzătoare a evenimentelor, având în vedere popularitatea titlurilor. precum Fortnite și PlayerUnknown’s Battlegrounds, precum și popularitatea tot mai mare a eSporturilor mobile (da, acesta este un lucru) în Asia. Conform cifrelor prezentate de Qualcomm din Raportul Newzoo 2017 Global Games Market, jocurile mobile au o tendință de creștere, cu un venit total estimat pentru 2018 de 70,3 miliarde de dolari, reprezentând 51% din toate veniturile din jocuri, datorită unei creșteri de 25,5% de la an la an.
Adreno 640 GPU aduce un aspect sănătos Creștere cu 20% a performanței grafice, adăugând în continuare avantajul Qualcomm față de competiția în acest domeniu special. Pentru referință, totuși, Snapdragon 845 a adus o creștere de 30% față de Snapdragon 835, care a oferit, de asemenea, o îmbunătățire cu 30% față de Snapdragon 821. Totuși, acest lucru ar trebui să mențină Qualcomm în fruntea performanței grafice și, cel mai important, performanța pe watt dacă reușesc să se îmbunătățească și pe acest front. Dincolo de această cifră, Qualcomm este la fel de secretos ca întotdeauna când vine vorba de Adreno: am auzit despre sistemul integrat. micro-controler pentru gestionarea energiei și modul în care 640 are cea mai mică supraîncărcare a driverului, deși compania a menționat că includerea de Cu 50% mai multe unități logice aritmetice (ALU) care ar accelera și mai mult performanța AI.
Un lucru despre care Qualcomm a petrecut mult timp vorbind în cadrul briefing-urilor este dorința lor de a aduce „redarea bazată pe fizic” (PBR) pentru mai multe experiențe de jocuri mobile. PBR este un model de umbrire care permite randarea grafică realistă, modelând cu acuratețe fluxul de lumină în conformitate cu materialul reprezentat în texturi sau teselarea suprafeței. Acest lucru permite ca obiectele din joc să imite în mod corespunzător proprietățile vizuale ale materialelor din lumea reală, inclusiv redarea corectă a micro-suprafețelor, cum ar fi abraziunile și luminile speculare. Cele mai vizibile îmbunătățiri, totuși, vin în modul în care permite o reprezentare mai precisă a reflectivității și a luciului tuturor suprafețelor, chiar și a celor din materiale plate și opace (simulate).
Qualcomm și dezvoltatorii din spatele popularului Unity Engine au lucrat pentru a face PBR mai accesibil. dar compania lucrează și cu alți dezvoltatori de motoare și jocuri în optimizarea jocurilor mobile pentru Snapdragon dispozitive. Motoarele de jocuri precum Unity, Unreal, Messiah și NeoX sunt deja optimizate pentru dispozitivele Snapdragon, de exemplu, iar Snapdragon 855 acceptă cele mai recente API-uri grafice, cum ar fi noul Vulkan 1.1. Studiouri precum NetMarble, care se află în spatele Lineage II: Revolutions, au lucrat și cu Qualcomm în trecut pentru a prezenta cât mai bine punctele forte ale platformei Snapdragon. Mai mult, cu Snapdragon 675, am văzut discuții despre un algoritm personalizat care a realizat până la Cu 90% mai puține bătăi în comparație cu aceeași platformă fără optimizări, și aceleași modificări și-au făcut drum spre Snapdragon 855. Încă nu este clar ce implică aceste optimizări și nu ne așteptăm să fie aplicabile fiecare joc, dar cu siguranță va însemna performanțe mai bune, cel puțin, în titlurile mai mari Android.
Pe lângă toate acestea, în timp ce Snapdragon 835 și 845 au permis redarea și capturarea (respectiv) de Video HDR pe 10 biți, Qualcomm Snapdragon 855 va fi primul chipset mobil care permite jocuri HDR adevărate. Acest lucru va necesita afișaje cu adevărat HDR, care, din fericire, sunt din ce în ce mai frecvente printre smartphone-urile emblematice. Din acest motiv, utilizatorii se pot aștepta la culori mai bogate, cu mai multă profunzime tonală, o gamă dinamică mai mare (după cum este sugerat de nume) și un contrast îmbunătățit. Aceasta nu este neapărat o caracteristică obligatorie, dar este cu siguranță plăcut să fi dat acel joc HDR actual. configurațiile necesită televizoare și monitoare scumpe gata pentru HDR, precum și computere capabile și jocuri specifice console. Cu Qualcomm Snapdragon 855, HDR în jocuri va fi, fără îndoială, mai accesibil și mai convenabil (fără comenzile ecranului tactil, desigur).
Un nou Hexagon 690 DSP pentru sarcinile de lucru AI
Deși compania nu o numește în mod explicit „unitate de procesare neuronală” în materialele sale de marketing, încărcăturile de lucru AI vor beneficia și de noul și îmbunătățit Hexagon 690 DSP. Qualcomm a introdus în liniște aceste co-procesoare cu multe generații în urmă (odată cu introducerea corectă a QDSP6 v6 alături de 820), dar abia de curând au început să le prezinte ca unele dintre cele mai bune blocuri SoC pentru AI. Proiectată inițial pentru accelerarea sarcinilor de lucru pentru imagini, arhitectura DSP-ului, în special prin includerea Hexagon Vector eXtensions (HVX), a devenit o potrivire excelentă pentru sarcinile ML. DSP-ul este mai programabil decât hardware-ul cu funcție fixă, păstrând totuși o parte din performanță și beneficii de eficiență care caracterizează blocurile de procesor specifice aplicației, accelerând foarte mult scalari și vectoriali operațiuni. Acest lucru s-a dovedit excelent pentru algoritmii de procesare a imaginilor în continuă schimbare, care pot fi descărcați în DSP, dar și se pretează în mod natural la sarcinile de lucru AI. Hexagon DSP a fost un avantaj pentru învățarea automată pe dispozitive de vârf datorită excelentului său multi-threading la nivel hardware și calculului paralel, capabil să gestioneze mii de biți de unități vectoriale pe ciclu de procesare, în comparație cu sutele de biți ai unui nucleu CPU mediu pe ciclu și deservirea de descărcare multiplă sesiuni.
Hexagon DSP este deosebit de potrivit pentru sarcinile de imagistică, deoarece poate transmite date direct de la senzorul de imagine către memoria locală a DSP-ului (L2 Cache), ocolind controlerul de memorie DDR al dispozitivului. Google, de exemplu, a folosit procesarea imaginii Hexagon DSP pentru a alimenta algoritmii HDR+ ai Pixel și Pixel 2, înainte de a-și introduce propriii lor. Pixel Visual Core. De asemenea, dispozitivele gata pentru Hexagon văd cele mai bune rezultate din porturile populare Google Camera, pe care le puteți explora Aici. A fost folosit în sarcinile de lucru în realitate virtuală și augmentată, alimentând faimosul acum-defunct Proiectul Tango pe Lenovo Phab 2 Pro și ASUS ZenFone AR. Acestea fiind spuse, majoritatea OEM-urilor care implementează dispozitive emblematice Snapdragon utilizează Hexagon DSP pentru procesarea imaginilor într-un fel sau altul, pe care îl puteți verifica folosind instrumente precum Snapdragon Profiler.
Deci, ce este nou cu noul DSP? Hexagon 690 a dublat numărul de acceleratoare vectoriale (HVX) de la două la patru pentru a funcționa în tandem cu cele patru fire scalare, care înregistrează și o performanță îmbunătățită cu 20%. Pe deasupra, Hexagon 690 aduce primul accelerator tensor pentru mobil cu Hexagon Tensor Accelerator (HTA). Acesta este un plus semnificativ: servește ca accelerare hardware pentru înmulțirea costisitoare a matricei și integrează, de asemenea, funcții de non-liniaritate (cum ar fi sigmoid și ReLU) la nivel hardware, accelerând și mai mult deducere. Aceste modificări ale DSP ar trebui să se traducă în performanță mai bună a asistentului vocal, de la detectarea cuvintelor fierbinți până la analizarea comenzilor de pe dispozitiv, oferind o anulare îmbunătățită a ecoului și suprimare a zgomotului, de exemplu. Qualcomm subliniază faptul că oferă o platformă completă de calcul eterogenă, care permite încărcarea de lucru AI să se folosească fie CPU, GPU sau DSP, fie orice combinație a celor trei blocuri -- în cuvintele lui Gary Brotman de la Qualcomm, aceasta este „mai mult de un nucleu, este mai mult decât hardware, este un sistem complet”. „Qualcomm AI Engine” de a patra generație a acestora depășește și hardware-ul, deoarece găsim și suport pentru SDK-ul Snapdragon Neural Processing și Hexagon NN pentru a accesa blocurile menționate mai sus, precum și API-ul Android NN și cadrele ML populare, cum ar fi Caffe/Caffe 2, TensorFlow/Lite și ONNX (Open Neural Network) Schimb valutar). În total, Snapdragon 855 poate oferi de trei ori mai mare decât performanța IA brută a predecesorului său (și de două ori în comparație cu Huawei), depășind 7 trilioane de operațiuni pe secundă (TOP). Rețineți, totuși, că Qualcomm continuă să se concentreze pe o soluție de calcul eterogenă, în loc să se concentreze pe un singur bloc dedicat.
Pentru a afla mai multe despre Hexagon DSP, consultați piesa de anul trecut detaliază cum ajută la sarcinile de lucru AI.
În rezumat, pachetul de calcul al lui Snapdragon 855 aduce unele dintre îmbunătățirile mai impactante de la an la an pe care le-am văzut în ultimii ani. Spectra 380 ISP-CV, pe care am tratat-o într-un articol separat, aduce, de asemenea, creșteri extraordinare ale performanței și eficienței energetice, permițând noi funcții excelente, cum ar fi înregistrarea video HDR 4K 60FPS cu modul portret sau schimbare de fundal (destul de flexibil!).
După cum se explică în acest articol, aceste progrese și funcții noi ar trebui să se facă simțite în mod tangibil pe parcursul experienței utilizatorului. Așteptăm cu nerăbdare Qualcomm Snapdragon 855 și să-l testăm în profunzime în curând, așa că rămâneți cu ochii pe XDA-Developers pentru cele mai recente știri și analize Snapdragon 855!