Kuidas Qualcomm parandas Snapdragon 855 jõudlust, mängimist ja tehisintellekti

Uus mobiiliplatvorm Qualcomm Snapdragon 855 toob jõudluse, mängude ja tehisintellekti osas suuri täiustusi ning me kirjeldame, kuidas nad seda on teinud.

Qualcommi Snapdragoni tippkohtumisel 2018 teatas ettevõte kuulutas välja oma uusima esmaklassilise lipulaeva kiibistiku: Snapdragon 855 platvormi. See uus toode on enamiku 2019. aasta viljakate lipulaevade keskmes, tuues kaasa Snapdragon X50 modemi kaudu uskumatu andmeedastuskiiruse. Lisaks sellele toob Snapdragon 855 igasse kiibil asuvasse süsteemiplokki hulga täiustusi, mõnes arvutusüksuses on viimaste aastatega võrreldes viimase aasta suurim jõudlus ja energiatõhususe paranemine ajalugu.

Oleme juba üksikasjalikult kirjeldanud Spectra 380 ISP-CV-dnäiteks, mis parandab veelgi nutitelefonide pildistamist, säästes samal ajal ka akut. Kuigi oleme järjest rohkem tähelepanu pööranud väliskomponentidele, nagu Hexagon DSP, maksavad entusiastid kõige rohkem põhiplokke. tähelepanu – nimelt CPU-le ja GPU-le – on ka arhitektuursete täiustuste ja uuele protsessile üleminekuga märgata rohkem kui tagasihoidlikku kasu. sõlm. Selles artiklis võtame kiiresti kokku, mis on uut ja teadaolevat Snapdragon 855 protsessori, GPU ja DSP kohta ning kuidas täiustused ja uued funktsioonid võivad seda mõjutada.

sinu kasutajakogemus 2019. aastal.


A76-põhine Kryo 485 protsessor ja üleminek 7nm-le

Snapdragon 855 läheb üle TSMC uusimale 7nm FinFET tootmisprotsessile. Tavaliselt näeme sõlme revisjoni iga aasta või kahe järel koos suuruste vähendamise või optimeerimisega tsükli keskel (nt üleminek madala võimsusega varakult). (LPE) väärtusele "Low-Power Plus" (LPP) Samsung-LSI sõlmedes), nii et olete tõenäoliselt nendest mõõdikutest mõnes või teises uudises kuulnud. artiklit. Aga mida see tähendab? Selles kontekstis kirjeldab see protsessori transistori funktsioonide suurust, mis omakorda annab meile vihje, milliseid transistori tiheduse täiustusi võime oodata iga uue põlvkonna puhul. Kui pindalaühiku kohta on rohkem transistore, saab protsessori jõudlust suurendada. See funktsioon on oluline ka seetõttu, et väiksemad protsessisõlmed võimaldavad protsessori kujundusi rakendada väiksemas mahus, mis on intuitiivselt vähendab protsessori elementide vahelist ruumi, lühendades omakorda vahemaad, mille elektronid peavad selle saavutamiseks läbima arvutus. See parandab jõudlust ja väiksematel protsessidel on ka väiksem mahtuvus, mis tähendab, et transistorid võivad sisse ja välja lülituda väiksema latentsusajaga ja väiksema energiaga. TSMC väidab, et üleminek nende 7 nm protsessile saavutab jõudlus ja energiatõhusus vastavalt 20% ja 40%., kuigi seda võrreldakse TSMC enda 10 nm FinFET protsessiga.

Viimaste Snapdragoni lipulaevade kiibikomplektide puhul oleme näinud Qualcommi koostööd Samsungiga ja rakendamas nende 14 nm ja 10 nm LPP/LPE protsessi. Üleminek TSMC 7 nm Snapdragon 855 jaoks ei ole aga ootamatu, arvestades, et Samsungi 7 nm protsess oli alustas just oktoobris masstootmist, kuigi sel ajal teatati, et sellele ehitatakse 5G Qualcommi kiibistik. Lisaks on Samsungi 7LPP disain valmistatud täiustatud litograafiatehnikas, mida nimetatakse äärmuslikuks ultraviolett-litograafiaks (EUVL). vähendades pindala 40% võrdse disaini keerukuse juures, 20% suurema kiirusega või 50% väiksema energiatarbimisega võrreldes 10nm FinFET-iga eelkäijad. Iga uut hüpet väiksematele protsessisõlmedele tähistatakse just seetõttu, et neid on nii raske saavutada. Näiteks kui transistorid muutuvad väiksemaks, võivad need näidata suuremat "leket" või voolu, mis voolab läbi "väljas" olevate transistoride, suurendades staatilist energiatarbimist jõudeolekus. Ja kuigi väiksemad kiibid tihedama transistoride arvuga võivad võimaldada antud räniplaadist maksimumi võtta, kipub tootlus olema väiksem eelnimetatud lekke tõttu, pluss raskused nende (kõrgel) viiteväärtusel töötavate "kõrgema binned" protsessorite hankimisel sagedused. Need on lihtsalt mõned paljudest arendustakistustest, mis on loomulikult kõrvaldatud selleks ajaks, kui uus protsessisõlm jõuab masstootmisse, kuid Lühidalt öeldes on palju uurimis- ja arendustegevuse ning tootmisega seotud väljakutseid, mis suurendavad protsessi uue suuruse toomise kulusid turul.

Uusim ARM A76 arhitektuur, mis on litsentsitud Kryo 485 jaoks, on veel üks suurepärane panus Qualcomm Snapdragon 855 iga-aastastesse olulistesse täiustustesse. A76 tuum on ARM-i Austini kontorite täiesti uus, tühi kujundus, millel on uus nullist üles ehitatud mikroarhitektuur, et pakkuda ARM-i poolt „sülearvutiklassi jõudlust mobiilne tõhusus. aken. See uus disain pakub mõningaid tohutuid jõudluse täiustusi võrreldes A75-ga, millel põhinesid Snapdragon 845 kuldsed tuumad: see lubab 35% jõudluse paranemine ja 40% parem energiatõhusus. Kui võrrelda 10 nm protsessiga A75 ja 7 nm protsessiga A76 sama võimsusega 750 mW/tuuma kohta, jõudluse eelis kasvab 40%-ni uue südamiku kasuks ja energiasääst võib samuti tõusta kuni 50%. Veelgi enam, muud täiustused asümmeetriliste ühekäsuliste mitmeandmete (ASIMD) torujuhtmetes ja dot-product juhised masinõppeülesannete toimivuse täiustused kokku ~3,9 korda, nagu järeldused konvolutsioonilistes närvivõrkudes. Kõik see tähendab valdkonnas juhtivat jõudlust ja suurepärase täiendusena uuele 7 nm protsessile, kuna Qualcommi 2,84 GHz "peatuum" hiilib 3 GHz võrdlustakti kiirustele ARM lähedale. oli kasutanud uue tuuma üksikasjalikult kirjeldamisel. Kokkuvõttes, Qualcomm lubab täiesti tohutut 45% protsessori jõudluse paranemist üle 845, mis on seni suurim aastane tõus.

Rääkides Snapdragon 855 "peamisest tuumast", pole ka üllatav näha, et Qualcomm liigub selle uue klastri seadistusega, võttes arvesse suuri täiustusi. LITTLE on ARM-i poolt lubatud DynamIQ tehnoloogiaplatvormid. Sisuliselt võimaldab DynamIQ mitmetuumalise protsessori disainis suuremat paindlikkust ja mastaapsust, võimaldades antud klastris kasutada mitut tuuma, aga ka peeneteralist pinge juhtimist tuuma kohta. (EDIT: Q&A-s kinnitas Qualcomm, et Prime'i tuum jagab oma toitedomeeni jõudlusklastriga, piirates siin kirjeldatud utiliiti). A76 sobib eriti hästi sellisele üksikule premium-tuumale, millel on oma kell, arvestades, et see surub ühe niidi puhul ümbrikusse. jõudlus 25% rohkema täisarvuga juhiseid kella kohta kui A75 ja 35% suurem ASIMD ja ujukoma jõudlus, pakkudes samas 90% paremat jõudlust mälu ribalaius. Lühidalt öeldes on A76 suurem põlvkondade tõusuteel kui eelmised põlvkonnad, mis kahtlemata aitas kaasa ka Qualcommi Snapdragon 855 tavapärasest suurem jõudlus aastaga võrreldes (viide, Qualcomm tõi 845 üle 25–30% tõusu 835). Sellest võib piisata, et tõsta Qualcomm Snapdragon 855 tulemuslikkus võrreldes Exynos 9810-s leiduva Samsung LSI Mongoose 3 (M3) tuumaga ette. kuigi see konkreetne disain kannatas energiatõhususe tõttu, mida Qualcommi kiibid ei ole, ja Snapdragon 855 tõenäoliselt mitte. kas.

Mida see lõppkasutaja jaoks tähendab? Loomulikult peaksime ootama suuremaid võrdlustuumasid – ARM prognoosib mobiili jaoks 28% kõrgemaid Geekbenchi skoori ja 35% paremat Javascripti jõudlust. Lisaks võrdlusnäitajatele, millel võib olla vähe seost lõppkasutaja kogemusega, jätkab A76 A75 keskendumist püsiv jõudlus, mis tähendab, et pikaajaliste mängusessioonide ajal peaksid kasutajad ootama väiksemat kiirust. Üleminek 7nm-le koos uue südamiku disainiga annab kindlasti tulemuseks märgatava aku lõppkasutajate eluea täiustused ja see on võib-olla selle komplekti kõige köitvam funktsioon uuendused. Uus "Prime" tuum on samuti huvitav, arvestades, et üksildane tuum, mis keskendub parimale ühelõimelisele jõudlusele osutuvad kasulikuks kõigis rakendustes ja protsessides, mis ei ole seadistatud selleks, et neid õigesti ära kasutada mitme keermega. Muidugi mõjutab 7 nm tootmisprotsess täiendavalt ka teisi Snapdragon 855 plokke, säästes sama energiat teistele arvutusüksustele, mis on samuti seotud igapäevase kasutajakogemusega, näiteks nutitelefonide pildistamise pilditöötlusega.


"Snapdragon Elite Gaming Experience" ja Adreno 640 GPU

Qualcomm Snapdragon 855 keskendub seekord suuresti mängimisele, mis on pealkirjade populaarsust arvestades üllatav sündmuste pööre nagu Fortnite ja PlayerUnknown’s Battlegrounds, samuti mobiilse e-spordi kasvav populaarsus (jah, see on asi) Aasias. Vastavalt arvudele, mida Qualcomm on näidanud Newzoo 2017. aasta ülemaailmse mängude turu aruanne, on mobiilimängud kasvamas ning 2018. aasta eeldatav kogutulu on 70,3 miljardit dollarit, mis moodustab 51% kogu hasartmängutulust tänu 25,5% kasvule aastatagusega võrreldes.

Adreno 640 GPU toob terve 20% tõuge graafika jõudlusele, suurendades veelgi Qualcommi edumaa konkurentsi ees selles konkreetses valdkonnas. Võrreldes Snapdragon 835-ga tõi Snapdragon 845 siiski 30% tõusu, mis ise pakkus ka Snapdragon 821-ga võrreldes 30% paranemist. Sellegipoolest peaks see hoidma Qualcommi graafika jõudluses eesotsas ja, mis kõige tähtsam, jõudluses vati kohta, kui neil õnnestub ka seda parandada. Lisaks sellele on Qualcomm Adreno osas sama salajane kui kunagi varem: kuulsime integreeritud mikrokontroller toitehalduseks ja kuidas 640-l on madalaim draiverikulu, kuigi ettevõte mainis kaasamine 50% rohkem aritmeetilisi loogikaühikuid (ALU-d), mis kiirendaks veelgi AI jõudlust.

Üks asi, millest Qualcomm briifingutel palju aega rääkis, on nende soov tuua "füüsiliselt põhinev renderdus" (PBR) mobiilsemate mängukogemuste juurde. PBR on varjutusmudel, mis võimaldab realistlikku graafika renderdamist, modelleerides täpselt valgusvoogu vastavalt tekstuurides või pinna tessellatsioonis esitatud materjalile. See võimaldab mängusisestel objektidel jäljendada õigesti reaalsete materjalide visuaalseid omadusi, sealhulgas mikropindade (nt marrastused ja silmatorkavad esiletõstmised) õiget renderdamist. Kõige märgatavamad täiustused on aga selles, kuidas see võimaldab täpsemalt kujutada kõigi pindade, isegi lamedate ja läbipaistmatute (simuleeritud) materjalide peegelduvust ja läiget.

Qualcomm ja populaarse Unity Engine'i arendajad on töötanud selle nimel, et muuta PBR kättesaadavamaks, kuid ettevõte teeb Snapdragonile mobiilimängude optimeerimisel koostööd ka teiste mootori- ja mänguarendajatega seadmeid. Mängumootorid nagu Unity, Unreal, Messiah ja NeoX on juba optimeeritud näiteks Snapdragoni seadmete jaoks ning Snapdragon 855 toetab uusimaid graafika API-sid, nagu uus. Vulkan 1.1. Sellised stuudiod nagu NetMarble, kes on Lineage II: Revolutionsi taga, on ka varem Qualcommiga koostööd teinud, et Snapdragoni platvormi tugevusi kõige paremini näidata. Lisaks koos Snapdragon 675, nägime juttu kohandatud algoritmist, mis saavutas kuni 90% vähem jankleid Võrreldes sama platvormiga ilma optimeerimiseta ja samad muudatused on jõudnud ka Snapdragon 855-sse. Siiani pole selge, mida need optimeerimised endaga kaasa toovad, ja me ei eelda, et need oleksid rakendatavad igas mängus, kuid see tähendab kindlasti paremat sooritust vähemalt suuremates tiitlites Android.

Lisaks sellele võimaldasid Snapdragon 835 ja 845 taasesitada ja jäädvustada (vastavalt) 10-bitine tõeline HDR-video, Qualcomm Snapdragon 855 on esimene mobiilne kiibistik, mis võimaldab tõeline HDR-mäng. Selleks on vaja tõelisi HDR-võimelisi ekraane, mis on lipulaevade nutitelefonide seas õnneks üha tavalisemad. Seetõttu võivad kasutajad oodata rikkalikumaid värve suurema toonisügavuse, suurema dünaamilise ulatuse (nagu viitab nimi) ja parema kontrasti. See ei ole tingimata kohustuslik funktsioon, kuid kindlasti on tore, et see praegune HDR-mäng Seadistused nõuavad kalleid HDR-valmidusega telereid ja monitore, samuti võimekaid arvuteid ja spetsiifilisi mänge konsoolid. Qualcomm Snapdragon 855 abil on HDR mängude puhul vaieldamatult juurdepääsetavam ja mugavam (muidugi ilma puuteekraani juhtnuppudeta).


Uus Hexagon 690 DSP AI töökoormuste jaoks

Kuigi ettevõte ei nimeta seda oma turundusmaterjalides selgelt "närvitöötlusüksuseks", saavad AI töökoormused kasu ka uuest ja täiustatud Hexagon 690 DSP-st. Qualcomm tutvustas vaikselt neid kaasprotsessoreid mitu põlvkonda tagasi (koos QDSP6 v6 õige kasutuselevõtuga kõrvuti 820-ga), kuid alles hiljuti hakati neid tutvustama mõne parema SoC-plokina AI. DSP arhitektuur, mis oli algselt loodud kujutise töökoormuse kiirendamiseks, sobis eriti Hexagon Vector eXtensions (HVX) lisamisega ML-ülesannete jaoks. DSP on rohkem programmeeritav kui fikseeritud funktsiooniga riistvara, säilitades samas osa jõudlusest ja tõhususe eelised, mis iseloomustavad rakendusespetsiifilisi protsessoriplokke, kiirendades oluliselt skalaari ja vektorit operatsioonid. See osutus suurepäraseks pidevalt muutuvate pilditöötlusalgoritmide jaoks, mida saab DSP-le maha laadida, kuid loomulikult sobib see ka AI töökoormusega. Hexagon DSP on olnud a õnnistus masinõppe jaoks servaseadmetel tänu suurepärasele riistvaratasemel mitmelõimelisusele ja paralleelsele andmetöötlusele, mis on võimeline käsitlema tuhandeid bitte vektorühikuid töötlemistsükli kohta, võrreldes keskmise protsessori tuuma sadade bittide arvuga tsükli kohta ja mitmekordse mahalaadimise teenindamine istungid.

Kuusnurkne DSP sobib eriti hästi pildistamisülesannete jaoks, kuna see suudab voogesitada andmeid otse pildiandurilt DSP kohalikku mällu (L2 vahemälu), jättes mööda seadme DDR-mälukontrollerist. Näiteks Google kasutas Pixeli ja Pixel 2 HDR+ algoritmide toiteks Hexagon DSP pilditöötlust, enne kui omaenda tutvustas. Pixel Visual Core. See on ka kuusnurk-valmidusega seadmed, mis näevad parimaid tulemusi populaarsetest Google'i kaamera portidest, mida saate uurida siin. Seda on kasutatud virtuaalse ja liitreaalsuse töökoormustes, mis annab suurepärase toite nüüdseks kadunud Projekt Tango kohta Lenovo Phab 2 Pro ja ASUS ZenFone AR. Sellegipoolest kasutavad enamik Snapdragoni lipulaevaseadmeid rakendavaid originaalseadmete tootjaid ühel või teisel viisil pilditöötluseks Hexagon DSP-d, mida saate kontrollida selliste tööriistade abil nagu Snapdragon Profiler.

Mis siis uues DSP-s uut on? Hexagon 690 kahekordistas vektorkiirendite (HVX) arvu kahelt neljale, et töötada koos nelja skalaarse keermega, mille jõudlus paranes samuti 20%. Lisaks toob Hexagon 690 esimese mobiili jaoks mõeldud tensorkiirendi koos Kuusnurkne tensorikiirendi (HTA). See on märkimisväärne lisand: see toimib riistvaralise kiirendusena kalli maatriksi korrutamise jaoks ja integreerib ka mittelineaarsusfunktsioone (nagu sigmoid ja ReLU) riistvara tasemel, kiirendades veelgi järeldus. Need DSP muudatused peaksid väljenduma parem hääleassistendi jõudlus, alates kuumade sõnade tuvastamisest kuni seadmesiseste käskude sõelumiseni, pakkudes näiteks täiustatud kajasummutust ja mürasummutust. Qualcomm rõhutab, et need pakuvad täielikku heterogeenset arvutusplatvormi, mis võimaldab AI töökoormust kasutada kas CPU, GPU või DSP või mis tahes kombinatsioon kolmest plokist – Qualcommi Gary Brotmani sõnadega, see see on "rohkem kui üks tuum, see on rohkem kui riistvara, see on terviklik süsteem". Nende neljanda põlvkonna "Qualcomm AI Engine" ulatub ka riistvarast kaugemale, kuna leiame juurdepääsu saamiseks ka Snapdragon Neural Processing SDK ja Hexagon NN eelnimetatud plokid, aga ka Android NN API ja populaarsed ML raamistikud nagu Caffe/Caffe 2, TensorFlow/Lite ja ONNX (Open Neural Network) Vahetada). Kokkuvõttes suudab Snapdragon 855 pakkuda kolm korda toores tehisintellekti jõudlust oma eelkäijast (ja võrreldes Huaweiga kaks korda), ületades 7 triljonit toimingut sekundis (TOP). Pidage siiski meeles, et Qualcomm keskendub jätkuvalt heterogeensele andmetöötluslahendusele, mitte keskendub ühele spetsiaalsele plokile.

Hexagon DSP kohta lisateabe saamiseks vaadake eelmise aasta tükk üksikasjalikult, kuidas see aitab AI töökoormust.


Kokkuvõtlikult võib öelda, et Snapdragon 855 arvutuspakett toob kaasa mõned mõjukamad täiustused, mida oleme viimastel aastatel näinud. Spectra 380 ISP-CV, mida käsitlesime eraldi artiklis, suurendab ka jõudlust ja energiatõhusust tohutult, võimaldades suurepäraseid uusi funktsioone, nagu 4K 60 kaadrit sekundis HDR-videosalvestus koos portreerežiim või taustavahetus (üsna paindlik!).

Nagu selles artiklis selgitatud, peaksid need edusammud ja uued funktsioonid kogu kasutajakogemuse jooksul käegakatsutavalt tunda andma. Ootame pikisilmi Qualcomm Snapdragon 855 ja saame seda peagi põhjalikult testida, nii et olge kursis XDA-Developersiga, et saada uusimaid Snapdragon 855 uudiseid ja analüüse!