Hvordan Qualcomm forbedrede ydeevne, spil og kunstig intelligens på Snapdragon 855

click fraud protection

Den nye Qualcomm Snapdragon 855 mobilplatform bringer store forbedringer med hensyn til ydeevne, spil og kunstig intelligens, og vi opdeler, hvordan de har gjort det.

På Qualcomms Snapdragon Summit 2018, virksomheden annoncerede deres nyeste premium-tier flagskibschipsæt: Snapdragon 855-platformen. Dette nye produkt vil være kernen i de fleste af 2019's produktive flagskibe, hvilket bringer løftet om utrolige datahastigheder med Snapdragon X50-modemet. Ud over det bringer Snapdragon 855 dog en række forbedringer til hver system-på-chip-blok, med nogle computerenheder har oplevet de største år-til-år forbedringer af ydeevne og strømeffektivitet i det seneste historie.

Vi har allerede beskrevet Spectra 380 ISP-CV, for eksempel, som yderligere forbedrer smartphone-fotografering og samtidig giver brugerne sunde batteribesparelser. Mens vi i stigende grad har været opmærksomme på perifere komponenter som Hexagon DSP, er de kerneblokke, som entusiaster betaler mest opmærksomhed på - nemlig CPU'en og GPU'en - har også oplevet mere end beskedne gevinster med arkitektoniske forbedringer og overgangen til en ny proces node. I denne artikel vil vi hurtigt opsummere, hvad der er nyt, og hvad der er kendt om Snapdragon 855's CPU, GPU og DSP, og hvordan forbedringerne og de nye funktioner kan påvirke

din brugeroplevelse i 2019.


A76-baseret Kryo 485 CPU og skiftet til 7nm

Snapdragon 855 flytter til TSMCs seneste 7nm FinFET-fremstillingsproces. Vi ser normalt en noderevision hvert eller andet år med nedskæringer eller midtcyklusoptimeringer (såsom flytningen fra "Low-Power Early" (LPE) til "Low-Power Plus" (LPP) i Samsung-LSI noder), så du har sandsynligvis hørt om disse målinger i en eller anden nyhed artikel. Men hvad betyder det? I denne sammenhæng beskriver den størrelsen af ​​processorens transistorens funktioner, som igen viser os, hvilken slags transistortæthedsforbedringer vi kan forvente med hver ny generation. Med flere transistorer pr. arealenhed kan den resulterende ydeevne af processoren skaleres op. Denne funktion er også vigtig, da mindre procesknudepunkter gør det muligt at implementere processordesign i mindre skala, hvilket intuitivt krymper mellemrummet mellem processorens elementer, hvilket igen forkorter den afstand, som elektroner skal rejse for at opnå beregning. Dette giver forbedringer i ydeevnen, og mindre processer har også en lavere kapacitans, hvilket betyder, at transistorer kan tænde og slukke med lavere latenstid og med lavere energi. Til reference hævder TSMC, at overgangen til deres 7nm-proces opnås ydeevne og effekteffektivitet i størrelsesordenen henholdsvis 20 % og 40 %, selvom det er sammenlignet med TSMCs egen 10nm FinFET-proces.

I de sidste par Snapdragon flagskibschipsæt har vi set Qualcomm arbejde med Samsung og implementere deres 14nm og 10nm LPP/LPE-proces. Flytningen til TSMC's 7nm til Snapdragon 855 er dog ikke uventet, da Samsungs 7nm-proces havde er netop gået i masseproduktion i oktober, selvom det på det tidspunkt blev rapporteret, at et 5G Qualcomm-chipsæt ville blive bygget på det. Desuden er Samsungs 7LPP-design fremstillet under en forbedret litografiteknik kendt som ekstrem ultraviolet litografi (EUVL), giver 40 % arealreduktion ved samme designkompleksitet med 20 % hurtigere hastigheder eller 50 % mindre strømforbrug sammenlignet med 10nm FinFET forgængere. Hvert nyt spring til mindre procesknudepunkter fejres, netop fordi de er så svære at opnå. For eksempel, når transistorer bliver mindre, kan de vise større 'lækage' eller strøm, der flyder gennem transistorer, der er 'off', hvilket øger det statiske strømforbrug i inaktive tilstande. Og mens mindre chips med tættere transistorantal kan give mulighed for at få mest muligt ud af en given siliciumwafer, har udbyttet en tendens til at være lavere på grund af den førnævnte lækage, plus vanskeligheder med at skaffe 'højere kasserede' processorer, der kører på deres (høje) reference frekvenser. Disse er bare nogle af de mange udviklingshindringer, der naturligvis er løst, når en ny procesknude rammer masseproduktion, men i kort sagt er der mange F&U- såvel som produktionsudfordringer, der øger omkostningerne ved at bringe en ny processtørrelse til marked.

Den seneste ARM A76-arkitektur licenseret til Kryo 485 er en anden stor bidragyder til de væsentlige år-til-år forbedringer, vi ser med Qualcomm Snapdragon 855. A76-kernen er et helt nyt, blankt skifer-design fra ARMs kontorer i Austin, med en ny mikroarkitektur bygget fra bunden for at levere, hvad ARM kalder "bærbar-klasse ydeevne med mobil effektivitet." Det er stadig et semi-brugerdefineret design, og Qualcomm har foretaget forbedringer såsom optimeret data-forhentning for bedre effektivitet og en større ude-af-ordre eksekvering vindue. Dette nye design tilbyder nogle enorme ydeevneforbedringer i forhold til A75, som Snapdragon 845's Gold-kerner var baseret på: det lover en 35 % ydelsesforbedring og 40 % bedre strømeffektivitet. Når man sammenligner A75 på en 10nm-proces versus A76 på en 7nm-proces med samme effektkonvolut på 750mW/kerne, ydelsesfordelen vokser til 40% til fordel for den nye kerne, og energibesparelser kan også stige til 50 %. Hvad mere er, andre forbedringer i Asymmetric Single Instruction Multiple Data (ASIMD) pipelines og punkt-produkt instruktioner aggregeret til ~3,9x forbedringer i udførelsen af ​​maskinlæringsopgaver, som f.eks. inferens i konvolutionelle neurale netværk. Alt dette svarer til brancheførende ydeevne pr. område og et fantastisk supplement til den nye 7nm-proces, hvor Qualcomms 2,84GHz 'Prime core' kryber tæt på 3GHz-referenceclockhastighederne ARM havde brugt ved detaljering af den nye kerne. Alt i alt, Qualcomm lover en absolut massiv 45% CPU-ydelsesforbedring over 845, den største år-til-år stigning endnu.

Når vi taler om Snapdragon 855's 'Prime core', er det heller ikke overraskende at se Qualcomm flytte ind med denne nye klyngeopsætning givet forbedringerne over store. LITTLE aktiveret af ARM's DynamiIQ teknologiske platforme. DynamIQ giver i bund og grund mulighed for mere fleksibilitet og skalerbarhed i multi-core processordesign, hvilket giver mulighed for flere kernedesigns i en given klynge, samt finkornet spændingsstyring pr. kerne. (EDIT: I en Q&A bekræftede Qualcomm, at Prime-kernen deler sit magtdomæne med præstationsklyngen, hvilket begrænser værktøjet beskrevet her). A76 er en særlig god pasform til sådan en ensom premium-kerne med sit eget ur, da det skubber til konvolutten, når det kommer til enkelttråds ydeevne med 25 % flere heltalsinstruktioner pr. ur end A75 og 35 % højere ASIMD- og flydende komma-ydeevne, mens den tilbyder 90 % højere hukommelsesbåndbredde. Kort sagt præsenterer A76 et større generationsløft end tidligere generationer, hvilket uden tvivl har bidraget til Qualcomms også større end sædvanligt år-til-år ydeevne bump for Snapdragon 855 (til reference citerede Qualcomm 25 til 30% stigning for 845 over 835). Dette kan være nok til at sætte Qualcomm Snapdragon 855's resulterende ydeevne foran Samsung LSI's Mongoose 3 (M3) kerne fundet i Exynos 9810, selvom det særlige design led af strømeffektivitet på en måde, som Qualcomm-chips ikke har, og at Snapdragon 855 højst sandsynligt ikke vil enten.

Hvad betyder det for slutbrugeren? Selvfølgelig skal vi forvente øgede benchmark-kerner - ARM projekterer 28 % højere Geekbench-score til mobil og 35 % forbedret Javascript-ydeevne. Ud over benchmarks, som måske kun har ringe relation til slutbrugeroplevelsen, fortsætter A76 A75's fokus på vedvarende præstation, hvilket betyder, at brugere skal forvente mindre drosling under længere spilsessioner. Skiftet til 7nm kombineret med det nye kernedesign vil helt sikkert resultere i et mærkbart batteri livsforbedringer for slutbrugere, og det er måske den mest tiltalende funktion ved dette sæt opgraderinger. Den nye 'Prime'-kerne er også interessant i betragtning af, at en ensom kerne, der fokuserer på den bedste enkelt-trådede ydeevne, kunne vise sig at være gavnlige i applikationer og processer, der ikke er sat op til at drage den rette fordel af multi-threading. Selvfølgelig påvirker 7nm-fremstillingsprocessen også andre blokke af Snapdragon 855 yderligere, hvilket giver de samme strømbesparelser til andre computerenheder, der også er involveret i den daglige brugeroplevelse, såsom billedbehandling til smartphonefotografering.


'Snapdragon Elite Gaming Experience' og Adreno 640 GPU

Qualcomm Snapdragon 855 fokuserer stærkt på spil denne gang, en ikke overraskende udvikling i betragtning af titlernes popularitet som Fortnite og PlayerUnknown's Battlegrounds samt den stigende popularitet af mobil eSport (ja, det er en ting) i Asien. Ifølge tal vist af Qualcomm fra Newzoo 2017 Global Games Market rapport, er mobilspil på vej op med en forventet samlet omsætning i 2018 på $70,3 milliarder, hvilket udgør 51 % af alle spilindtægter takket være en stigning på 25,5 % fra år til år.

Adreno 640 GPU bringer en sund 20 % boost til grafikydelsen, hvilket yderligere tilføjer Qualcomms førende over konkurrenterne på dette særlige område. Til reference bragte Snapdragon 845 dog en stigning på 30 % i forhold til Snapdragon 835, som også tilbød en 30 % forbedring i forhold til Snapdragon 821. Alligevel burde dette holde Qualcomm foran med grafikydeevne, og vigtigst af alt, ydeevne pr. watt, hvis de også formår at forbedre på den front. Ud over det tal er Qualcomm lige så hemmelighedsfuld som nogensinde, når det kommer til Adreno: vi hørte om den integrerede mikrocontroller til strømstyring, og hvordan 640 har det laveste driveroverhead, selvom virksomheden nævnte inddragelse af 50 % flere aritmetiske logiske enheder (ALU'er), der yderligere vil accelerere AI-ydeevnen.

En ting, Qualcomm brugte meget tid på at tale om på briefinger, er deres ønske om at bringe 'fysisk baseret rendering' (PBR) til flere mobile spiloplevelser. PBR er en skyggemodel, der giver mulighed for realistisk grafikgengivelse, nøjagtig modellering af lysflow i overensstemmelse med materialet repræsenteret i teksturer eller overfladens tesseller. Dette gør det muligt for objekter i spillet korrekt at efterligne de visuelle egenskaber af materialer fra den virkelige verden, inklusive den korrekte gengivelse af mikrooverflader som slid og spejlende højdepunkter. De mest bemærkelsesværdige forbedringer kommer dog i, hvordan det giver en mere nøjagtig skildring af reflektiviteten og glansen af ​​alle overflader, selv dem fra flade og uigennemsigtige (simulerede) materialer.

Qualcomm og udviklerne bag den populære Unity Engine har arbejdet på at gøre PBR mere tilgængelig, men virksomheden arbejder også sammen med andre motor- og spiludviklere om at optimere mobilspil til Snapdragon enheder. Spilmotorer som Unity, Unreal, Messiah og NeoX er allerede optimeret til f.eks. Snapdragon-enheder, og Snapdragon 855 understøtter de nyeste grafik-API'er som f.eks. Vulkan 1.1. Studier som NetMarble, der står bag Lineage II: Revolutions, har også tidligere arbejdet med Qualcomm for bedst muligt at fremvise styrkerne ved Snapdragon-platformen. Desuden med Snapdragon 675, så vi snak om en brugerdefineret algoritme, der nåede op til 90 % færre uheld sammenlignet med den samme platform uden optimeringer, og de samme ændringer har fundet vej til Snapdragon 855. Det er stadig ikke klart, hvad disse optimeringer indebærer, og vi forventer ikke, at de kan anvendes i hvert spil, men det vil helt sikkert betyde bedre ydeevne i, i det mindste, de større titler på Android.

Oven i det hele, mens Snapdragon 835 og 845 tillod afspilning og optagelse (henholdsvis) 10-bit, ægte HDR-video, Qualcomm Snapdragon 855 vil være det første mobile chipsæt, der giver mulighed for ægte HDR-spil. Dette vil kræve ægte HDR-kompatible skærme, som heldigvis er mere og mere almindelige blandt flagskibssmartphones. På grund af dette kan brugere forvente rigere farver med mere tonal dybde, højere dynamisk område (som antydet af navnet) og forbedret kontrast. Dette er ikke nødvendigvis en must-have-funktion, men det er bestemt rart at have givet det aktuelle HDR-spil opsætninger kræver dyre HDR-klare tv'er og skærme samt computere og specifik spil konsoller. Med Qualcomm Snapdragon 855 vil HDR i gaming uden tvivl være mere tilgængelig og praktisk (uden touchscreen-kontrollerne, selvfølgelig).


En ny Hexagon 690 DSP til AI-arbejdsbelastninger

Selvom virksomheden ikke udtrykkeligt kalder det en "neural behandlingsenhed" i sine marketingmaterialer, vil AI-arbejdsbelastninger også drage fordel af den nye og forbedrede Hexagon 690 DSP. Qualcomm introducerede stille og roligt disse co-processorer for mange generationer siden (med den korrekte introduktion af QDSP6 v6 sammen med 820), men det var først for nylig, at de begyndte at pitche dem som nogle af de bedre SoC-blokke til AI. Oprindeligt designet til at accelerere billedbehandlingsbelastninger, blev arkitekturen i DSP'en – især med inklusion af Hexagon Vector eXtensions (HVX) – en perfekt pasform til ML-opgaver. DSP'en er mere programmerbar end hardware med faste funktioner, mens den stadig bevarer noget af ydeevnen og effektivitetsfordele, der karakteriserer applikationsspecifikke processorblokke, hvilket i høj grad accelererer skalar og vektor operationer. Dette viste sig at være fremragende til de stadigt skiftende billedbehandlingsalgoritmer, der kan overføres til DSP'en, men som naturligvis også egner sig til AI-arbejdsbelastninger. Hexagon DSP har været en velsignelse for maskinlæring on edge-enheder på grund af dens fremragende hardware-niveau multi-threading og parallel computing, der er i stand til at håndtere tusindvis af bits vektorenheder pr. behandlingscyklus sammenlignet med en gennemsnitlig CPU-kernes hundredvis af bit pr. cyklus og servicering af flere aflastninger sessioner.

Hexagon DSP er særligt velegnet til billedbehandlingsopgaver, da den kan streame data direkte fra billedsensoren til DSP'ens lokale hukommelse (L2 Cache) og omgå enhedens DDR-hukommelsescontroller. Google brugte for eksempel Hexagon DSP's billedbehandling til at drive Pixel og Pixel 2's HDR+ algoritmer, før de introducerede deres egne Pixel Visual Core. Det er også Hexagon-klare enheder, der ser de bedste resultater fra de populære Google Camera-porte, som du kan udforske her. Det er blevet brugt i virtuelle og augmented reality-arbejdsbelastninger, som er berømt for at drive nu nedlagte Projekt Tango på Lenovo Phab 2 Pro og ASUS ZenFone AR. Når det er sagt, bruger de fleste OEM'er, der implementerer Snapdragon flagskibsenheder, Hexagon DSP til billedbehandling på en eller anden måde, hvilket du kan verificere ved hjælp af værktøjer som f.eks. Snapdragon Profiler.

Så hvad er nyt med den nye DSP? Hexagon 690 fordoblede antallet af vektoracceleratorer (HVX) fra to til fire for at arbejde sammen med de fire skalære tråde, som også ser en forbedret ydeevne på 20 %. Oven i købet bringer Hexagon 690 den første tensoraccelerator til mobil med Hexagon Tensor Accelerator (HTA). Dette er en væsentlig tilføjelse: den tjener som hardwareacceleration til dyr matrixmultiplikation, og integrerer også ikke-linearitetsfunktioner (som sigmoid og ReLU) på hardwareniveau, hvilket øger yderligere slutning. Disse ændringer af DSP bør omsættes til bedre stemmeassistent ydeevne, fra hot-word-detektion til kommandoparsing på enheden, der for eksempel tilbyder forbedret ekko-annullering og støjundertrykkelse. Qualcomm understreger, at de leverer en komplet heterogen computerplatform, der gør det muligt for AI-arbejdsbyrden at udnytte enten CPU, GPU eller DSP eller en hvilken som helst kombination af de tre blokke -- med Qualcomms Gary Brotmans ord, dette det er "mere end én kerne, det er mere end hardware, det er et komplet system". Deres 4. generations "Qualcomm AI Engine" går også ud over hardware, da vi også finder support til Snapdragon Neural Processing SDK og Hexagon NN for at få adgang til de førnævnte blokke, såvel som Android NN API og populære ML-frameworks såsom Caffe/Caffe 2, TensorFlow/Lite og ONNX (Open Neural Network) Udveksle). Samlet set kan Snapdragon 855 tilbyde tre gange den rå AI-ydelse af sin forgænger (og to gange sammenlignet med Huawei), der topper 7 billioner operationer i sekundet (TOP'er). Husk dog, at Qualcomm fortsætter med at fokusere på en heterogen computerløsning frem for at fokusere på en enkelt dedikeret blok.

For at lære mere om Hexagon DSP, tjek sidste års stykke beskriver, hvordan det hjælper med AI-arbejdsbelastninger.


Sammenfattende bringer beregningspakken til Snapdragon 855 nogle af de mere virkningsfulde forbedringer fra år til år, vi har set i de seneste år. Spectra 380 ISP-CV, som vi dækkede i en separat artikel, bringer også enorme løft til ydeevne og strømeffektivitet, hvilket muliggør fremragende nye funktioner som 4K 60FPS HDR-videooptagelse med portrættilstand eller baggrundsbytte (helt fleksibelt!).

Som forklaret i denne artikel bør disse fremskridt og nye funktioner gøre sig håndgribeligt gældende gennem hele brugeroplevelsen. Vi ser frem til Qualcomm Snapdragon 855 og snart at komme til at teste den i dybden, så følg med på XDA-Developers for de seneste Snapdragon 855 nyheder og analyser!