Qualcomm Snapdragon 888-riktmärken: Så här kommer 2021 års flaggskepp 5G-telefoner att prestera

Här är CPU, GPU och AI benchmarkresultat från en Qualcomm Snapdragon 888 referensenhet i tester som Geekbench, AnTuTu och andra.

Tidigare denna månad bjöd Qualcomm in journalister till ett virtuellt Snapdragon Tech Summit där de tillkännagav Snapdragon 888 mobil plattform. Qualcomms senaste 8-serie SoC ger stora förbättringar av bildbehandling och maskininlärning men bara stegvisa förbättringar av CPU- och GPU-prestanda. För att ta reda på hur mycket kraftfullare Qualcomms senaste styrkrets är, får vi vanligtvis möjlighet att köra benchmarks på dess referenshårdvara. På grund av covid-19 kunde Qualcomm dock inte ordna en personlig benchmarking-session, så istället skickade de oss en förinspelad video som visar en Qualcomm Snapdragon 888 referensenhet som kör samma omfång som populära riktmärken.

På referensenheten Snapdragon 888 körde Qualcomm ett holistiskt riktmärke (AnTuTu), ett CPU-centrerat riktmärke (Geekbench), ett GPU-centrerat riktmärke (GFXBench) och flera AI/ML-riktmärken (AIMark, AITuTu, MLPerf och Procyon). Varje benchmark kördes tre gånger, så företaget delade det genomsnittliga resultatet över tre iterationer. Dessutom säger företaget att de körde varje benchmark med standardinställningarna på Snapdragon 888-referensdesignen, vilket betyder att de inte aktiverade något högpresterande läge. Men eftersom benchmarkpoängen gavs till oss kan vi inte verifiera resultaten eller testförhållandena för oss själva. När vi väl har fått tag på en kommersiell enhet med Qualcomm Snapdragon 888 kommer vi att köra dessa riktmärken igen.

Om du är intresserad av att läsa om alla specifikationer och funktioner för Qualcomm Snapdragon 888 mobilplattform, rekommenderar jag att du läser Idrees Patels utmärkta förklarare på Snapdragon 888 publicerades tidigare denna månad. Hans artikel går in i detalj om alla förbättringar som Qualcomm gjort av CPU, GPU, modem, anslutningsundersystem, ISP, AI-motor, DSP och allt annat. För snabb referens har jag satt ihop ett diagram som jämför nyckelspecifikationerna för referensenheten Qualcomm Snapdragon 888 jämfört med de andra två enheterna som används i denna benchmark-jämförelse: Snapdragon 865-driven referensenhet och Snapdragon 855-driven Pixel 4 den där Jag använde i förra årets benchmarking-session. Du kan hitta det diagrammet nedan före benchmarkresultaten.

Qualcomm Snapdragon 888 benchmarkresultat

Testa enheters specifikationer

Qualcomm Snapdragon 855 (Google Pixel 4)

Qualcomm Snapdragon 865 (Qualcomm Referensenhet)

Qualcomm Snapdragon 888 (Qualcomm Referensenhet)

CPU

  • 1x Kryo 485 (ARM Cortex A76-baserad) Prime core @ 2,84GHz, 1x 512KB L2-cache
  • 3x Kryo 485 (ARM Cortex A76-baserad) prestandakärnor @ 2,42GHz, 3x 256KB L2-cache
  • 4x Kryo 385 (ARM Cortex A55-baserad) effektivitetskärnor @ 1,8 GHz, 4x 128KB L2-cache
  • 2MB L3-cache
  • 1x Kryo 585 (ARM Cortex A77-baserad) Prime core @ 2,84GHz, 1x 512KB L2-cache
  • 3x Kryo 585 (ARM Cortex A77-baserad) prestandakärnor @ 2,4GHz, 3x 256KB L2-cache
  • 4x Kryo 385 (ARM Cortex A55-baserad) effektivitetskärnor @ 1,8 GHz, 4x 128KB L2-cache
  • 4MB L3-cache
  • 1x Kryo 680 (ARM Cortex X1-baserad) Prime core @ 2,84GHz, 1x 1MB L2-cache
  • 3x Kryo 680 (ARM Cortex A78-baserad) prestandakärnor @ 2,4GHz, 3x 512KB L2-cache
  • 4x Kryo 680 (ARM Cortex A55-baserad) effektivitetskärnor @ 1,8GHz, 4x 128KB L2-cache
  • 4MB L3-cache

GPU

Adreno 640

Adreno 650

Adreno 660

Visa

  • 2280 x 1080 upplösning
  • 60Hz uppdateringsfrekvens
  • 2880 x 1440 upplösning
  • 60Hz uppdateringsfrekvens
  • 2340 x 1080 upplösning
  • 120Hz uppdateringsfrekvens

AI

  • Hexagon 690 med Hexagon Vector eXtensions och Hexagon Tensor Accelerator
  • 4:e generationens AI-motor
  • 7 TOPPAR
  • Hexagon 698 med Hexagon Vector eXtensions och ny Hexagon Tensor Accelerator
  • 5:e generationens AI-motor
  • Qualcomm Sensing Hub
  • 15 TOPPAR
  • Hexagon 780 med Fused AI Accelerator-arkitektur
  • 6:e generationens AI-motor
  • Qualcomm Sensing Hub (andra generationen)
    • Ny dedikerad AI-processor
    • 80 % uppgiftsminskning avlastning från Hexagon DSP
    • 5X mer processorkraft jämfört med föregående år
  • 16X större delat minne
  • 50 % snabbare skaläraccelerator, 2x snabbare tensoraccelerator år för år
  • 26 TOPPAR

Minne

  • 6 GB LPDDR4
  • 3MB cache på systemnivå
  • 12 GB LPDDR5
  • 3MB cache på systemnivå
  • 12 GB LPDDR5
  • 3MB cache på systemnivå

Lagring

64GB UFS 2.1

128 GB UFS 3.0

512GB UFS 3.0

ISP

  • Dubbel 14-bitars Spectra 380 ISP
  • Dubbel 14-bitars Spectra 480 ISP
  • 2,0 Gigapixel per sekund genomströmning
  • Trippel 14-bitars Spectra 580 ISP
  • 2,7 Gigapixel per sekund genomströmning

Tillverkningsprocess

7nm (TSMC: s N7)

7nm (TSMC: s N7P)

5nm (Samsungs 5LPE)

Mjukvaru-version

Android 10

Android 10

Android 11

Översikt över benchmarks

Med input från Mario Serrafero

  • AnTuTu: Detta är ett holistiskt riktmärke. AnTuTu testar CPU-, GPU- och minnesprestanda, samtidigt som den inkluderar både abstrakta tester och, som på senare tid, relaterbara simuleringar av användarupplevelse (till exempel deltestet som involverar rullning genom en Listvy). Slutpoängen viktas enligt designerns överväganden.
  • GeekBench: Ett CPU-centrerat test som använder flera beräkningsmässiga arbetsbelastningar inklusive kryptering, komprimering (text och bilder), rendering, fysiksimuleringar, datorseende, strålspårning, taligenkänning och konvolutionell neural nätverksslutning på bilder. Poängfördelningen ger specifika mätvärden. Slutpoängen viktas enligt designerns överväganden, med stor tonvikt på heltalsprestanda (65 %), sedan flytande prestanda (30 %) och slutligen krypto (5 %).
  • GFXBench: Syftar till att simulera rendering av videospelsgrafik med de senaste API: erna. Massor av effekter på skärmen och högkvalitativa texturer. Nyare tester använder Vulkan medan äldre tester använder OpenGL ES 3.1. Utgångarna är ramar under test och bildrutor per sekund (det andra talet dividerat med testlängden, i huvudsak), istället för ett viktat Göra.
    • Aztekiska ruiner: Dessa test är de mest beräkningstunga som erbjuds av GFXBench. För närvarande kan de bästa mobila chipset inte upprätthålla 30 bilder per sekund. Specifikt erbjuder testet riktigt hög polygonantal geometri, hårdvara tessellation, högupplösta texturer, global belysning och massor av skuggkartering, rikliga partikeleffekter, såväl som blomning och skärpedjup effekter. De flesta av dessa tekniker kommer att betona processorns skuggberäkningskapacitet.
    • Manhattan ES 3.0/3.1: Det här testet är fortfarande relevant med tanke på att moderna spel redan har nått sin föreslagna grafiska trohet och implementerar samma typer av tekniker. Den har komplex geometri som använder flera renderingsmål, reflektioner (kubiska kartor), mesh-rendering, många fördröjda ljuskällor, såväl som blomning och skärpedjup i ett efterbearbetningspass.
  • MLPerf Mobile: MLPerf Mobile är ett benchmark med öppen källkod för att testa mobil AI-prestanda. Det var skapad av MLCommons, ett icke-vinstdrivande, öppet ingenjörskonsortium, för att "leverera transparens och lika villkor för att jämföra ML-system, programvara och lösningar." MLPerf Mobiles första iteration ger ett riktmärke för slutledningsprestanda för en handfull datorseende och naturligt språk bearbetningsuppgifter. För mer information, se tidningen "MLPerf Mobile Inference Benchmark: Varför Mobile AI Benchmarking är svårt och vad man ska göra åt det."
    • Bildklassificering: Detta test innebär att man drar slutsatsen att en etikett ska appliceras på en ingångsbild. Typiska användningsfall inkluderar fotosökningar eller textextraktion. Referensmodellen som används är MobileNetEdgeTPU med 4M parametrar, datasetet är ImageNet 2012 (224x224), och kvalitetsmålet är 98 % av FP32 (76,19 % Top-1).
    • Bildsegmentering: Detta test involverar partitionering av en ingångsbild i märkta objekt. Typiska användningsfall inkluderar självkörning eller fjärranalys. Referensmodellen som används är DeepLab v3+ med 2M parametrar, datasetet är ADE20K (512x512), och kvalitetsmålet är 93 % av FP32 (0,244 mAP).
    • Objektidentifiering: Detta test innefattar att rita avgränsningsrutor runt objekt samt tillhandahålla en etikett för dessa objekt. Typiska användningsfall involverar kamerainmatning som för att upptäcka faror eller trafikanalys under körning. Referensmodellen är SSD-MobileNet v2 med 17 miljoner parametrar, datauppsättningen är COCO 2017 (300x300), och kvalitetsmålet är 97 % av FP32 (54,8 % mIoU).
    • Språkbehandling: Detta test innebär att svara på frågor i vardagsspråk. Typiska användningsfall inkluderar sökmotorer online. Referensmodellen är MobileBERT med 25 miljoner parametrar, datasetet är mini Squad (Stanford Question Answering Dataset) v1.1 dev, och kvalitetsmålet är 93 % av FP32 (93,98 % F1).

AnTuTu resultat

Från och med AnTuTu kan vi se att referensenheten Qualcomm Snapdragon 888 fick nästan 17 000 poäng högre än Snapdragon 865-referensenheten och nästan 350 000 poäng högre än den Snapdragon 855-drivna Pixel 4. När du tittar på CPU, GPU, Memory och UX subpoäng (visas inte här), kan vi se att de största förbättringarna i prestanda kommer från GPU och minne. Snapdragon 888 QRD fick ungefär 45,56 % högre poäng i AnTuTus GPU-deltest jämfört med Snapdragon 865 QRD. På liknande sätt fick Snapdragon 888 QRD ungefär 52,08 % högre poäng i AnTuTus minnestest jämfört med Snapdragon 865 QRD. Jämfört med den Snapdragon 855-drivna Pixel 4, överträffade 888 QRD den i GPU- och minnesdeltesterna med 98,42 % respektive 117,58 %.

Samtidigt fick Snapdragon 888 QRD ungefär 30,05 % och 90,28 % högre i AnTuTus CPU-deltest jämfört med Snapdragon 865 QRD respektive Snapdragon 855-drivna Pixel 4. UX-underpoängen är svår att jämföra på grund av de olika Android OS-versionerna som varje enhet körde (Pixel 4 och Snapdragon 865 QRD körde Android 10 när jag jämförde dem förra året, medan 888 QRD kör Android 11.)

Den stora ökningen av minnesprestanda är ganska intressant. Både 865 QRD och 888 QRD har 12 GB LPDDR5 RAM-minne, även om vi inte vet vad RAM-minnet är klockat till. Noterbart är att 865 stöder upp till 16GB LPDDR5 RAM vid 2750MHz, medan 888 stöder upp till 16GB LPDDR5 RAM vid 3200MHz. Gupparna i CPU och GPU prestanda här är något över våra förväntningar, eftersom Qualcomm sa att Snapdragon 888:s CPU- och GPU-vinster är 25 % respektive 35 % år på år. De mer CPU- och GPU-centrerade riktmärkena som följer visar dock vinster som är mer i linje med våra förväntningar.

Geekbench-resultat

I Geekbench 5.0 presterar Qualcomm Snapdragon 888 22,17 % och 9,97 % högre i enkelkärniga respektive flerkärniga tester jämfört med Snapdragon 865. Jämfört med Snapdragon 855 presterar 888:an cirka 89,17 % respektive 51,82 % bättre.

Qualcomm säger att Snapdragon 888 ger en 25% ökning av CPU-prestanda jämfört med Snapdragon 865. CPU: ns ensamma ARM Cortex-X1 Prime-kärna är klockad till en konservativ 2,84GHz - samma klockhastighet som den senaste generationens ARM Cortex-A77 Prime core - så det är möjligt att vi kommer att se en 3+GHz klockhastighet för den oundvikliga halvårsskiftet Snapdragon 888 "Plus" uppdatera. Om så är fallet kan vi förvänta oss att CPU-prestandan kommer att förbättras ytterligare, men just nu är det rimligt att säga att vinsterna är solida, men ändå bara inkrementella.

Således, om du uppgraderar från ett två år gammalt flaggskepp, bör 888 ge stora förbättringar i CPU-prestanda. Om du uppgraderar från ett år gammalt flaggskepp är dessa vinster mycket mindre. Jag är personligen glad över att se hur en Snapdragon 888-enhet hanterar konsolemulering.

GFXBench-resultat

Qualcomm har inte avslöjat kärnantalet eller maximal frekvens för Adreno 660 GPU i Snapdragon 888, så vi har lite att säga om GPU: n förutom dess prestandavinster. I GFXBenchs Manhattan-test, som använder OpenGL ES 3.0 API och renderar en 1080p-scen utanför skärmen, hade Snapdragon 888 en genomsnittlig bildhastighet på 169 fps, cirka 34,13 % och 83,7 % högre än bildhastigheterna som uppnås av Snapdragon 865 och 855 respektive. I GFXBenchs Aztec Ruins-test, som använder Vulkan graphics API och återger en 1080p-scen utanför skärmen, hade Snapdragon 888 en genomsnittlig bildhastighet på 86 fps, cirka 38,71 % och 95,45 % högre än bildhastigheterna som uppnås av Snapdragon 865 och 855 respektive.

Det finns inte särskilt många spel som kräver mycket GPU-hästkrafter (den senaste Genshin Impact är ett undantag), men förbättrad GPU-prestanda är användbar för mer än bara spel. Men spel är definitivt den största anledningen till att folk kommer att bry sig om dessa benchmarkresultat, och Snapdragon 888 levererar definitivt med sin 35 % snabbare grafikrendering och 20 % bättre energieffektivitet år på år. Dessa resultat visar dock bara den högsta GPU-prestandan, så vi måste se om det GFXBench – när vi väl fått tag på kommersiell hårdvara – för att kunna köra benchmarks långsiktiga prestationstester.

MLPerf-resultat

De kanske mest intressanta vinsterna är AI-prestanda. Qualcomm gör i allmänhet stora steg i AI-prestanda varje år, men årets vinster är de mest imponerande. Snapdragon 888:s AI-motor har 26 TOPS-prestanda, en ökning från 15 TOPS-prestanda för Snapdragon 865 och 7 TOPS-prestanda för Snapdragon 855. Qualcomm tillskriver mycket av denna vinst till den nya fusionerade AI-acceleratorarkitekturen i Hexagon 780 DSP, som smälter samman skalär-, vektor- och tensoracceleratorer för att eliminera fysiska avstånd och poolminne för att dela och flytta data effektivt.

Det är dock svårt för oss att visa hur betydande detta språng i prestanda faktiskt är. Vi har pratat ingående om svårigheterna med AI-benchmarking under våra intervjuer med Qualcomms Travis Lanier, Gary Brotman och Ziad Asghar. Den goda nyheten är att sedan våra diskussioner med Qualcomm-chefer har det skett betydande framsteg inom området för AI-riktmärken.

I början av den här artikeln nämnde vi att Qualcomm körde fyra olika AI-riktmärken på Snapdragon 888-referensenheten: AIMark, AITuTu, MLPerf och UL: s Procyon. Det kanske mest lovande av dessa riktmärken är MLPerf Mobile, som snart kommer att släppas, benchmark för mobil AI med öppen källkod uppbackad av flera SoC-leverantörer, ML-ramverksleverantörer och modell producenter. Dess första sats av mobila slutledningsresultat är offentlig, så vi använde dessa resultat för att jämföra med Snapdragon 888. Resultaten täcker endast 3 enheter: MediaTek Dimensity 820-drivna Xiaomi Redmi 10X 5G, Qualcomm Snapdragon 865+-driven ASUS ROG Phone 3 och Exynos 990-driven Samsung Galaxy Note 20 Ultra 5G. Qualcomm tillhandahöll inte latensresultat – bara genomströmningssiffror – så vi plottade inte de fullständiga resultaten som inlämnat av försäljarna för verifiering av MLCommons.

I dessa utvalda riktmärken för datorseende och naturligt språkbearbetning kan vi se att referensenheten Qualcomm Snapdragon 888 uppnådde de högsta poängen i alla fyra testerna. Av de tre tidigare generationens chipset överträffade MediaTeks Dimensity 820 Snapdragon 865+ och Exynos 990 i objektdetektering, medan Exynos 990 överträffade Snapdragon 865+ och Dimensity 820 i NLP. Qualcomms Snapdragon 865+ var generellt konkurrenskraftig, fick i nivå med Dimensity 820 i bildsegmentering och överträffade den i NLP. I dessa specifika slutledningstester med dessa specifika modeller och datauppsättningar överträffade Snapdragon 888 de tre senaste generationens chipset.

Det ska bli intressant att se vilka applikationer och funktioner utvecklare och OEM-tillverkare kan skapa med hjälp av AI-förmågan hos Snapdragon 888. Datorseende kommer att spela en särskilt viktig roll i de många AI-förbättrade videografifunktionerna vi kommer att använda troligtvis ses 2021, medan förbättrad NLP-prestanda också kan påverka videoangränsande aspekter som ljud inspelning.

Vi bör dock notera att Snapdragon 888:s resultat är obekräftad av MLCommons eftersom en del av organisationens verifieringsprocess kräver att enheten är kommersiellt tillgängliga (Qualcomms referensenheter säljs inte via en operatör eller som en olåst telefon). Dessutom beror prestandan på vilka ML-modeller, numeriska format och ML-ramverk som väljs, samt vilka ML-acceleratorer som finns tillgängliga.

Slutsats

Qualcomms Snapdragon 888 ger återigen stegvisa förbättringar av CPU- och GPU-prestanda, men massiva förbättringar av bildbehandling och AI. Inte många som uppgraderar från en två år gammal enhet kommer att märka förbättringarna i CPU och GPU (om de inte planerar att köra emulatorer eller spela spel som Genshin Impact), men de kommer definitivt att märka de andra framsteg som har gjorts i mobilen teknologi. Enheter har skärmar med högre uppdateringsfrekvens, fler kameror med bildsensorer med högre upplösning, stöd för 5G-anslutning och mycket mer nuförtiden. De enorma vinsterna i AI-prestanda kommer att förbli obemärkt för den genomsnittliga användaren, men möjligheterna som har öppnats med Qualcomms nya chipset är spännande att fundera över. Realtidsförbättringar av AI-video, strömmar med flera kameror och mycket mer är i horisonten nästa år, och företag som Google fortsätter att överraska med de funktioner de släpper med stöd av utbildning i maskininlärning modeller.

Qualcomm är dock inte det enda företaget som gör förbättringar av sin SoC-linje. Samsungs kommande Exynos 2100 för Galaxy S21 sägs ge stora prestandaförbättringar. Det finns också Huaweis nya HiSilicon Kirin 9000 och MediaTeks växande Dimensity-linje av mobila SoCs. Jag hoppas kunna återbesöka dessa riktmärken när vi har minst en toppmodern enhet med Samsungs, Huaweis och MediaTeks nästa generation kisel.

Qualcomm Snapdragon 888 Benchmarking Demo

Jag nämnde i början av den här artikeln att Qualcomm delade en förinspelad video med oss. Om du är intresserad har jag laddat upp den videon till YouTube. Det visar Snapdragon 888 som kör alla riktmärken jag delade ovan, såväl som de återstående AI-riktmärkena som jag inte visade upp.

Under tiden, här är tabellen som Qualcomm gav oss som sammanfattar Snapdragon 888:s benchmarkresultat:

Benchmarkresultat från en Qualcomm Snapdragon 888 referensenhet. Källa: Qualcomm