Qualcomm Snapdragon 888 benchmarks: Her er, hvordan 2021's flagskib 5G-telefoner vil præstere

Her er CPU, GPU og AI benchmark resultater fra en Qualcomm Snapdragon 888 referenceenhed i test som Geekbench, AnTuTu og andre.

Tidligere på måneden inviterede Qualcomm journalister til et virtuelt Snapdragon Tech Summit, hvor de annoncerede Snapdragon 888 mobil platform. Qualcomms seneste 8-serie SoC bringer store forbedringer til billedbehandling og maskinlæring, men kun trinvise forbedringer af CPU- og GPU-ydeevne. For at finde ud af, hvor meget mere kraftfuldt Qualcomms seneste chipset er, får vi typisk mulighed for at køre benchmarks på dets referencehardware. På grund af COVID-19 kunne Qualcomm dog ikke arrangere en personlig benchmarking session, så i stedet sendte de os en forudindspillet video, der viser en Qualcomm Snapdragon 888-referenceenhed, der kører den populære skala benchmarks.

På Snapdragon 888-referenceenheden kørte Qualcomm ét holistisk benchmark (AnTuTu), et CPU-centreret benchmark (Geekbench), et GPU-centreret benchmark (GFXBench) og flere AI/ML-benchmarks (AIMark, AITuTu, MLPerf og Procyon). Hvert benchmark blev kørt tre gange, så virksomheden delte det gennemsnitlige resultat på tværs af tre iterationer. Derudover siger virksomheden, at de kørte hvert benchmark ved hjælp af standardindstillingerne på Snapdragon 888-referencedesignet, hvilket betyder, at de ikke aktiverede nogen højtydende tilstand. Men fordi benchmarkscorerne blev givet til os, kan vi ikke selv verificere resultaterne eller testbetingelserne. Når vi har fået fingrene i en kommerciel enhed med Qualcomm Snapdragon 888, kører vi disse benchmarks igen.

Hvis du er interesseret i at læse op på alle specifikationer og funktioner på Qualcomm Snapdragon 888 mobilplatformen, så anbefaler jeg at læse Idrees Patels fremragende forklaring på Snapdragon 888 offentliggjort tidligere på måneden. Hans artikel går i detaljer om alle de forbedringer, Qualcomm har lavet til CPU'en, GPU'en, modemet, forbindelsesundersystemet, ISP, AI-motoren, DSP og alt muligt andet. Til hurtig reference har jeg sammensat et diagram, der sammenligner nøglespecifikationerne for Qualcomm Snapdragon 888 referenceenheden sammenlignet med de to andre enheder, der bruges i denne benchmark-sammenligning: Snapdragon 865-drevne referenceenhed og Snapdragon 855-drevne Pixel 4 at Jeg brugte i sidste års benchmarking session. Du kan finde dette diagram nedenfor foran benchmarkresultaterne.

Qualcomm Snapdragon 888 benchmark resultater

Testenheders specifikationer

Qualcomm Snapdragon 855 (Google Pixel 4)

Qualcomm Snapdragon 865 (Qualcomm referenceenhed)

Qualcomm Snapdragon 888 (Qualcomm referenceenhed)

CPU

  • 1x Kryo 485 (ARM Cortex A76-baseret) Prime core @ 2,84GHz, 1x 512KB L2 cache
  • 3x Kryo 485 (ARM Cortex A76-baseret) ydeevnekerner @ 2,42GHz, 3x 256KB L2-cache
  • 4x Kryo 385 (ARM Cortex A55-baseret) effektivitetskerner @ 1,8GHz, 4x 128KB L2-cache
  • 2MB L3 cache
  • 1x Kryo 585 (ARM Cortex A77-baseret) Prime core @ 2,84GHz, 1x 512KB L2 cache
  • 3x Kryo 585 (ARM Cortex A77-baseret) ydeevnekerner @ 2,4GHz, 3x 256KB L2-cache
  • 4x Kryo 385 (ARM Cortex A55-baseret) effektivitetskerner @ 1,8GHz, 4x 128KB L2-cache
  • 4MB L3 cache
  • 1x Kryo 680 (ARM Cortex X1-baseret) Prime core @ 2,84GHz, 1x 1MB L2 cache
  • 3x Kryo 680 (ARM Cortex A78-baseret) ydeevnekerner @ 2,4GHz, 3x 512KB L2-cache
  • 4x Kryo 680 (ARM Cortex A55-baseret) effektivitetskerner @ 1,8GHz, 4x 128KB L2-cache
  • 4MB L3 cache

GPU

Adreno 640

Adreno 650

Adreno 660

Skærm

  • 2280 x 1080 opløsning
  • 60Hz opdateringshastighed
  • 2880 x 1440 opløsning
  • 60Hz opdateringshastighed
  • 2340 x 1080 opløsning
  • 120Hz opdateringshastighed

AI

  • Hexagon 690 med Hexagon Vector eXtensions og Hexagon Tensor Accelerator
  • 4. generation AI Engine
  • 7 TOPS
  • Hexagon 698 med Hexagon Vector eXtensions og ny Hexagon Tensor Accelerator
  • 5. generation AI Engine
  • Qualcomm Sensing Hub
  • 15 TOPS
  • Hexagon 780 med Fused AI Accelerator-arkitektur
  • 6. generation AI Engine
  • Qualcomm Sensing Hub (2. generation)
    • Ny dedikeret AI-processor
    • 80 % opgavereduktion aflastning fra Hexagon DSP
    • 5 gange mere processorkraft år efter år
  • 16X større delt hukommelse
  • 50 % hurtigere skalaraccelerator, 2x hurtigere tensoraccelerator YoY
  • 26 TOPS

Hukommelse

  • 6 GB LPDDR4
  • 3MB systemniveau cache
  • 12 GB LPDDR5
  • 3MB systemniveau cache
  • 12 GB LPDDR5
  • 3MB systemniveau cache

Opbevaring

64 GB UFS 2.1

128 GB UFS 3.0

512 GB UFS 3.0

ISP

  • Dual 14-bit Spectra 380 ISP
  • Dual 14-bit Spectra 480 ISP
  • 2,0 Gigapixels per sekund gennemløb
  • Triple 14-bit Spectra 580 ISP
  • 2,7 Gigapixels per sekund gennemløb

Fremstillingsproces

7nm (TSMC's N7)

7nm (TSMC's N7P)

5nm (Samsungs 5LPE)

Software version

Android 10

Android 10

Android 11

Oversigt over benchmarks

Med input fra Mario Serrafero

  • AnTuTu: Dette er et holistisk benchmark. AnTuTu tester CPU-, GPU- og hukommelsesydelsen, mens den inkluderer både abstrakte tests og for sent, relaterbare brugeroplevelsessimuleringer (for eksempel undertesten, der involverer at rulle gennem en Listevisning). Den endelige score vægtes efter designerens overvejelser.
  • GeekBench: En CPU-centreret test, der bruger flere beregningsmæssige arbejdsbelastninger, herunder kryptering, komprimering (tekst og billeder), gengivelse, fysiksimuleringer, computersyn, strålesporing, talegenkendelse og konvolutionel neural netværksinferens på billeder. Resultatopdelingen giver specifikke målinger. Den endelige score vægtes i henhold til designerens overvejelser, idet der lægges stor vægt på heltals ydeevne (65 %), derefter flydende ydeevne (30 %) og endelig krypto (5 %).
  • GFXBench: Sigter mod at simulere gengivelse af videospilgrafik ved hjælp af de nyeste API'er. Masser af effekter på skærmen og højkvalitets teksturer. Nyere test bruger Vulkan, mens ældre test bruger OpenGL ES 3.1. Udgangene er rammer under test og billeder per sekund (det andet tal divideret med testlængden, i det væsentlige), i stedet for et vægtet score.
    • Aztekiske ruiner: Disse test er de mest beregningstunge, der tilbydes af GFXBench. I øjeblikket kan de bedste mobile chipsæt ikke opretholde 30 billeder i sekundet. Specifikt tilbyder testen virkelig høj polygonantal geometri, hardware tessellation, højopløselige teksturer, global belysning og masser af skyggekortlægning, rigelige partikeleffekter samt opblomstring og dybdeskarphed effekter. De fleste af disse teknikker vil understrege processorens shader-beregningskapacitet.
    • Manhattan ES 3.0/3.1: Denne test forbliver relevant, da moderne spil allerede er nået frem til dens foreslåede grafiske troskab og implementerer de samme slags teknikker. Den har kompleks geometri, der anvender flere gengivelsesmål, refleksioner (kubiske kort), mesh-gengivelse, mange udskudte lyskilder samt opblomstring og dybdeskarphed i et efterbehandlingspas.
  • MLPerf mobil: MLPerf Mobile er et open source benchmark til test af mobil AI-ydeevne. Det var oprettet af MLCommons, et non-profit, åbent ingeniørkonsortium, for at "levere gennemsigtighed og lige vilkår for sammenligning af ML-systemer, software og løsninger." MLPerf Mobiles første iteration giver en inferens-ydeevne benchmark for en håndfuld computersyn og naturligt sprog bearbejdningsopgaver. For mere information henvises til papiret "MLPerf Mobile Inference Benchmark: Hvorfor Mobile AI Benchmarking er svært, og hvad man skal gøre ved det."
    • Billedklassificering: Denne test involverer at udlede en etiket, der skal anvendes på et inputbillede. Typiske brugstilfælde omfatter fotosøgninger eller tekstudtræk. Den anvendte referencemodel er MobileNetEdgeTPU med 4M parametre, datasættet er ImageNet 2012 (224x224), og kvalitetsmålet er 98% af FP32 (76,19% Top-1).
    • Billedsegmentering: Denne test involverer opdeling af et inputbillede i mærkede objekter. Typiske anvendelsestilfælde omfatter selvkørende eller fjernmåling. Den anvendte referencemodel er DeepLab v3+ med 2M parametre, datasættet er ADE20K (512x512), og kvalitetsmålet er 93% af FP32 (0,244 mAP).
    • Objektdetektion: Denne test involverer at tegne afgrænsningsfelter omkring objekter samt give en etiket til disse objekter. Typiske brugssager involverer kamerainput, såsom til fareregistrering eller trafikanalyse under kørsel. Referencemodellen er SSD-MobileNet v2 med 17M parametre, datasættet er COCO 2017 (300x300), og kvalitetsmålet er 97% af FP32 (54,8% mIoU).
    • Sprogbehandling: Denne test involverer besvarelse af spørgsmål i daglig tale. Typiske anvendelsestilfælde omfatter online søgemaskiner. Referencemodellen er MobileBERT med 25M parametre, datasættet er mini Squad (Stanford Question Answering Dataset) v1.1 dev, og kvalitetsmålet er 93% af FP32 (93,98% F1).

AnTuTu resultater

Fra og med AnTuTu kan vi se, at Qualcomm Snapdragon 888-referenceenheden fik næsten 17.000 point højere end Snapdragon 865-referenceenheden og næsten 350.000 point højere end den Snapdragon 855-drevne Pixel 4. Når du ser på CPU, GPU, Memory og UX subscores (ikke vist her), kan vi se, at de største forbedringer i ydeevnen kommer fra GPU og hukommelse. Snapdragon 888 QRD scorede cirka 45,56 % højere i AnTuTus GPU-subtest sammenlignet med Snapdragon 865 QRD. Tilsvarende scorede Snapdragon 888 QRD omkring 52,08 % højere i AnTuTus hukommelsessubtest sammenlignet med Snapdragon 865 QRD. Sammenlignet med den Snapdragon 855-drevne Pixel 4, overgik 888 QRD den i GPU- og hukommelsesundertestene med henholdsvis 98,42 % og 117,58 %.

I mellemtiden scorede Snapdragon 888 QRD cirka 30,05 % og 90,28 % højere i AnTuTus CPU-subtest sammenlignet med henholdsvis Snapdragon 865 QRD og Snapdragon 855-drevne Pixel 4. UX-underresultatet er svært at sammenligne på grund af de forskellige Android OS-versioner, hver enhed kørte (Pixel 4 og Snapdragon 865 QRD kørte Android 10, da jeg benchmarkede dem sidste år, mens 888 QRD kører Android 11.)

Det store løft i hukommelsesydelsen er ret interessant. Både 865 QRD og 888 QRD har 12 GB LPDDR5 RAM, selvom vi ikke ved, hvad RAM'en er clocket til. Navnlig understøtter 865 op til 16 GB LPDDR5 RAM ved 2750MHz, mens 888 understøtter op til 16 GB LPDDR5 RAM ved 3200MHz. Bumpene i CPU og GPU ydelsen her er lidt over vores forventninger, da Qualcomm sagde, at Snapdragon 888's CPU- og GPU-gevinster er henholdsvis 25% og 35%. år efter år. De mere CPU- og GPU-centrerede benchmarks, der følger, viser dog gevinster, der er mere i overensstemmelse med vores forventninger.

Geekbench resultater

I Geekbench 5.0 præsterer Qualcomm Snapdragon 888 22,17% og 9,97% højere i henholdsvis single-core og multi-core test sammenlignet med Snapdragon 865. Sammenlignet med Snapdragon 855 præsterer 888'eren henholdsvis omkring 89,17% og 51,82% bedre.

Qualcomm siger, at Snapdragon 888 giver et 25% løft i CPU-ydeevne i forhold til Snapdragon 865. CPU'ens enlige ARM Cortex-X1 Prime-kerne er clocket til en konservativ 2,84GHz - samme clockhastighed som sidste generations ARM Cortex-A77 Prime kerne - så det er muligt, at vi vil se en 3+GHz clockhastighed for den uundgåelige Snapdragon 888 "Plus" midt på året Opdater. Hvis det er tilfældet, kan vi forvente, at CPU-ydeevnen forbedres endnu mere, selvom det lige nu er rimeligt at sige, at gevinsterne er solide, men alligevel kun trinvise.

Så hvis du opgraderer fra et to år gammelt flagskib, burde 888'eren bringe store forbedringer i CPU-ydeevnen. Hvis du opgraderer fra et år gammelt flagskib, er disse gevinster meget mindre. Jeg er personligt spændt på at se, hvordan en Snapdragon 888-enhed håndterer konsolemulering.

GFXBench resultater

Qualcomm har ikke afsløret kerneantal eller maksimal frekvens for Adreno 660 GPU'en i Snapdragon 888, så vi har ikke meget at sige om GPU'en udover dens gevinster i ydeevne. I GFXBenchs Manhattan-test, som bruger OpenGL ES 3.0 API og gengiver en 1080p-scene uden for skærmen, havde Snapdragon 888 en gennemsnitlig billedhastighed på 169 fps, omkring 34,13 % og 83,7 % højere end billedhastighederne opnået af Snapdragon 865 og 855 henholdsvis. I GFXBenchs Aztec Ruins-test, som bruger Vulkan grafik API og gengiver en 1080p scene uden for skærmen, havde Snapdragon 888 en gennemsnitlig billedhastighed på 86 fps, omkring 38,71 % og 95,45 % højere end billedhastighederne opnået af Snapdragon 865 og 855 henholdsvis.

Der er ikke ret mange spil, der kræver mange GPU-hestekræfter (den seneste Genshin Impact er en undtagelse), men forbedret GPU-ydeevne er nyttig til mere end bare spil. Men spil er absolut den største grund til, at folk vil bekymre sig om disse benchmark-resultater, og det Snapdragon 888 leverer bestemt med sin 35 % hurtigere grafikgengivelse og 20 % bedre strømeffektivitet år efter år. Disse resultater viser dog kun den højeste GPU-ydeevne, så vi bliver nødt til at se igen GFXBench - når vi først har fået fat i kommerciel hardware - for at køre benchmarks langsigtede præstationstest.

MLPerf resultater

Måske er de mest interessante gevinster i AI-ydeevne. Qualcomm tager generelt store spring i AI-ydelse hvert år, men dette års gevinster er de mest imponerende. Snapdragon 888's AI-motor kan prale af 26 TOPS ydeevne, en stigning fra 15 TOPS ydeevnen på Snapdragon 865 og 7 TOPS ydeevnen for Snapdragon 855. Qualcomm krediterer meget af denne gevinst til den nye fusionerede AI-acceleratorarkitektur i Hexagon 780 DSP, der fusionerer skalar-, vektor- og tensoracceleratorer for at eliminere fysiske afstande og poolhukommelse til deling og flytning af data effektivt.

Det er imidlertid svært for os at påvise, hvor betydeligt dette spring i ydeevne faktisk er. Vi har talt i dybden om vanskelighederne ved AI-benchmarking under vores interviews med Qualcomms Travis Lanier, Gary Brotman og Ziad Asghar. Den gode nyhed er, at der siden vores diskussioner med Qualcomm-chefer er sket betydelige fremskridt inden for AI-benchmarks.

I begyndelsen af ​​denne artikel nævnte vi, at Qualcomm kørte 4 forskellige AI-benchmarks på Snapdragon 888-referenceenheden: AIMark, AITuTu, MLPerf og UL's Procyon. Måske den mest lovende af disse benchmarks er MLPerf Mobile, som er en snart udgivet, open source mobil AI-benchmark understøttet af flere SoC-leverandører, ML-rammeudbydere og model producenter. Dens indledende batch af mobile inferencing-resultater er offentlig, så vi brugte disse resultater til at sammenligne med Snapdragon 888. Resultaterne dækker kun 3 enheder: den MediaTek Dimensity 820-drevne Xiaomi Redmi 10X 5G, Qualcomm Snapdragon 865+-drevet ASUS ROG Phone 3 og den Exynos 990-drevne Samsung Galaxy Note 20 Ultra 5G. Qualcomm leverede ikke latensresultater - kun gennemløbstal - så vi plottede ikke de fulde resultater som indsendt af sælgerne til verifikation af MLCommons.

I disse udvalgte benchmarks for computersyn og naturlig sprogbehandling kan vi se, at Qualcomm Snapdragon 888-referenceenheden opnåede de højeste score i alle fire tests. Af de 3 forrige generations chipsæt overgik MediaTeks Dimensity 820 Snapdragon 865+ og Exynos 990 i objektdetektion, mens Exynos 990 klarede sig bedre end Snapdragon 865+ og Dimensity 820 i NLP. Qualcomms Snapdragon 865+ var generelt konkurrencedygtig og scorede på niveau med Dimensity 820 i billedsegmentering og overgik den i NLP. I disse specifikke inferencing-tests med disse specifikke modeller og datasæt overgik Snapdragon 888 de 3 sidste generations chipsæt.

Det bliver interessant at se, hvilke applikationer og funktioner udviklere og OEM'er kan skabe ved at bruge AI-evnen fra Snapdragon 888. Computer vision vil spille en særlig vigtig rolle i de mange AI-forbedrede videografifunktioner, vi vil sandsynligvis se i 2021, mens forbedret NLP-ydeevne ligeledes kan påvirke video tilstødende aspekter som lyd indspilning.

Vi skal dog bemærke, at resultaterne af Snapdragon 888 er ubekræftet af MLCommons, da en del af organisationens verifikationsproces kræver, at enheden er kommercielt tilgængelige (Qualcomms referenceenheder sælges ikke gennem en udbyder eller som en ulåst telefon). Ydeevnen afhænger endvidere af, hvilke ML-modeller, numeriske formater og ML-frameworks der vælges, samt hvilke ML-acceleratorer, der er tilgængelige.

Konklusion

Qualcomms Snapdragon 888 bringer igen trinvise forbedringer til CPU- og GPU-ydeevne, men massive forbedringer til billedbehandling og AI. Ikke mange mennesker, der opgraderer fra en to år gammel enhed, vil bemærke forbedringerne i CPU og GPU (medmindre de planlægger at køre emulatorer eller spille spil som Genshin Impact), men de vil helt sikkert bemærke de andre fremskridt, der er gjort på mobilen teknologi. Enheder har skærme med højere opdateringshastighed, flere kameraer med billedsensorer med højere opløsning, understøttelse af 5G-forbindelse og meget mere i disse dage. De massive gevinster i AI-ydeevne vil forblive ubemærket af den gennemsnitlige bruger, men de muligheder, der er åbnet med Qualcomms nye chipset, er spændende at overveje. Real-time AI-videoforbedringer, multi-kamera-streams og meget mere er i horisonten næste år, og virksomheder som Google fortsætter med at overraske med de funktioner, de frigiver understøttet af træning af maskinlæring modeller.

Qualcomm er dog ikke den eneste virksomhed, der foretager forbedringer af sin SoC-lineup. Samsungs kommende Exynos 2100 til Galaxy S21 siges at bringe store ydeevneforbedringer. Der er også Huaweis nye HiSilicon Kirin 9000 og MediaTeks voksende Dimensity-serie af mobile SoC'er. Jeg håber at besøge igen disse benchmarks, når vi har mindst én top-of-the-line enhed med Samsungs, Huaweis og MediaTeks næste generation silicium.

Qualcomm Snapdragon 888 Benchmarking-demo

Jeg nævnte i begyndelsen af ​​denne artikel, at Qualcomm delte en forudindspillet video med os. Hvis du er interesseret, har jeg uploadet den video til YouTube. Det viser Snapdragon 888, der kører alle de benchmarks, jeg delte ovenfor, såvel som de resterende AI-benchmarks, som jeg ikke fremviste.

I mellemtiden er her den tabel, som Qualcomm gav os, der opsummerer Snapdragon 888's benchmarkresultater:

Benchmark resultater fra en Qualcomm Snapdragon 888 referenceenhed. Kilde: Qualcomm