ARM annoncerer Mali-G77 GPU med ny "Valhall" GPU-arkitektur og 1,4x ydeevneforbedringer

ARM har annonceret Mali-G77 GPU. Det bringer den helt nye Valhall-arkitektur, der efterfølger Bifrost-arkitekturen, som blev introduceret i 2016.

ARM har annonceret Mali-G77 GPU sammen med Cortex-A77 CPU på sin årlige TechDay. Mens Cortex-A77 er et betydeligt generationsfremskridt i forhold til sin forgænger, Cortex-A76, er Mali-G77 GPU noget helt andet. Det er den første GPU i ARMs Mali-serie, der bringer en ny GPU-arkitektur siden Mali-G71, som bragte Bifrost-arkitekturen i 2016. Mali-G77 bringer den helt nye "Valhall"-arkitektur.

Selvom ARMs CPU IP historisk set har været ret konkurrencedygtig i det bredere smartphonelandskab, virksomhedens Mali-serie af GPU'er har kæmpet for at konkurrere med klassens bedste løsninger over flere år. Gang på gang viste Mali-serien af ​​GPU'er sig at være underlegen i forhold til deres Adreno og Imagination Technologies' PowerVR GPU'er med hensyn til ydeevne og strømeffektivitet. Bifrost-arkitekturen efterfulgte Midgard-arkitekturen og skiftede fra en vektortype til en skalartype. Desværre resulterede det ikke i at overvinde forskellen mellem ydeevne og strømeffektivitet, der tilsyneladende voksede sig større. Mali-G71 og Mali-G72 led af for højt strømforbrug og drosling, hvilket gjorde dem ringere end Qualcomms Adreno GPU'er og Apples brugerdefinerede GPU (startende med Apple A11).

Den dårlige GPU-ydeevne blev så væsentligt et problem, at leverandører så ned på udsigten til mindre GPU-gevinster opnået efter en generation. Det Exynos 9810's Mali-G72MP18 GPU var for eksempel en mild forbedring fra sin forgænger. Huaweis HiSilicon Group kæmpede med Mali GPU'erne i langt større omfang. HiSilicon Kirin 960 og Kirin 970 blev svigtet af GPU'er, der forbrugte unormalt høje mængder strøm, mens de leverede relativt mindre ydeevne, i det omfang Huawei blev tvunget til at introducere en ukonventionel drosselmekanisme, hvilket førte til benchmark snyd bliver opdaget for flere Huawei-telefoner sidste år.

Sidste års Mali-G76 leverede heldigvis væsentlige forbedringer på både ydeevne og energieffektivitetsfronter. Ved at bruge en 10-kerne version af Mali-G76 var HiSilicon i stand til at love 46% ydeevneforbedringer, og selvom virksomheden opnåede præstationstallene, det var stadig ikke i stand til at tage GPU-ydeevnen (både top- og vedvarende ydeevne) samt strømeffektivitetskrone. Samsung Systems LSI implementerede en 12-kernet version af GPU'en i Exynos 9820, og endte med at indsnævre kløften til Qualcomm Snapdragon 855's Adreno 640 GPU. Qualcomms Adreno GPU'er er forblevet førende på Android-markedet, men Apple gik endnu bedre sidste år med Apple A12's brugerdefinerede GPU. Apple var i stand til at slå Qualcomm både med hensyn til maksimal og vedvarende ydeevne, og virksomheden viste også konkurrencedygtig strømeffektivitet. I øjeblikket er A12's GPU fortsat førende, mens Snapdragon 855's Adreno 640 GPU er placeret på andenpladsen på de fleste benchmarks.

I lyset af dette konkurrenceprægede miljø var ARM nødt til at gå op for at klare udfordringen.

Resultatet af dette var Mali-G77 og den nye Valhall-arkitektur. ARM siger, at det leverer en 30 % stigning i ydeevnetæthed, 30 % energieffektivitetsforbedringer og 60 % forbedring til maskinlæring (ML). ARM forventer, at Mali-G77-baseret leverer 40 % bedre maksimal grafikydeevne i mobile enheder.

Virksomheden forventer, at Mali-G77 vil bringe mere avanceret spil til mobiltelefoner, og bemærker, at 2018 var året, hvor indtægterne fra mobilspil overhalede indtægterne på konsol- og pc-baseret spil for første gang tid.

Med hensyn til ML siger ARM, at Mali-G77 giver enheder mulighed for at udføre "stadig mere komplekse" ML-opgaver hurtigere på enheden med en forbedring af ydeevnetætheden på 60 %. Dette er bedre end at sende dem til skyen til behandling, hvilket fører til flere sikkerhedsproblemer og nedsat ydeevne samt højere latenstid.

Den nye Valhall-arkitektur er grundlaget for Mali-G77 og fremtidige Mali GPU'er. ARM siger, at følgende funktioner i Valhall gør det til en "ny arkitektur":

  • "En ny superskalarmotor, som giver endnu et spring i energieffektivitet og ydeevnetæthed
  • En forenklet skalar ISA med et nyt instruktionssæt, der er mere compilervenligt
  • Ny dynamisk planlægning af instruktioner
  • Omarbejdede datastrukturer bedre tilpasset moderne API'er, såsom Vulkan.
  • Selvom der er mange forskellige fremskridt og nye funktioner, er de to vigtigste udførelsesmotoren og teksturmapper i Mali-G77."

De brede udførelsesmotorer i Mali-G77 forbedrer ydeevnetætheden ved at dele kontrol over et bredt antal baner, ifølge ARM. Mali-G76 har 8-brede warps og i alt 24 FMA-baner pr. shader-kerne, mens Mali-G77 har 16 wide-warps, 32 baner (to klynger af 16 FMA pr. udførelsesmotor) og en motor pr. shader-kerne. Dette resulterer i 33 % mere beregning i det samme område sammenlignet med G76, ifølge virksomheden.

ARM oplyser også, at Mali-G77's forbedrede spilydeevne er knyttet til quad texture mapper, som giver fire texel/cyklus, det vil sige 2x bedre gennemløb end Mali-G76 og 4x større end G72. Det siges at give forbedringer på tværs af high-fidelity og casual gaming, men det vil have en særlig stor indflydelse på teksturtunge spil. Beregningsevnen på G77 er blevet øget, så teksturkapaciteten skulle også øges for at holde maskinen afbalanceret, ifølge ARM. Slutmålet? Lever mere ydeevne pr. kvadratmillimeter end tidligere.

Mali-G77 er blevet optimeret til at matche de nye 16-brede eksekveringsmotorer og quad-teksturmapperen. Denne optimering inkluderer et re-design af LSC og attributrøret med fokus på ydeevnetæthed og energieffektivitet.

ARM siger, at det har et "betydeligt fokus" på at forbedre energieffektiviteten og fremmer, at Mali-G77 kan udføre det samme arbejde i 50 % af energien fra Mali-G72 fra for to år siden. Ifølge virksomheden øger Valhall-arkitekturen og Mali-G77 energieffektiviteten på tværs af alle arbejdsbelastninger, hvilket fører til en forbedring på 1,3x på tværs af "en bred vifte af indhold", hvilket betyder, at brugerne får længere batterilevetid på premium enheder.

ARM oplyser, at dynamisk instruktionsplanlægning nu håndteres i hardware for at muliggøre bedre ydeevne. Den dynamiske skemalægger siges at bestemme, hvilke instruktioner der skal udføres fra hvilke warps, og værket udsendes derefter til uafhængige parallelle ALU'er i superskalær stil.

Endelig bemærker ARM, at Valhall-arkitekturen fortsætter udviklingen af ​​ARM Frame Buffer Compression gennem AFBC 1.3. Det bringer nogle nye funktioner, som kan læses i ARMs blogindlæg.

ARM har nogle store løfter til Mali-G77 og proklamerer, at den vil bringe betydelige ydeevneforbedringer i kompleks AR og ML, og give "kompromisløs grafikydeevne og øget effektivitet." Hvis påstandene udspiller sig, kan vi endelig se en ARM Mali GPU køre head to head med eller endda forbedre Adreno GPU'en for en given generation, og det mobile GPU-marked er bare blevet en del mere konkurrencedygtige.

Kilde: ARM

Via: AnandTech