ARM kunngjør Mali-G77 GPU med ny "Valhall" GPU-arkitektur og 1,4x ytelsesforbedringer

ARM har annonsert Mali-G77 GPU. Den bringer den splitter nye Valhall-arkitekturen som etterfølger Bifrost-arkitekturen, som ble introdusert i 2016.

ARM har annonsert Mali-G77 GPU sammen med Cortex-A77 CPU på sin årlige TechDay. Mens Cortex-A77 er et betydelig generasjonsfremskritt i forhold til forgjengeren Cortex-A76, er Mali-G77 GPU noe helt annet. Det er den første GPUen i ARMs Mali-serie som kommer med en ny GPU-arkitektur siden Mali-G71, som brakte Bifrost-arkitekturen i 2016. Mali-G77 bringer den splitter nye "Valhall"-arkitekturen.

Selv om ARMs CPU IP har vært historisk sett ganske konkurransedyktig i det bredere smarttelefonlandskapet, selskapets Mali-serie av GPUer har slitt med å konkurrere med klassens beste løsninger over år. Gang på gang viste Mali-serien med GPUer seg å være dårligere enn deres Adreno og Imagination Technologies PowerVR GPUer når det gjelder ytelse og strømeffektivitet. Bifrost-arkitekturen etterfulgte Midgard-arkitekturen, og byttet fra en vektortype til en skalartype. Dessverre resulterte det ikke i å overvinne gapet i ytelse og strømeffektivitet som tilsynelatende ble større. Mali-G71 og Mali-G72 led av for høyt strømforbruk og struping, som gjorde dem dårligere enn Qualcomms Adreno GPUer og Apples tilpassede GPU (starter med Apple A11).

Den dårlige GPU-ytelsen ble et så betydelig problem at leverandører så ned på utsiktene til mindre GPU-gevinster oppnådd etter en generasjon. De Exynos 9810Mali-G72MP18 GPU var en mild forbedring fra forgjengeren, for eksempel. Huaweis HiSilicon Group slet med Mali GPU-ene i mye større grad. HiSilicon Kirin 960 og Kirin 970 ble sviktet av GPUer som forbrukte unormalt høye mengder strøm mens de ga relativt mindre ytelse, i den grad Huawei ble tvunget til å introdusere en ukonvensjonell strupemekanisme, som førte til referansejuks blir oppdaget for flere Huawei-telefoner i fjor.

Fjorårets Mali-G76 ga heldigvis betydelige forbedringer både når det gjelder ytelse og strømeffektivitet. Ved å bruke en 10-kjerners versjon av Mali-G76, var HiSilicon i stand til å love 46 % ytelsesforbedringer, og selv om selskapet oppnådde ytelsestallene, den var fortsatt ikke i stand til å ta GPU-ytelsen (både topp og vedvarende ytelse) samt krafteffektivitetskrone. Samsung Systems LSI implementerte en 12-kjerners versjon av GPU i Exynos 9820, og endte opp med å minske gapet til Qualcomm Snapdragon 855s Adreno 640 GPU. Qualcomms Adreno GPUer har forblitt klasselederne på Android-markedet, men Apple gikk en bedre i fjor med Apple A12s tilpassede GPU. Apple var i stand til å slå Qualcomm både når det gjelder topp og vedvarende ytelse, og selskapet viste også frem konkurransedyktig krafteffektivitet. For øyeblikket er A12s GPU fortsatt ledende, mens Snapdragon 855s Adreno 640 GPU er plassert på andreplass på de fleste benchmarks.

I møte med dette konkurransepregede miljøet, trengte ARM å gå opp for å møte utfordringen.

Resultatet av dette ble Mali-G77 og den nye Valhall-arkitekturen. ARM sier at den gir en 30 % økning i ytelsestetthet, 30 % energieffektivitetsforbedringer og 60 % forbedring for maskinlæring (ML). ARM forventer at Mali-G77-basert vil levere 40 % bedre topp grafikkytelse på mobile enheter.

Selskapet forventer at Mali-G77 vil bringe mer avansert spilling til mobiltelefoner, og bemerker at 2018 var året da inntektene fra mobilspill overtok inntektene på konsoll- og PC-basert spill for første gang tid.

Med hensyn til ML, sier ARM at Mali-G77 gir enheter med mulighetene til å utføre "stadig mer komplekse" ML-oppgaver raskere på enheten med 60 % ytelsestetthetsforbedring. Dette er bedre enn å sende dem til skyen for behandling, noe som fører til flere sikkerhetsproblemer og redusert ytelse, samt høyere ventetid.

Den nye Valhall-arkitekturen er grunnlaget for Mali-G77 og fremtidige Mali GPUer. ARM sier at følgende funksjoner til Valhall gjør det til en "roman arkitektur":

  • "En ny superskalarmotor, som gir enda et sprang i energieffektivitet og ytelsestetthet
  • En forenklet skalar ISA med et nytt instruksjonssett som er mer kompilatorvennlig
  • Ny dynamisk planlegging av instruksjoner
  • Omarbeidede datastrukturer bedre tilpasset moderne APIer, som Vulkan.
  • Selv om det er mange forskjellige fremskritt og nye funksjoner, er de to viktigste utførelsesmotoren og teksturkartleggingen i Mali-G77."

De brede utførelsesmotorene til Mali-G77 forbedrer ytelsestettheten gjennom å dele kontroll over et stort antall baner, ifølge ARM. Mali-G76 har 8 brede varps og totalt 24 FMA-baner per shader-kjerne, mens Mali-G77 har 16 wide-warps, 32 baner (to klynger med 16 FMA per utførelsesmotor) og én motor per shader-kjerne. Dette resulterer i 33 % mer databehandling i samme område sammenlignet med G76, ifølge selskapet.

ARM sier også at den forbedrede spillytelsen til Mali-G77 er knyttet til quad texture mapper, som gir fire texels/syklus, det vil si 2x bedre gjennomstrømning enn Mali-G76 og 4x større enn G72. Det sies å gi forbedringer over hele linja av høy-fidelity og casual gaming, men det vil ha en spesielt stor innvirkning på teksturtunge spill. Beregningsevnen til G77 er økt, så teksturevnen måtte også økes for å holde maskinen balansert, ifølge ARM. Sluttmålet? Lever mer ytelse per kvadratmillimeter enn før.

Mali-G77 har blitt optimalisert for å matche de nye 16-brede utførelsesmotorene og quad-teksturkartleggingen. Denne optimeringen inkluderer en re-design av LSC- og attributtrøret med fokus på ytelsestetthet og energieffektivitet.

ARM sier at de har et "betydelig fokus" på å forbedre energieffektiviteten, og fremmer at Mali-G77 kan gjøre det samme arbeidet i 50 % av energien til Mali-G72 fra for to år siden. Ifølge selskapet øker Valhall-arkitekturen og Mali-G77 energieffektiviteten på tvers av alle arbeidsmengder, noe som fører til en forbedring på 1,3x på tvers av «et bredt spekter av innhold», noe som betyr at brukere vil få lengre batterilevetid på premium enheter.

ARM sier at dynamisk instruksjonsplanlegging nå håndteres i maskinvare for å muliggjøre bedre ytelse. Den dynamiske planleggeren sies å bestemme hvilke instruksjoner som skal utføres fra hvilke warps, og arbeidet sendes deretter til uavhengige parallelle ALU-er i superskalarstil.

Til slutt bemerker ARM at Valhall-arkitekturen fortsetter utviklingen av ARM Frame Buffer Compression gjennom AFBC 1.3. Den bringer noen nye funksjoner som kan leses i ARMs blogginnlegg.

ARM har noen store løfter for Mali-G77, og proklamerer at den vil gi betydelige ytelsesforbedringer i kompleks AR og ML, og gi "kompromissløs grafikkytelse og økt effektivitet." Hvis påstandene spiller ut, kan vi endelig se en ARM Mali GPU gå head to head med, eller til og med forbedre Adreno GPUen til en gitt generasjon, og det mobile GPU-markedet har blitt ganske mye mer konkurransedyktig.

Kilde: VÆPNE

Via: AnandTech