ARM har annonserat Mali-G77 GPU. Den ger den helt nya Valhall-arkitekturen som efterträder Bifrost-arkitekturen, som introducerades 2016.
ARM har annonserat Mali-G77 GPU tillsammans med Cortex-A77 CPU på sin årliga TechDay. Medan Cortex-A77 är ett betydande generationsframsteg jämfört med sin föregångare, Cortex-A76, är Mali-G77 GPU något helt annat. Det är den första GPU: n i ARM: s Mali-sortiment som kommer med en ny GPU-arkitektur sedan Mali-G71, som kom med Bifrost-arkitekturen 2016. Mali-G77 ger den helt nya "Valhall"-arkitekturen.
Även om ARMs CPU IP historiskt sett har varit ganska konkurrenskraftig i det bredare smartphonelandskapet, företagets Mali-sortiment av grafikprocessorer har kämpat för att konkurrera med klassens bästa lösningar över år. Gång på gång visade sig Mali-serien av GPU: er vara sämre än deras Adreno och Imagination Technologies PowerVR GPU: er när det gäller prestanda och energieffektivitet. Bifrost-arkitekturen efterträdde Midgard-arkitekturen och bytte från en vektortyp till en skalärtyp. Tyvärr resulterade det inte i att övervinna gapet mellan prestanda och energieffektivitet som till synes växte sig större. Mali-G71 och Mali-G72 led av alltför hög strömförbrukning och strypning, vilket gjorde dem sämre än Qualcomms Adreno GPU: er och Apples anpassade GPU (som börjar med Apple A11).
Den dåliga GPU-prestandan blev ett så stort problem att leverantörer såg ner på utsikterna till mindre GPU-vinster som uppnåddes efter en generation. De Exynos 9810Mali-G72MP18 GPU var en mild förbättring från sin föregångare, till exempel. Huaweis HiSilicon Group kämpade med Malis grafikprocessorer i mycket större utsträckning. HiSilicon Kirin 960 och den Kirin 970 sviktes av GPU: er som förbrukade onormalt höga mängder ström samtidigt som de gav relativt mindre prestanda, i den mån Huawei tvingades införa en okonventionell strypmekanism, vilket ledde till benchmark fusk upptäcks för flera Huawei-telefoner förra året.
Förra årets Mali-G76 gav tack och lov avsevärda förbättringar både vad gäller prestanda och energieffektivitet. Genom att använda en 10-kärnig version av Mali-G76 kunde HiSilicon lova 46 % prestandaförbättringar, och även om företaget uppnådde prestandasiffrorna, det kunde fortfarande inte ta GPU-prestandan (både topp- och ihållande prestanda) samt effekteffektiv krona. Samsung Systems LSI implementerade en 12-kärnig version av GPU i Exynos 9820, och slutade med att minska klyftan till Qualcomm Snapdragon 855:s Adreno 640 GPU. Qualcomms Adreno GPU: er har förblivit klassledande på Android-marknaden, men Apple gick ett bättre förra året med Apple A12:s anpassade GPU. Apple kunde slå Qualcomm både när det gäller topp- och uthållig prestanda, och företaget visade också upp konkurrenskraftig energieffektivitet. För närvarande är A12:s GPU fortfarande ledande, medan Snapdragon 855:s Adreno 640 GPU är placerad tvåa på de flesta riktmärken.
Inför denna konkurrensutsatta miljö behövde ARM ta steget för att möta utmaningen.
Resultatet av detta blev Mali-G77 och den nya Valhall-arkitekturen. ARM säger att det ger en 30% ökning av prestandatäthet, 30% energieffektivitetsförbättringar och 60% förbättring för maskininlärning (ML). ARM förväntar sig att Mali-G77-baserade levererar 40 % bättre toppgrafikprestanda i mobila enheter.
Företaget förväntar sig att Mali-G77 kommer att ge mer avancerade spel till mobiltelefoner, och noterar att 2018 var året då intäkterna från mobilspel gick om intäkterna från konsol- och PC-baserade spel för första gången tid.
När det gäller ML säger ARM att Mali-G77 förser enheter med kapacitet att utföra "allt mer komplexa" ML-uppgifter snabbare på enheten med 60 % förbättring av prestandatätheten. Detta är bättre än att skicka dem till molnet för bearbetning, vilket leder till fler säkerhetsproblem och minskad prestanda, samt högre latens.
Den nya Valhall-arkitekturen är grunden för Mali-G77 och framtida Mali GPU: er. ARM säger att följande egenskaper hos Valhall gör det till en "roman arkitektur":
- "En ny superskalärmotor, som ger ytterligare ett steg i energieffektivitet och prestandatäthet
- En förenklad skalär ISA med en ny instruktionsuppsättning som är mer kompilatorvänlig
- Ny dynamisk schemaläggning av instruktioner
- Omarbetade datastrukturer bättre anpassade till moderna API: er, som Vulkan.
- Även om det finns många olika framsteg och nya funktioner, är de två viktigaste exekveringsmotorn och texturmapparen i Mali-G77."
De breda exekveringsmotorerna i Mali-G77 förbättrar prestandatätheten genom att dela kontroll över ett stort antal körfält, enligt ARM. Mali-G76 har 8 breda varp och totalt 24 FMA-banor per shaderkärna, medan Mali-G77 har 16 breda varp, 32 banor (två kluster med 16 FMA per exekveringsmotor) och en motor per shaderkärna. Detta resulterar i 33 % mer beräkning i samma område jämfört med G76, enligt företaget.
ARM uppger också att den förbättrade spelprestandan hos Mali-G77 är kopplad till quad texture mapper, som ger fyra texel/cykel, det vill säga 2x bättre genomströmning än Mali-G76 och 4x större än G72. Det sägs ge förbättringar över hela linjen när det gäller high-fidelity och casual gaming, men det kommer att ha en särskilt stor inverkan på texturtunga spel. Beräkningsförmågan hos G77 har utökats, så texturförmågan behövde också ökas för att hålla maskinen balanserad, enligt ARM. Slutmålet? Leverera mer prestanda per kvadratmillimeter än tidigare.
Mali-G77 har optimerats för att matcha de nya 16-wide exekveringsmotorerna och quad texture mapper. Denna optimering inkluderar en omdesign av LSC och attributröret med fokus på prestandatäthet och energieffektivitet.
ARM säger att de har ett "betydligt fokus" på att förbättra energieffektiviteten och främjar att Mali-G77 kan göra samma arbete i 50 % av energin i Mali-G72 från två år sedan. Enligt företaget ökar Valhall-arkitekturen och Mali-G77 energieffektiviteten över alla arbetsbelastningar, vilket leder till en förbättring med 1,3 gånger för "ett brett utbud av innehåll", vilket innebär att användare får längre batteritid på premium enheter.
ARM uppger att dynamisk instruktionsschemaläggning nu hanteras i hårdvara för att möjliggöra bättre prestanda. Den dynamiska schemaläggaren sägs bestämma vilka instruktioner som ska utföras från vilka förvrängningar, och arbetet skickas sedan till oberoende parallella ALU: er i superskalär stil.
Slutligen noterar ARM att Valhall-arkitekturen fortsätter utvecklingen av ARM Frame Buffer Compression genom AFBC 1.3. Det ger några nya funktioner som kan läsas i ARMs blogginlägg.
ARM har några stora löften för Mali-G77, och proklamerar att den kommer att ge betydande prestandaförbättringar i komplex AR och ML, och ger "kompromisslös grafikprestanda och ökad effektivitet." Om anspråken spelar ut kan vi äntligen se en ARM Mali GPU komma igång head to head med, eller till och med förbättra Adreno GPU för en given generation, och den mobila GPU-marknaden har bara blivit lite mer konkurrenskraftig.
Källa: ÄRM
Via: AnandTech