ARM oznamuje GPU Mali-G77 s novou architekturou GPU „Valhall“ a 1,4násobným vylepšením výkonu

ARM oznámila GPU Mali-G77. Přináší zcela novou architekturu Valhall, která následuje po architektuře Bifrost, která byla představena v roce 2016.

Společnost ARM oznámila na svém výročním TechDay GPU Mali-G77 spolu s CPU Cortex-A77. Zatímco Cortex-A77 představuje významný generační pokrok oproti svému předchůdci Cortex-A76, GPU Mali-G77 je něco úplně jiného. Je to první GPU v řadě Mali od ARM, který přináší novou architekturu GPU od Mali-G71, který přinesl architekturu Bifrost v roce 2016. Mali-G77 přináší zcela novou architekturu „Valhall“.

Ačkoli IP CPU ARM byla historicky docela konkurenceschopná v širším prostředí smartphonů, řada GPU společnosti Mali se snažila konkurovat nejlepším řešením ve své třídě let. Znovu a znovu se ukázalo, že řada GPU Mali je z hlediska výkonu a energetické účinnosti horší než GPU PowerVR od jejich Adreno a Imagination Technologies. Architektura Bifrost nahradila architekturu Midgard a přešla z vektorového typu na skalární. Bohužel to nevedlo k překonání mezery ve výkonu a energetické účinnosti, která se zdánlivě zvětšovala. Mali-G71 a Mali-G72 trpěly nadměrně vysokou spotřebou energie a škrcení, což učinil je horší než GPU Adreno od Qualcommu a vlastní GPU od Apple (počínaje Apple A11).

Špatný výkon GPU se stal tak závažným problémem, že prodejci shlíželi na vyhlídky na menší zisky GPU dosažené po generaci. The Exynos 9810Například GPU Mali-G72MP18 bylo mírným vylepšením od svého předchůdce. Skupina HiSilicon od Huawei se potýkala s GPU Mali v mnohem větší míře. HiSilicon Kirin 960 a Kirin 970 byly zklamány tím, že GPU spotřebovávaly abnormálně vysoké množství energie a přitom poskytovaly relativně méně výkon, do té míry, že Huawei byl nucen zavést nekonvenční škrtící mechanismus, což vedlo k bylo odhaleno podvádění srovnávacích testů pro několik telefonů Huawei v loňském roce.

Loňský Mali-G76 naštěstí přinesl podstatná vylepšení jak na frontě výkonu, tak energetické účinnosti. Pomocí 10jádrové verze Mali-G76 byl HiSilicon schopen slíbit 46% zlepšení výkonu, a přestože společnost dosáhla výkonových čísel, stále nebyl schopen převzít výkon GPU (jak špičkový, tak trvalý výkon) stejně jako koruna energetické účinnosti. Samsung Systems LSI implementoval 12jádrovou verzi GPU v Exynos 9820 a skončilo zúžením mezery k GPU Qualcomm Snapdragon 855 Adreno 640. GPU Adreno od Qualcommu zůstaly lídry ve své třídě na trhu Android, ale Apple se minulý rok zlepšil s vlastním GPU Apple A12. Apple dokázal porazit Qualcomm jak z hlediska špičkového, tak trvalého výkonu a společnost také předvedla konkurenceschopnou energetickou účinnost. V současné době zůstává GPU A12 lídrem, zatímco GPU Adreno 640 Snapdragon 855 je ve většině benchmarků na druhém místě.

Tváří v tvář tomuto konkurenčnímu prostředí musela společnost ARM zrychlit, aby se s touto výzvou vyrovnala.

Výsledkem toho byl Mali-G77 a nová architektura Valhall. ARM říká, že přináší 30% zvýšení hustoty výkonu, 30% zlepšení energetické účinnosti a 60% zlepšení pro strojové učení (ML). ARM očekává, že platforma Mali-G77 poskytne o 40 % lepší špičkový grafický výkon v mobilních zařízeních.

Společnost očekává, že Mali-G77 přinese více špičkových her do mobilních telefonů, a poznamenává, že rok 2018 byl rok, kdy výnosy z mobilního hraní poprvé překonaly výnosy z hraní na konzolích a PC čas.

Pokud jde o ML, ARM říká, že Mali-G77 poskytuje zařízením schopnost provádět "stále složitější" úkoly ML rychleji na zařízení s 60% zlepšením hustoty výkonu. Je to lepší, než je posílat ke zpracování do cloudu, což vede k větším obavám o zabezpečení a snížení výkonu a také k vyšší latenci.

Nová architektura Valhall je základem Mali-G77 a budoucích GPU Mali. ARM říká, že následující vlastnosti z Valhallu dělají „novou architekturu“:

  • „Nový superskalární motor, který přináší další skok v energetické účinnosti a hustotě výkonu
  • Zjednodušený skalární ISA s novou instrukční sadou, která je kompilátorově přívětivější
  • Nové dynamické plánování instrukcí
  • Přepracované datové struktury lépe sladěné s moderními API, jako je Vulkan.
  • I když existuje mnoho různých vylepšení a nových funkcí, dvě klíčové jsou prováděcí engine a mapovač textur v Mali-G77."

Široké provedení motorů Mali-G77 zlepšuje hustotu výkonu díky sdílení kontroly nad širokým počtem jízdních pruhů, podle ARM. Mali-G76 má 8 širokých warpů a celkem 24 FMA pruhů na jádro shaderu, zatímco Mali-G77 má 16 širokých warpů, 32 pruhů (dva shluky 16 FMA na prováděcí engine) a jeden engine na jádro shaderu. To má za následek o 33 % více výpočtů ve stejné oblasti ve srovnání s G76, podle společnosti.

ARM také uvádí, že zlepšený herní výkon Mali-G77 souvisí s mapovačem čtyř textur, který poskytuje čtyři texely/cyklus, což je 2x lepší propustnost než Mali-G76 a 4x větší než G72. Říká se, že poskytuje vylepšení v oblasti vysoce věrného a příležitostného hraní, ale bude mít obzvláště velký dopad na hry s vysokou texturou. Výpočetní schopnost G77 byla zvýšena, takže podle ARM bylo potřeba zvýšit také schopnost textury, aby byl stroj vyvážený. Konečný cíl? Poskytujte vyšší výkon na čtvereční milimetr než dříve.

Mali-G77 byl optimalizován tak, aby odpovídal novým 16-širokým prováděcím enginům a mapovači čtyř textur. Tato optimalizace zahrnuje přepracování LSC a atributového potrubí se zaměřením na hustotu výkonu a energetickou účinnost.

ARM říká, že se „významně zaměřuje“ na zlepšení energetické účinnosti, a propaguje, že Mali-G77 může udělat stejnou práci s 50 % energie Mali-G72 z doby před dvěma lety. Podle společnosti architektura Valhall a Mali-G77 zvyšují energetickou účinnost při všech pracovních zátěžích, což vede k 1,3násobné zlepšení v rámci „široké škály obsahu“, což znamená, že uživatelé získají za prémii delší výdrž baterie zařízení.

ARM uvádí, že dynamické plánování instrukcí je nyní řešeno hardwarově, aby byl umožněn lepší výkon. O dynamickém plánovači se říká, že rozhoduje o tom, které instrukce se mají z jakých warps provést, a práce je pak vydána nezávislým paralelním ALU v superskalárním stylu.

A konečně, ARM poznamenává, že architektura Valhall pokračuje ve vývoji ARM Frame Buffer Compression prostřednictvím AFBC 1.3. Přináší některé nové funkce, které si můžete přečíst v příspěvku na blogu ARM.

ARM má pro Mali-G77 několik velkých slibů a prohlašuje, že přinese výrazné zlepšení výkonu v komplexních AR a ML. poskytují "nekompromisní grafický výkon a zvýšenou efektivitu." Pokud se tvrzení projeví, možná se konečně dočkáme GPU ARM Mali v čele s GPU Adreno dané generace, nebo dokonce lepší, a trh s mobilními GPU se prostě stal o něco více konkurenční.

Zdroj: PAŽE

Přes: AnandTech