ARM oznámila GPU Mali-G77. Prináša úplne novú architektúru Valhall, ktorá nasleduje po architektúre Bifrost, ktorá bola predstavená v roku 2016.
Spoločnosť ARM oznámila na svojom výročnom TechDay GPU Mali-G77 spolu s procesorom Cortex-A77. Zatiaľ čo Cortex-A77 predstavuje významný generačný pokrok oproti svojmu predchodcovi Cortex-A76, GPU Mali-G77 je niečo úplne iné. Je to prvý GPU v zostave Mali od ARM, ktorý prináša novú architektúru GPU od Mali-G71, ktorý priniesol architektúru Bifrost v roku 2016. Mali-G77 prináša úplne novú architektúru „Valhall“.
Hoci IP CPU ARM bola historicky dosť konkurencieschopná v širšom prostredí smartfónov, zostava GPU spoločnosti Mali sa snažila konkurovať najlepším riešeniam vo svojej triede rokov. Znova a znova sa ukázalo, že séria GPU Mali je z hľadiska výkonu a energetickej účinnosti nižšia ako GPU PowerVR od Adreno a Imagination Technologies. Architektúra Bifrost nahradila architektúru Midgard a prešla z vektorového typu na skalárny typ. Bohužiaľ to neviedlo k prekonaniu medzery vo výkone a energetickej účinnosti, ktorá sa zdanlivo zväčšovala. Mali-G71 a Mali-G72 trpeli nadmerne vysokou spotrebou energie a škrtením, čo urobili z nich menejcenné ako GPU Adreno od Qualcommu a vlastné GPU od Apple (počnúc s Apple A11).
Nízky výkon GPU sa stal takým závažným problémom, že predajcovia sa pozerali na vyhliadky na menšie zisky GPU dosiahnuté po generácii. The Exynos 9810Napríklad GPU Mali-G72MP18 GPU bolo mierne zlepšenie oproti svojmu predchodcovi. Skupina HiSilicon od Huawei bojovala s GPU Mali v oveľa väčšej miere. HiSilicon Kirin 960 a Kirin 970 boli sklamané tým, že GPU spotrebovávali abnormálne vysoké množstvo energie a zároveň poskytovali relatívne menej výkon, do tej miery, že Huawei bol nútený zaviesť nekonvenčný škrtiaci mechanizmus, čo viedlo k odhalenie benchmarkového podvádzania pre niekoľko telefónov Huawei v minulom roku.
Minuloročný Mali-G76, našťastie, priniesol podstatné vylepšenia z hľadiska výkonu aj energetickej účinnosti. Použitím 10-jadrovej verzie Mali-G76 bol HiSilicon schopný sľúbiť 46% vylepšenie výkonu a aj keď spoločnosť dosiahla výkonnostné čísla, stále nebol schopný dosiahnuť výkon GPU (špičkový aj trvalý výkon) ako aj koruna energetickej účinnosti. Samsung Systems LSI implementoval 12-jadrovú verziu GPU v Exynos 9820 a skončilo zúžením medzery k GPU Adreno 640 od Qualcomm Snapdragon 855. GPU Adreno od Qualcommu zostali lídrami v triede na trhu s Androidom, ale Apple sa minulý rok zlepšil s vlastným GPU Apple A12. Apple dokázal poraziť Qualcomm z hľadiska špičkového aj trvalého výkonu a spoločnosť predviedla aj konkurenčnú energetickú účinnosť. V súčasnosti GPU A12 zostáva lídrom, zatiaľ čo GPU Adreno 640 Snapdragon 855 je vo väčšine benchmarkov na druhom mieste.
Tvárou v tvár tomuto konkurenčnému prostrediu sa ARM potrebovala zintenzívniť, aby mohla čeliť tejto výzve.
Výsledkom bol Mali-G77 a nová architektúra Valhall. ARM hovorí, že prináša 30% zvýšenie hustoty výkonu, 30% zlepšenie energetickej účinnosti a 60% zlepšenie strojového učenia (ML). ARM očakáva od Mali-G77, že poskytne o 40 % lepší špičkový grafický výkon v mobilných zariadeniach.
Spoločnosť očakáva, že Mali-G77 prinesie viac špičkových hier do mobilných telefónov a poznamenáva, že rok 2018 bol rok, kedy príjmy z mobilného hrania prvýkrát prekonali príjmy z hrania na konzolách a PC čas.
Pokiaľ ide o ML, ARM hovorí, že Mali-G77 poskytuje zariadeniam schopnosť vykonávať "stále zložitejšie" úlohy ML rýchlejšie na zariadení so 60% zlepšením hustoty výkonu. Je to lepšie, ako ich posielať na spracovanie do cloudu, čo vedie k väčším obavám o bezpečnosť a zníženiu výkonu, ako aj k vyššej latencii.
Nová architektúra Valhall je základom Mali-G77 a budúcich GPU Mali. ARM hovorí, že nasledujúce vlastnosti Valhall z neho robia „novú architektúru“:
- „Nový superskalárny motor, ktorý prináša ďalší skok v energetickej účinnosti a hustote výkonu
- Zjednodušený skalárny ISA s novou inštrukčnou sadou, ktorá je pre kompilátor vhodnejšia
- Nové dynamické plánovanie pokynov
- Prepracované dátové štruktúry lepšie zosúladené s modernými API, ako je Vulkan.
- Aj keď existuje mnoho rôznych vylepšení a nových funkcií, dve kľúčové sú vykonávací engine a mapovač textúr v Mali-G77."
Široké výkonné motory Mali-G77 zlepšujú hustotu výkonu zdieľaním kontroly nad širokým počtom jazdných pruhov, podľa ARM. Mali-G76 má 8 širokých warpov a celkovo 24 FMA pruhov na shader jadro, zatiaľ čo Mali-G77 má 16 širokých warpov, 32 pruhov (dva zhluky po 16 FMA na spúšťací engine) a jeden engine na shader jadro. To má za následok o 33 % viac výpočtov v rovnakej oblasti v porovnaní s G76, podľa spoločnosti.
ARM tiež uvádza, že zlepšený herný výkon Mali-G77 je spojený so štvornásobným mapovačom textúr, ktorý poskytuje štyri texely/cyklus, čo je 2x lepšia priepustnosť ako Mali-G76 a 4x väčšia ako G72. Hovorí sa, že poskytuje vylepšenia vo všetkých oblastiach s vysokou presnosťou a príležitostným hraním, ale bude mať obzvlášť veľký vplyv na hry s vysokou textúrou. Výpočtová schopnosť G77 bola zvýšená, takže podľa ARM bolo potrebné zvýšiť aj schopnosť textúry, aby bol stroj vyvážený. Konečný cieľ? Podávajte viac výkonu na štvorcový milimeter ako predtým.
Mali-G77 bol optimalizovaný tak, aby zodpovedal novým 16-širokým exekučným modulom a mapovaču textúr quad. Táto optimalizácia zahŕňa prepracovanie LSC a atribútového potrubia so zameraním na hustotu výkonu a energetickú účinnosť.
ARM hovorí, že má „významné zameranie“ na zlepšenie energetickej účinnosti a propaguje, že Mali-G77 dokáže urobiť rovnakú prácu s 50 % energie Mali-G72 spred dvoch rokov. Podľa spoločnosti architektúra Valhall a Mali-G77 zvyšujú energetickú účinnosť pri všetkých pracovných zaťaženiach, čo vedie k 1,3-násobné zlepšenie v rámci „širokej škály obsahu“, čo znamená, že používatelia získajú vyššiu výdrž batérie za prémiu zariadení.
ARM uvádza, že dynamické plánovanie inštrukcií je teraz spracované hardvérom, aby sa umožnil lepší výkon. O dynamickom plánovači sa hovorí, že rozhoduje o tom, ktoré inštrukcie sa majú vykonať z ktorých warps, a práca sa potom vydáva nezávislým paralelným ALU v superskalárnom štýle.
Nakoniec ARM poznamenáva, že architektúra Valhall pokračuje vo vývoji ARM Frame Buffer Compression prostredníctvom AFBC 1.3. Prináša niekoľko nových funkcií, ktoré si môžete prečítať v blogovom príspevku ARM.
ARM má niekoľko veľkých prísľubov pre Mali-G77 a vyhlasuje, že prinesie výrazné zlepšenie výkonu v komplexných AR a ML a poskytujú "nekompromisný grafický výkon a zvýšenú efektivitu." Ak sa tvrdenia uskutočnia, môžeme konečne vidieť GPU ARM Mali porovnať alebo dokonca zlepšiť GPU Adreno danej generácie a trh s mobilnými GPU sa stal o niečo viac konkurencieschopný.
Zdroj: ARM
Cez: AnandTech