ARM pristato „Mali-G77“ GPU su nauja „Valhall“ GPU architektūra ir 1,4 karto didesniu našumo patobulinimu

ARM paskelbė apie Mali-G77 GPU. Ji pristato visiškai naują Valhall architektūrą, kuri pakeičia Bifrost architektūrą, kuri buvo pristatyta 2016 m.

ARM paskelbė apie Mali-G77 GPU kartu su Cortex-A77 CPU savo kasmetinėje TechDay. Nors Cortex-A77 yra reikšmingas kartos pažanga, palyginti su jo pirmtaku Cortex-A76, Mali-G77 GPU yra visiškai kitoks. Tai pirmasis GPU ARM Mali serijoje, kuriame įdiegta nauja GPU architektūra nuo Mali-G71, kuris 2016 m. pristatė Bifrost architektūrą. Mali-G77 atneša visiškai naują „Valhall“ architektūrą.

Nors ARM procesoriaus IP istoriškai buvo gana konkurencingas platesnėje išmaniųjų telefonų aplinkoje, Bendrovės Malio GPU serija sunkiai konkuravo su geriausiais savo klasės sprendimais metų. Ne kartą pasirodė, kad „Mali“ GPU serija našumo ir energijos vartojimo efektyvumo prasme nusileidžia „Adreno“ ir „Imagination Technologies“ PowerVR GPU. Bifrost architektūra pakeitė Midgard architektūrą, perjungdama nuo vektorinio tipo į skaliarinį. Deja, tai nepadėjo įveikti našumo ir energijos vartojimo efektyvumo atotrūkio, kuris, regis, didėjo. Mali-G71 ir Mali-G72 nukentėjo dėl pernelyg didelio energijos suvartojimo ir droselio, todėl padarė juos prastesnius už Qualcomm Adreno GPU ir Apple tinkintą GPU (pradedant nuo Apple A11).

Prastas GPU našumas tapo tokia svarbia problema, kad pardavėjai nežiūrėjo į nedidelį GPU padidėjimą, pasiektą po kartos. The Exynos 9810Pavyzdžiui, Mali-G72MP18 GPU buvo šiek tiek patobulintas, palyginti su jo pirmtaku. „Huawei“ „HiSilicon Group“ daug labiau kovojo su Malio GPU. HiSilicon Kirin 960 ir Kirin 970 buvo nuvilti dėl neįprastai daug energijos suvartojančių grafikos procesorių, o tiekiant santykinai mažiau našumas tiek, kad „Huawei“ buvo priverstas įdiegti netradicinį droselio mechanizmą, kuris paskatino atrandamas etalonas sukčiavimas keliems „Huawei“ telefonams pernai.

Laimei, praėjusių metų „Mali-G76“ gerokai pagerino našumą ir energijos vartojimo efektyvumą. Naudodamas 10 branduolių „Mali-G76“ versiją, „HiSilicon“ sugebėjo pažadėti 46 % našumo patobulinimus ir, nors bendrovė pasiekė našumo rodiklius, jis vis tiek negalėjo išlaikyti GPU našumo (tiek didžiausio, tiek nuolatinio našumo) taip pat galios efektyvumo karūna. „Samsung Systems LSI“ įdiegė 12 branduolių GPU versiją „Exynos 9820“ ir baigė mažinti skirtumą prie Qualcomm Snapdragon 855 Adreno 640 GPU. „Qualcomm“ „Adreno“ GPU išliko klasės lyderiais „Android“ rinkoje, tačiau „Apple“ praėjusiais metais buvo dar geresnis su „Apple A12“ tinkintu GPU. „Apple“ sugebėjo įveikti „Qualcomm“ tiek pagal didžiausią, tiek ilgalaikį našumą, o bendrovė taip pat demonstravo konkurencingą energijos vartojimo efektyvumą. Šiuo metu A12 GPU išlieka lyderis, o Snapdragon 855 Adreno 640 GPU užima antrąją vietą pagal daugumą etalonų.

Esant tokiai konkurencinei aplinkai, ARM turėjo paspartinti iššūkį.

To rezultatas buvo Mali-G77 ir nauja Valhall architektūra. ARM teigia, kad tai 30 % padidina našumo tankį, 30 % pagerina energijos vartojimo efektyvumą ir 60 % pagerina mašininį mokymąsi (ML). ARM tikisi, kad „Mali-G77“ mobiliuosiuose įrenginiuose užtikrins 40 % geresnį grafikos našumą.

Bendrovė tikisi, kad „Mali-G77“ suteiks daugiau aukščiausios klasės žaidimų mobiliuosiuose telefonuose, ir pažymi, kad 2018 m. metais, kai pajamos iš mobiliųjų žaidimų aplenkė pajamas iš žaidimų konsolėse ir kompiuteriuose laikas.

Kalbant apie ML, ARM teigia, kad „Mali-G77“ suteikia įrenginiams galimybę greičiau atlikti „vis sudėtingesnes“ ML užduotis, pagerinant našumo tankį 60%. Tai geriau nei siųsti juos į debesį apdoroti, o tai sukelia daugiau saugumo problemų ir sumažina našumą bei didesnį delsą.

Naujoji Valhall architektūra yra Mali-G77 ir būsimų Malio GPU pagrindas. ARM teigia, kad šios „Valhall“ savybės daro jį „naujoja architektūra“:

  • „Naujas superskaliarinis variklis, kuris užtikrina dar vieną energijos vartojimo efektyvumo ir našumo tankio šuolį
  • Supaprastinta skaliarinė ISA su nauju instrukcijų rinkiniu, kuris yra patogesnis kompiliatoriui
  • Naujas dinaminis instrukcijų planavimas
  • Perdirbtos duomenų struktūros, geriau suderintos su šiuolaikinėmis API, tokiomis kaip „Vulkan“.
  • Nors yra daug įvairių patobulinimų ir naujų funkcijų, dvi pagrindinės yra vykdymo variklis ir tekstūros žemėlapių sudarytojas Mali-G77.

Pasak ARM, plataus veikimo Mali-G77 varikliai padidina našumo tankį, nes dalijasi valdymu daugelyje eismo juostų. „Mali-G76“ turi 8 pločių metmenis ir iš viso 24 FMA juostas viename šešėlių šerdyje, o „Mali-G77“ turi 16 plačių metmenų, 32 juostas (dvi 16 FMA grupių vienam vykdomajam varikliui) ir vieną variklį viename šešėlių šerdyje. Anot bendrovės, toje pačioje srityje skaičiuojama 33 % daugiau, palyginti su G76.

ARM taip pat teigia, kad pagerintas „Mali-G77“ žaidimų našumas yra susijęs su keturių tekstūrų žemėlapiu, kuris suteikia keturis tekselius per ciklą, tai yra 2 kartus geresnis pralaidumas nei Mali-G76 ir 4 kartus didesnis nei G72. Teigiama, kad tai pagerins aukštos kokybės ir atsitiktinių žaidimų sritį, tačiau tai turės ypač didelį poveikį sudėtingiems žaidimams. G77 skaičiavimo galimybės buvo padidintos, todėl, pasak ARM, reikėjo padidinti ir tekstūros galimybes, kad įrenginys būtų subalansuotas. Galutinis tikslas? Pateikite didesnį našumą kvadratiniam milimetrui nei anksčiau.

Mali-G77 buvo optimizuotas, kad atitiktų naujus 16 pločio vykdymo variklius ir keturkampį tekstūros atvaizdavimo įrenginį. Šis optimizavimas apima LSC ir atributo vamzdžio perprojektavimą, daugiausia dėmesio skiriant veikimo tankiui ir energijos vartojimo efektyvumui.

ARM teigia, kad ji „didelį dėmesį skiria“ energijos vartojimo efektyvumo didinimui, ir skatina, kad Mali-G77 galėtų atlikti tą patį darbą su 50% Mali-G72 energijos, naudotos prieš dvejus metus. Bendrovės teigimu, Valhall architektūra ir Mali-G77 padidina energijos vartojimo efektyvumą atliekant visus darbo krūvius, todėl 1,3 karto patobulintas „įvairaus turinio asortimentas“, o tai reiškia, kad naudotojai turės ilgesnį akumuliatoriaus veikimo laiką su aukščiausios kokybės įranga prietaisai.

ARM teigia, kad dinaminis instrukcijų planavimas dabar tvarkomas aparatinėje įrangoje, kad būtų užtikrintas geresnis našumas. Teigiama, kad dinaminis planuoklis nusprendžia, kurias instrukcijas vykdyti iš kurių deformacijų, o tada darbas perduodamas nepriklausomiems lygiagretiesiems ALU superskaliariniu stiliumi.

Galiausiai ARM pažymi, kad Valhall architektūra tęsia ARM kadrų buferio suspaudimo evoliuciją per AFBC 1.3. Tai suteikia keletą naujų funkcijų, kurias galima perskaityti ARM tinklaraščio įraše.

ARM žada keletą didelių pažadų Mali-G77, skelbdamas, kad jis žymiai pagerins sudėtingų AR ir ML našumą. užtikrinti „bekompromisį grafikos našumą ir didesnį efektyvumą“. Jei pretenzijos pasitvirtins, pagaliau galime pamatyti ARM Mali GPU ar net tobulinant tam tikros kartos Adreno GPU, o mobiliųjų GPU rinka tapo šiek tiek daugiau konkurencingas.

Šaltinis: RANKA

Per: AnandTech