Az ARM bejelentette a Mali-G77 GPU-t. A vadonatúj Valhall architektúrát hozza, amely a 2016-ban bemutatott Bifrost architektúrát követi.
Az ARM az éves TechDay rendezvényén bejelentette a Mali-G77 GPU-t a Cortex-A77 CPU mellett. Míg a Cortex-A77 jelentős generációs előrelépést jelent elődjéhez, a Cortex-A76-hoz képest, addig a Mali-G77 GPU valami egészen más. Ez az első GPU az ARM mali termékcsaládjában, amely új GPU-architektúrát hozott a Mali-G71 óta, amely 2016-ban hozta a Bifrost architektúrát. A Mali-G77 a vadonatúj "Valhall" architektúrát hozza el.
Bár az ARM CPU IP-je történelmileg meglehetősen versenyképes volt az okostelefonok szélesebb környezetében, a cég mali GPU-kínálata küzdött, hogy versenyezzen kategóriája legjobb megoldásaival évek. A Mali sorozatú GPU-k újra és újra bebizonyították, hogy teljesítmény és energiahatékonyság tekintetében alulmúlják az Adreno és az Imagination Technologies PowerVR GPU-it. A Bifrost architektúra a Midgard architektúrát követte, vektoros típusról skaláris típusra váltott. Sajnos nem sikerült áthidalni a teljesítmény és az energiahatékonyság közötti különbséget, amely látszólag egyre nagyobb volt. A Mali-G71 és a Mali-G72 túlzottan magas energiafogyasztástól és fojtástól szenvedett, ami alacsonyabb rendűvé tette őket a Qualcomm Adreno GPU-inál és az Apple egyedi GPU-jánál (az Apple-től kezdve A11).
A gyenge GPU-teljesítmény olyan jelentős problémává vált, hogy a gyártók lenézték az egy generáció után elért kisebb GPU-növekedést. A Exynos 9810A Mali-G72MP18 GPU például enyhe fejlesztést jelentett elődjéhez képest. A Huawei HiSilicon Group sokkal nagyobb mértékben küzdött a mali GPU-kkal. A HiSilicon Kirin 960 és a Kirin 970 cserbenhagyták a GPU-k, amelyek abnormálisan sok energiát fogyasztanak, miközben viszonylag kevesebbet adtak teljesítmény, olyan mértékben, hogy a Huawei egy nem szokványos fojtómechanizmus bevezetésére kényszerült, ami oda vezetett benchmark csalást fedeztek fel tavaly több Huawei telefonra.
A tavalyi Mali-G76 szerencsére jelentős javulást hozott mind a teljesítmény, mind az energiahatékonyság terén. A Mali-G76 10 magos verzióját használva a HiSilicon 46%-os teljesítményjavulást tudott ígérni, és bár a vállalat elérte a teljesítményszámokat, még mindig nem tudta elviselni a GPU teljesítményét (mind a csúcs, mind a tartós teljesítmény) valamint energiahatékonysági korona. A Samsung Systems LSI a GPU 12 magos változatát implementálta az Exynos 9820-ban, és végül csökkentette a szakadékot hoz Qualcomm Snapdragon 855 Adreno 640 GPU. A Qualcomm Adreno GPU-i továbbra is az osztályvezetők maradtak az Android piacon, de az Apple tavaly eggyel jobban ment az Apple A12 egyedi GPU-jával. Az Apple a csúcsteljesítmény és a tartós teljesítmény tekintetében is legyőzte a Qualcommot, és a vállalat versenyképes energiahatékonyságot is bemutatott. Jelenleg az A12 GPU-ja továbbra is a vezető, míg a Snapdragon 855 Adreno 640 GPU-ja a legtöbb benchmark második helyén áll.
Ebben a versenykörnyezetben az ARM-nek fel kellett lépnie, hogy megfeleljen a kihívásnak.
Ennek eredménye a Mali-G77 és az új Valhall architektúra. Az ARM szerint 30%-kal növeli a teljesítménysűrűséget, 30%-kal javítja az energiahatékonyságot, és 60%-kal javítja a gépi tanulást (ML). Az ARM arra számít, hogy a Mali-G77 alapú 40%-kal jobb grafikus csúcsteljesítményt nyújt a mobileszközökön.
A cég arra számít, hogy a Mali-G77 több csúcskategóriás játékot hoz majd a mobiltelefonokba, és megjegyzi, hogy 2018. az az év, amikor a mobiljátékokból származó bevételek először megelőzték a konzolos és PC-alapú játékokból származó bevételeket idő.
Ami az ML-t illeti, az ARM azt állítja, hogy a Mali-G77 olyan képességekkel rendelkezik az eszközök számára, hogy gyorsabban hajtsanak végre "egyre bonyolultabb" ML feladatokat az eszközön, 60%-os teljesítménysűrűség-növekedés mellett. Ez jobb, mintha a felhőbe küldené őket feldolgozásra, ami több biztonsági aggályhoz és csökkent teljesítményhez, valamint magasabb késleltetéshez vezet.
Az új Valhall architektúra a Mali-G77 és a jövőbeli Mali GPU alapja. Az ARM szerint a Valhall következő jellemzői "újszerű architektúrává" teszik:
- "Egy új szuperskaláris motor, amely újabb ugrást tesz az energiahatékonyság és a teljesítménysűrűség terén
- Egy egyszerűsített skaláris ISA új, fordítóbarátabb utasításkészlettel
- Az utasítások új dinamikus ütemezése
- Átdolgozott adatstruktúrák, amelyek jobban illeszkednek a modern API-khoz, például a Vulkanhoz.
- Noha sok különböző fejlesztés és új funkció létezik, a két legfontosabb a Mali-G77 végrehajtó motorja és textúratérképezője."
Az ARM szerint a Mali-G77 széles kivitelű motorjai javítják a teljesítménysűrűséget azáltal, hogy számos sáv felett megosztják az irányítást. A Mali-G76-nak 8 széles warpja van, és shader magonként összesen 24 FMA-sáv, míg a Mali-G77-nek 16 széles warp-ja, 32 sávja (végrehajtómotoronként két 16 FMA-s klaszter) és shader magonként egy motor. A vállalat szerint ez 33%-kal több számítást eredményez ugyanazon a területen a G76-hoz képest.
Az ARM azt is kijelenti, hogy a Mali-G77 jobb játékteljesítménye a négyes textúratérképezőhöz kapcsolódik, amely négy texelt biztosít ciklusonként, ami kétszer jobb átviteli sebességet jelent, mint a Mali-G76 és 4x nagyobb, mint a G72. Állítólag a high-fidelity és a casual játékok terén nyújt fejlesztéseket, de különösen nagy hatással lesz a textúrájú, nehéz játékokra. A G77 számítási képességét növelték, így a textúra képességét is növelni kellett, hogy a gép egyensúlyban maradjon az ARM szerint. A végcél? A korábbinál nagyobb teljesítmény négyzetmilliméterenként.
A Mali-G77-et úgy optimalizálták, hogy illeszkedjen az új, 16 széles végrehajtó motorokhoz és a négyes textúra-leképezőhöz. Ez az optimalizálás magában foglalja az LSC és az attribútumcső újratervezését, a teljesítménysűrűségre és az energiahatékonyságra összpontosítva.
Az ARM azt állítja, hogy "jelentős hangsúlyt fektet" az energiahatékonyság javítására, és elősegíti, hogy a Mali-G77 ugyanazt a munkát tudja elvégezni a két évvel ezelőtti Mali-G72 energiájának 50%-ában. A vállalat szerint a Valhall architektúra és a Mali-G77 minden munkaterhelésnél növeli az energiahatékonyságot, ami 1,3-szoros javulás „a tartalom széles skáláján”, ami azt jelenti, hogy a felhasználók hosszabb akkumulátor-élettartamot kapnak prémium kategóriás áron eszközöket.
Az ARM kijelenti, hogy a dinamikus utasításütemezést most már hardverben kezelik a jobb teljesítmény érdekében. Állítólag a dinamikus ütemező dönti el, hogy melyik vetemítésből mely utasításokat hajtsa végre, majd a munkát független párhuzamos ALU-knak adják ki szuperskaláris stílusban.
Végül az ARM megjegyzi, hogy a Valhall architektúra folytatja az ARM Frame Buffer Compression fejlesztését az AFBC 1.3-on keresztül. Néhány új funkciót hoz, amelyek az ARM blogbejegyzésében olvashatók.
Az ARM nagy ígéreteket tesz a Mali-G77-tel kapcsolatban, és azt hirdeti, hogy jelentős teljesítményjavulást fog hozni az összetett AR és ML terén. "kompromisszumok nélküli grafikus teljesítményt és megnövelt hatékonyságot biztosít." Ha az állítások beigazolódnak, végre láthatunk egy ARM Mali GPU-t egy adott generáció Adreno GPU-jával, vagy akár jobbá tételével, és a mobil GPU-piac egy kicsit több lett kompetitív.
Forrás: KAR
Keresztül: AnandTech