ARM on julkistanut Mali-G77 GPU: n. Se tuo upouuden Valhall-arkkitehtuurin, joka seuraa vuonna 2016 esiteltyä Bifrost-arkkitehtuuria.
ARM on julkistanut Mali-G77 GPU: n Cortex-A77 CPU: n rinnalla vuosittaisessa TechDay-tapahtumassaan. Vaikka Cortex-A77 on merkittävä sukupolvien edistysaskel edeltäjäänsä Cortex-A76 verrattuna, Mali-G77 GPU on jotain aivan muuta. Se on ensimmäinen GPU ARM: n Mali-valikoimassa, joka tuo uuden GPU-arkkitehtuurin Mali-G71:n jälkeen, joka toi Bifrost-arkkitehtuurin vuonna 2016. Mali-G77 tuo upouuden "Valhall"-arkkitehtuurin.
Vaikka ARM: n prosessorin IP on ollut historiallisesti melko kilpailukykyinen laajemmassa älypuhelinmaailmassa, Yrityksen Malin GPU-mallisto on kamppaillut luokkansa parhaiden ratkaisujen kanssa vuotta. Kerta toisensa jälkeen Mali-sarjan grafiikkasuorittimet osoittautuivat suorituskyvyltään ja tehotehokkuudeltaan huonommiksi kuin Adreno ja Imagination Technologiesin PowerVR GPU. Bifrost-arkkitehtuuri seurasi Midgard-arkkitehtuuria ja siirtyi vektorityypistä skalaarityyppiin. Valitettavasti se ei johtanut suorituskyvyn ja tehokkuuden eron voittamiseksi, joka näytti kasvavan suuremmaksi. Mali-G71 ja Mali-G72 kärsivät liian suuresta virrankulutuksesta ja kuristuksesta, mikä teki niistä huonompia kuin Qualcommin Adreno GPU ja Applen mukautettu GPU (alkaen Applesta A11).
Huono GPU-suorituskyky tuli niin merkittäväksi ongelmaksi, että toimittajat pitivät vähäisinä sukupolven jälkeen saavutettuja pieniä GPU-hyötyjä. The Exynos 9810Esimerkiksi Mali-G72MP18 GPU oli lievä parannus edeltäjäänsä. Huawein HiSilicon Group kamppaili paljon enemmän Malin GPU: iden kanssa. HiSilicon Kirin 960 ja Kirin 970 GPU: t kuluttivat epätavallisen paljon virtaa ja tuottivat samalla suhteellisen vähemmän suorituskykyä siinä määrin, että Huawei joutui ottamaan käyttöön epätavanomaisen kuristusmekanismin, joka johti benchmark-huijaaminen on havaittu useille Huawei-puhelimille viime vuonna.
Viime vuoden Mali-G76 paransi onneksi merkittävästi sekä suorituskykyä että tehokkuutta. Käyttämällä Mali-G76:n 10-ytimistä versiota HiSilicon pystyi lupaamaan 46 % suorituskyvyn parannuksia, ja vaikka yritys saavuttikin suoritusarvot, se ei vieläkään kestänyt GPU-suorituskykyä (sekä huippu- että jatkuva suorituskyky) sekä tehotehokkuuden kruunu. Samsung Systems LSI otti käyttöön 12-ytimisen GPU: n version Exynos 9820:ssa, ja päätyi kaventamaan eroa kohtaan Qualcomm Snapdragon 855:n Adreno 640 GPU. Qualcommin Adreno GPU: t ovat pysyneet luokkansa johtajina Android-markkinoilla, mutta Apple parani viime vuonna Apple A12:n mukautetulla GPU: lla. Apple pystyi päihittämään Qualcommin sekä huipun että jatkuvan suorituskyvyn suhteen, ja yhtiö esitteli myös kilpailukykyisen tehokkuuden. Tällä hetkellä A12:n grafiikkasuoritin on edelleen johtava, kun taas Snapdragon 855:n Adreno 640 GPU sijoittuu toiseksi useimmissa vertailuissa.
Tämän kilpailuympäristön edessä ARM: n täytyi vastata haasteeseen.
Tuloksena oli Mali-G77 ja uusi Valhall-arkkitehtuuri. ARM sanoo, että se parantaa suorituskykyä 30 prosenttia, parantaa energiatehokkuutta 30 prosenttia ja koneoppimista (ML) 60 prosenttia. ARM odottaa Mali-G77-pohjaisen tarjoavan 40 % paremman näytönohjaimen huippusuorituskyvyn mobiililaitteissa.
Yhtiö odottaa Mali-G77:n tuovan enemmän huippuluokan pelaamista matkapuhelimiin, ja toteaa, että 2018 oli vuonna, jolloin mobiilipelaamisesta saadut tulot ohittivat konsoli- ja PC-pohjaisten pelien tuotot aika.
Mitä tulee ML: ään, ARM sanoo, että Mali-G77 tarjoaa laitteille kyvyn suorittaa "yhtyväisempään monimutkaisempia" ML-tehtäviä laitteessa 60 prosentin suoritustiheyden parannuksella. Tämä on parempi kuin lähettää ne pilveen käsittelyä varten, mikä johtaa enemmän tietoturvaongelmiin ja suorituskyvyn heikkenemiseen sekä korkeampaan latenssiin.
Uusi Valhall-arkkitehtuuri on Mali-G77:n ja tulevien Mali GPU: iden perusta. ARM sanoo, että seuraavat Valhallin ominaisuudet tekevät siitä "uuden arkkitehtuurin":
- "Uusi superskalaarimoottori, joka tarjoaa uuden harppauksen energiatehokkuudessa ja suorituskykytiheydessä
- Yksinkertaistettu skalaari-ISA, jossa on uusi käskysarja, joka on kääntäjäystävällisempi
- Uusi dynaaminen ohjeiden ajoitus
- Muokatut tietorakenteet paremmin nykyaikaisten API: iden, kuten Vulkanin, mukaisiksi.
- Vaikka on olemassa monia erilaisia edistysaskeleita ja uusia ominaisuuksia, kaksi keskeistä ovat suoritusmoottori ja pintakuviokartoittaja Mali-G77:ssä."
ARM: n mukaan Mali-G77:n laajat suoritusmoottorit parantavat suorituskyvyn tiheyttä jakamalla hallinnan useilla kaistalla. Mali-G76:ssa on 8 leveää loimia ja yhteensä 24 FMA-kaistaa varjostimen ydintä kohden, kun taas Mali-G77:ssä on 16 leveää loimia, 32 kaistaa (kaksi 16 FMA: n ryhmää suoritusmoottoria kohti) ja yksi moottori varjostimen ydintä kohti. Yhtiön mukaan tämä johtaa 33 % enemmän laskemiseen samalla alueella verrattuna G76-maihin.
ARM toteaa myös, että Mali-G77:n parannettu pelisuorituskyky liittyy neliväriseen pintakuviokartoittimeen, joka tarjoaa neljä tekseliä/jakso, eli 2x parempi suorituskyky kuin Mali-G76 ja 4x suurempi kuin G72. Sen sanotaan tarjoavan parannuksia kaikkialla high-fidelity- ja casual-pelaamisessa, mutta sillä on erityisen suuri vaikutus tekstuurisiin raskaisiin peleihin. G77:n laskentakykyä on lisätty, joten pintakuviointikykyä oli myös lisättävä, jotta kone pysyisi tasapainossa, ARM: n mukaan. Lopullinen tavoite? Tuottaa enemmän suorituskykyä neliömillimetriä kohti kuin ennen.
Mali-G77 on optimoitu vastaamaan uusia 16-laajuisia suoritusmoottoreita ja nelikuviokartoitinta. Tämä optimointi sisältää LSC: n ja ominaisuusputken uudelleensuunnittelun, jossa keskitytään suorituskykytiheyteen ja energiatehokkuuteen.
ARM sanoo, että se keskittyy "merkittävästi" energiatehokkuuden parantamiseen ja edistää sitä, että Mali-G77 voi tehdä saman työn 50 prosentilla Mali-G72:n kahden vuoden takaisesta energiasta. Yhtiön mukaan Valhall-arkkitehtuuri ja Mali-G77 lisäävät energiatehokkuutta kaikissa työkuormissa, mikä johtaa 1,3-kertainen parannus "laissa sisällössä", mikä tarkoittaa, että käyttäjät pidentävät akun kestoa premium-hintaan laitteet.
ARM toteaa, että dynaamista käskyjen ajoitusta käsitellään nyt laitteistossa paremman suorituskyvyn mahdollistamiseksi. Dynaamisen ajoittimen sanotaan päättävän, mitkä käskyt suoritetaan mistäkin vääntymisestä, ja työ lähetetään sitten itsenäisille rinnakkaisille ALU: ille superskalaarityyliin.
Lopuksi ARM huomauttaa, että Valhall-arkkitehtuuri jatkaa ARM Frame Buffer Compression kehitystä AFBC 1.3:n kautta. Se tuo joitain uusia ominaisuuksia, jotka voidaan lukea ARM: n blogikirjoituksesta.
ARM: lla on suuria lupauksia Mali-G77:lle ja julistetaan, että se tuo merkittäviä suorituskykyparannuksia monimutkaisiin AR- ja ML-ominaisuuksiin. tarjoavat "kompromissitonta grafiikkasuoritusta ja parempaa tehokkuutta". Jos väitteet toteutuvat, saatamme vihdoin nähdä ARM Mali -grafiikkasuorittimen toiminnassa Tietyn sukupolven Adreno-grafiikkasuorittimen parantaminen tai jopa parantaminen, ja mobiili-GPU-markkinoista tulee vain hieman enemmän kilpailukykyinen.
Lähde: ARM
Kautta: AnandTech