ARM julkistaa Cortex-A78 CPU: n, Mali-G78 GPU: n ja Ethos N78 NPU: n

click fraud protection

ARM on julkistanut Cortex-A78 CPU -arkkitehtuurin sekä Mali-G78 GPU: n. Molemmat ovat Cortex-A77 CPU: n ja Mali-G77 GPU: n seuraajia.

ARM on tehnyt kolme suurta ilmoitusta osana TechDay 2020 -tapahtumaansa. Suurin otsikkoilmoitus on Cortex-X Custom -ohjelma (CXC), joka sisältää uuden Cortex-X1 CPU-ydin. Cortex-X1 tuo korkeamman huippusuorituskyvyn kuin mikään Cortex-A-sarjan prosessori, samalla kun se rikkoo Cortex-A-sarjan PPA: n verhon. Kaksi muuta ARM: n tekemää ilmoitusta olivat paljon rutiinisempia. Cortex-A78 CPU ja Mali-G78 CPU ovat nyt virallisia, ja ne toimivat seuraajina Cortex-A77 CPU ja Mali-G77 CPU vastaavasti. Käsitellään nämä ilmoitukset yksitellen:

ARM Cortex-A78

Cortex-A78:ssa ARM: n pääpaino oli tehokkuusvaatimuksissa, kuten pidempi akun käyttöikä, uudet mobiilimuodot ja kutistuvat SoC-alueet. Jatkuva suorituskyky on avainsana tässä Cortex-A78:ssa, kun taas Cortex-X1 ampuu tähtiä tavoitteenaan saavuttaa maksimaalinen lyhytaikainen huippusuorituskyky.

ARM sanoo, että Cortex-78 edustaa sen "erittäin parasta" huippuluokan suorituskykyä luokkansa parhaalla tehokkuudella. Nämä eivät myöskään ole vain tyhjiä sanoja. Parin viime vuoden ajan Cortex-A76 ja Cortex-A77 ovat osoittaneet luokkansa parhaan energiatehokkuuden ja luokkansa parhaan PPA: n (suorituskyky, teho ja pinta-ala). Heillä ei ollut vaadittua suunnittelua kilpailemaan Applen A-sarjan sirujen kanssa, mutta alhaisemman takia Niiden energiatehokkuus oli pahimmillaan sama kuin Applella ja parhaimmillaan jopa korkeampi kuin Omena.

A78:n suorituskyvyn parannukset kattavat tuottavuuden, viestinnän, turvallisuuden ja kamerapohjaisten tehtävien käyttötapaukset, edistyneet pelit, XR- ja ML-pohjaiset kokemukset.

Jatkuvassa suorituskyvyssä Cortex-A78 tuo kaksinumeroisia parannuksia. Se tarjoaa 20 % paremman jatkuvan suorituskyvyn edeltäjäänsä Cortex-A77 verrattuna samassa liikkuvassa lämpötehoverhossa. AnandTech kävi numerot läpi ja selitti, että 20 %:n luku on yhdistelmä 7 % korkeammasta IPC: stä A77:ään verrattuna, kun taas Loput 13 % suorituskyvyn lisäykset lasketaan 5 nm: n prosessissa, jossa kaikki seuraavan sukupolven SoC: t valmistettu. ARM toteaa jatkuvan suorituskyvyn tärkeyden sanomalla, että mobiililaitteiden kapasiteetti on rajallinen haihduttavat tehoa, ja jatkuva suorituskyky välttää tehon kuristamisen sovelluksissa, jotka vaativat paljon tehoa. Tämä puolestaan ​​parantaa käyttökokemusta välttämällä viivettä tai kehysten putoamista.

Tehotehokkuuden parantaminen merkitsee korkeampaa energiatehokkuutta, koska nämä kaksi liittyvät toisiinsa, mutta erilaiset käsitteet. ARM: n mukaan Cortex-A78 tarjoaa 50 %:n energiansäästön vuoden 2019 laitteisiin verrattuna korkean suorituskyvyn pisteissä, kuten nykyisten mobiililaitteiden huippupisteissä. samassa esityksessä kuten Cortex-A77. Tämä on vaikuttavaa ja tekee A78:sta energiatehokkaimman Cortex-A CPU ARM: n, jonka on koskaan suunnitellut.

ARM: n keskittyminen kestävään suorituskykyyn hyödyttää mobiiliinnovaatioiden seuraavaa aaltoa, kuten uusia muototekijöitä (taitettavat puhelimet) sekä parannettua "digitaalista uppoamista" 5G: n kautta. Todellisuustarkastus on, että tämä ei koske nykyistä sukupolvea, eikä sillä ole suurta merkitystä edes seuraavan sukupolven aikana.

Yksi käyttötapaus, jota Cortex-A78 parantaa, on AAA-mobiilipelaaminen yhdistettynä ARM: n omaan uuteen Mali-G78 GPU: hun. Näiden kahden yhdistelmän tavoitteena on tuoda korkealaatuiset pelikokemukset mobiililaitteille. Niiden suurempi suorituskyky yhdessä 5G: n nopean nopeuden ja suuren kaistanleveyden kanssa mahdollistaa ensiluokkaisen pelaamisen mobiililaitteella. A78:n tehokkuudesta on tässä hyötyä, sillä se tarjoaa pidemmän akun käyttöiän pidempään pelaamiseen. ARM sanoo myös työskentelevänsä ekosysteemin kanssa parantaakseen suorituskykyä entisestään ja luodakseen rikkaampia pelikokemuksia, ja antaa esimerkin Unityn kanssa tehdystä työstään Burst Compiler -sovelluksen tuomiseksi Androidille.

Koneoppimisen (ML) suorituskyky on toinen ARM: n prioriteetti. Prosessori on ensisijainen prosessori ML-laskentaan mobiililaitteilla, vaikka nykyään huippuluokan SoC: issa on erilliset neuroprosessointiyksiköt (NPU). ARM: n prosessorit tukevat suosituimpia reaalimaailman ML-sovelluksia ja älypuhelimien käyttötapauksia, kuten sosiaalisen median suodattimia, sanelua, turvallisuutta ja turvallisuutta. Cortex-A78 käyttää keskimäärin 8 % vähemmän tehoa ML-pohjaisiin tehtäviin verrattuna A77:ään, mikä johtaa 10 % virallisiin tehokkuusparannuksiin.

ARM Cortex-A78 - Arkkitehtuuri

ARM Cortex-A78:ssa on sama arkkitehtuuri kuin edellisessä sukupolvessa (se on edelleen ARM v8.2 -ydin). ARM kuitenkin lisäsi mikroarkkitehtonisia ominaisuuksia, joiden tarkoituksena on nostaa suorituskykyä korkeammalle alueellisesti ja energiatehokkaasti. ARM säästää aluetta ja tehoa säilyttäen samalla tarvittavan suorituskyvyn. Jälleen, ARM keskittyy Cortex-A-sarjaan edelleen pinta-ala- ja tehotehokkuudessa huippusuorituskyvyn sijaan, mikä on nyt Cortex-X-ohjelman ottama tehtävä.

Cortex-A78:n suorituskyvyn parannukset mahdollistavat lisämikroarkkitehtoniset ominaisuudet, jotka optimoivat leveyden ja syvyyden. Käskyn dekoodausleveys pysyy 4 leveänä, sama kuin A77 ja A76. (Cortex-X1:n dekoodausleveys on toisaalta 5 leveä, kun taas A13:n dekoodausleveys on 7 leveä.) ARM on lisännyt paremman haaran ennusteen kaistanleveydelle ja tarkkuudelle sekä käskyjen fuusiotapauksille. Nämä arkkitehtoniset parannukset mahdollistavat 7 % paremman yksisäikeisen suorituskyvyn A77:ään verrattuna.

Tehokkuus on maksimoitu vähentämällä rakenteita, joilla on alhainen suorituskyky ja pinta-ala, kuten L1-I- ja L1-D-välimuistissa. ARM on optimoinut olemassa olevat rakenteet kuluttamaan vähemmän virtaa, kuten tuotemerkin ennustusrakenteet. ARM sanoo, että tämä johtaa 4 % pienempään tehoon/mW ja 5 % pienempään pinta-alaan/mm2 verrattuna A77:ään.

A78 keskittyy jatkuvaan suorituskykyyn luokkansa parhaalla tehokkuudella klusteritasolla. DynamIQ-klusteri, jossa on 4x Cortex-A77- ja 4x Cortex-A55-suoritinta, voidaan päivittää 4x A78- ja 4x A55-ytimeksi. Tämä parantaa 20 % jatkuvaa suorituskykyä 15 % pienemmällä alueella. Sovellukset, jotka vaativat useita korkean suorituskyvyn säikeitä rinnakkain, kuten high-fidelity-pelit, hyötyvät jatkuvasta suorituskyvystä.

ARM panee merkille A78 DynamIQ -klusterin parannetun aluetehokkuuden, mikä tekee siitä ihanteellisen taitettaville puhelimille ja useille ja suuremmille näytöille. Toinen painopiste on saada älypuhelimet 5G-valmiiksi suorituskykyä ja energiaa parantamalla. 5G: n oletetaan tarjoavan "paljon nopeampia nopeuksia", "paljon pienemmän latenssin" ja "paljon nopeamman ja arjen yhteyksien mobiililaitteille suuren kaistanleveyden sovelluksiin". Tämä saattaa olla tilanne muutaman vuoden kuluttua, mutta tällä hetkellä suurin osa näistä eduista ei ole loppukuluttajien havaittavissa.

Kaiken kaikkiaan Cortex-A78 on vankka tuote. Seuraavan sukupolven lippulaiva SoC: t sisältävät useita A78-ytimiä täydentämään yhtä Cortex-X1-ydintä. sillä on korkeammat teho- ja aluevaatimukset, ja jotkin arvoorientoidut SoC: t jopa jättävät Cortex-X1:n pois. täysin. Keskitason SoC-markkinoilla A78 tulee olemaan vuoden 2021 SoC-laitteiden prosessoriydin, ja sen keskittyminen kestävään suorituskykyyn on tervetullut.


ARM Mali-G78

ARM: n Mali-sarjan grafiikkasuorittimet eivät ole lievästi sanoen olleet yhtä menestyviä kuin Cortex-prosessorit. Mali-grafiikkasuorittimet ovat vuodesta toiseen ylittäneet sekä suorituskyvyn että tehotehokkuuden Applen mukautetuilla GPU: illa ja Qualcommin mukautetuilla Adreno-grafiikkasuorittimilla. Viimevuotinen uuden Valhall-arkkitehtuurin ja Mali-G77 GPU: n julkaisu ei valitettavasti muuttanut tilannetta. SoC: t, joissa oli Mali-G77, sisälsivät Exynos 990 ja MediaTekin koko 1000L vastaavasti. Valitettavasti molemmilla näytti olevan heikko toteutus, mikä tarkoitti niiden GPU-suorituskykyä ei kilpaile Qualcommin Adreno 650 GPU: n kanssa, puhumattakaan Applen luokkansa johtavista GPU: ista Apple A12:ssa ja A13. Mali on jäänyt jälkeen vuosia, eivätkä sen parannukset ole riittäneet muuttamaan status quoa mobiilissa GPU-tilassa.

Siitä huolimatta ARM ei ole mitään ellei optimistinen. Se toteaa, että sen kumppanit ovat toimittaneet yli miljardi Malin GPU: ta vuosittain, mikä tekee Malista maailman ykköstoimituksen. Tämä määrä vain kasvaa oletettavasti, kun monet erityyppiset laitteet mahdollistavat graafisia intensiivisiä käyttötapauksia, kuten edistyneen mobiilipelin ja XR: n (VR ja AR). ARM: n mukaan tämä tekee Malista ekosysteemin laajimmin käytetyn GPU: n mobiilikehitykseen.

ARM toteaa, että vuonna 2019 se julkisti ensimmäisen Valhall-arkkitehtuuriin perustuvan GPU: n - Mali-G77:n. Vuonna 2020 G77:n seuraajaksi tulee Mali-G78, joka myös perustuu Valhall-arkkitehtuuriin. Vaikka ARM sanoo, että se on tähän mennessä tehokkain GPU premium-mobiililaitteille, luvut eivät tue sitä huolimatta siitä, mitä ARM ironisesti sanoo siitä, että numerot tukevat sitä. G78 parantaa suorituskykyä 25 % verrattuna G77:ään, mikä on vähintäänkin vähäistä. Ero G77:n ja Apple A13:n grafiikkasuorittimen välillä oli merkittävä, mikä tarkoittaa, että G78 ei pysty saavuttamaan A13:a, puhumattakaan tulevasta Apple A14:n GPU: sta. Qualcomm pysyy myös jatkossakin askeleen edellä omien tehokkuusparannustensa ansiosta.

Peliä muuttava grafiikka ja koko päivän pelaaminen mobiililaitteilla ovat jo mahdollisia muissa grafiikkasuorituksissa, joten ARM: n markkinointi on täällä hieman onttoa.

ARM: n mukaan Mali-G78 on rakennettu kehittäjiä ja loppukäyttäjää ajatellen. Se mahdollistaa korkealaatuiset mobiilipelikokemukset konsolipeleillä, jotka ovat nyt saatavilla mobiililaitteille. G78 pidentää akun kestoa premium-mobiililaitteisiin. Se lisää myös ML-suorituskykyä monimutkaisempiin peli-, video-, kamera- ja ML-turvaominaisuuksiin mobiililaitteissa.

ARM on nouseva mobiilipelaamisen mahdollisuuksista. Mobiilipelaamisen osuus maailmanlaajuisista pelimarkkinoista vuonna 2019 oli yli 46 prosenttia, ja liikevaihto oli 68,2 miljardia dollaria. Sen on myös määrä jatkaa kasvuaan muutaman seuraavan vuoden aikana, sillä se ohittaa sekä PC- että konsolipelaamisen. Lisää premium-pelejä on tulossa mobiililaitteille, ja käyttäjät odottavat samanlaista kokemusta mobiililaitteella kuin konsoleista.

Jotta nämä kokemukset olisivat mahdollisia, Mali-G78 sisältää tarvittavan suorituskyvyn. Sen suorituskykytiheys on 15 % parempi pelisisällössä verrattuna G77:ään. Samalla alueella kuin edellinen sukupolvi, G78 tarjoaa enemmän suorituskykyä. Tämä tehostus on mahdollista neljän keskeisen ominaisuuden ansiosta:

  • Tuki jopa 24 ytimelle
  • Asynkroninen huipputaso
  • Laattojen parannuksia
  • Parannettu fragmenttiriippuvuuden seuranta

Vaikka G77:n ytimien enimmäismäärä oli 16, ARM on lisännyt G78:n ytimien enimmäismäärän enintään 24 ytimeen. Tietenkin se, että enimmäismäärä on olemassa, ei tarkoita, että mobiilisirujen myyjät todella sisältävät 24 ydintä. Levein G77:n ydinversio, jonka olemme tähän mennessä nähneet, on Mali-G77MP11 Exynos 990:ssä, kun taas Dimensity 1000:ssa on Mali-G77MC9.

ARM uskoo, että Asynchronous Top Level on pelin muuttava ominaisuus GPU-suorituskyvylle. Tämän sanotaan puristavan niin paljon suorituskykyä mobiilipeleistä kuin mahdollista, mikä takaa maksimaalisen suorituskyvyn.

Laatoitusparannukset toisaalta lisäävät mobiilipeleihin ylimääräistä laatutasoa. PC: ltä ja konsoleista tuoduissa peleissä on usein äärimmäisen monimutkaisia ​​resursseja ja hienostuneita kohtauksia, jotka aiheuttavat suorituskyvyn jumiutumia ja pullonkauloja. Laatoitusparannukset vähentävät GPU: n huippukuormitusta näissä monimutkaisissa kohtauksissa ja resursseissa. Tämä parantaa suorituskykyä monimutkaisessa konsolimaisessa pelisisällössä.

ARM on myös parantanut fragmenttiriippuvuuden seurantaa G78:ssa. Tämä vaikuttaa erityisesti mobiilipeleihin, joissa on monimutkaisia ​​pelikohtauksia, joihin liittyy savua, puita ja ruohoa. Tulokset ovat, että ARM on nähnyt jopa 17 % suorituskyvyn parannuksia parhaissa mobiilipeleissä verrattuna G77:ään.

Mali-G78:n energiatehokkuus on 10 % parempi kuin edeltäjänsä. Jälleen kerran, se ei riitä saavuttamaan Qualcommia tai Applea. ARM: n tavoitteet näyttävät tässä erityisen konservatiivisilta. Asynchronous Top Level -ominaisuudella on tärkeä rooli energiatehokkuudessa, koska se mahdollistaa tehon vähentämisen ja mahdollistaa siten sisällön tuottamisen kestävällä tavalla. Siksi, kun laite lähettää sisältöä halutulla kuvanopeudella, se voi hidastaa kelloa energian säästämiseksi. Huipputason nostaminen tätä tehtävää varten kuluttaa hieman enemmän energiaa, mutta varjostinytimien taajuuden vähentämisestä aiheutuva energiansäästö on paljon suurempi. Tämä johtuu siitä, että Shader-ytimet käyttävät 90-95 % GPU: n energiabudjetista.

Parempi energiatehokkuus G78:ssa saavutetaan myös Fused multiply-add (FMA) -tekniikan ansiosta. Se on suunniteltu kokonaan uudelleen alusta alkaen, mikä vähentää yksikön energiaa 30 %. FMA-yksikkö on vastuussa suurimmasta osasta GPU: n sisällä tapahtuvia laskelmia, ja siksi ARM: n oli järkevää kohdistaa se energiansäästöihin.

GPU: n rinnakkaistietojen käsittelykyky tekee siitä sopivan ML-työkuormien suorittamiseen, vaikka ARM myöntää, että CPU ja GPU ovat edelleen ML: n ensisijaiset prosessorit. Kun käyttötapaukset muuttuvat monimutkaisemmiksi, osa työkuormista siirretään GPU: lle. GPU: n tärkeimmät ML-käyttötapaukset liittyvät laitteen suojausominaisuuksiin, erilaisiin kamera- ja videotiloihin sekä sovelluksiin, joissa on AR-ominaisuuksia.

ML: n rooli GPU: ssa mahdollistaa kokemukset, kuten kasvojen seurannan valokuva- tai videokehyksessä, AR-ominaisuuksia käyttävät pelit ja paljon muuta. Näissä ML-pohjaisissa tehtävissä Mali-G78:ssa on 15 %:n keskimääräinen suorituskyvyn parannus erilaisissa ML-työkuormissa verrattuna G77:ään. G77 paransi ML-suorituskykyä 60 % edellisiin sukupolviin verrattuna, joten vuosien parannus on tänä vuonna paljon pienempi. Asynkroninen huipputaso on elintärkeä ML-suorituskyvyn parantamisessa, sillä Shader-ytimien kellotus auttaa GPU: n erilaisissa ML-käyttötapauksissa.

Sitten on ilmoitus Mali-G68:sta. Tämä on vain kapeampi versio Mali-G78:sta, aivan kuten Mali-G57 oli kapeampi muunnos Mali-G77:stä. ARM sanoo, että tämä on ensimmäinen alipremium Mali GPU vuoden 2021 laitteille. Siinä on kaikki G78:n ominaisuudet, kuten laatoitusparannukset ja uusi FMA-yksikkö suoritusmoottorissa, mutta se tukee jopa 6 ydintä 24 ytimen sijaan. Tämän GPU: n tavoitteena on lähes ensiluokkainen suorituskyky pienemmällä hinnalla.

ARM kehitti tämän subpremium-tason GPU-tason kuultuaan palautetta kumppaneilta, jotka halusivat premium-ominaisuuksia koko laitevalikoimaansa. G68:ssa on odotetusti pienempi piipinta-ala, ja se tuo korkean suorituskyvyn pelaamisen laajemmalle kehittäjä- ja kuluttajajoukolle.

Lopuksi ARM mainitsee kehittäjäkumppanuutensa. Sen avulla kehittäjien on helppo optimoida sisältönsä toimimaan paremmin Malin GPU: illa (teoriassa). Yksi esimerkki on Performance Advisor. Toinen on ARM: n yhteistyö Unityn kanssa Burst Compiler -ohjelman tuomiseksi. Yksityiskohdat tästä voidaan lukea lähdeartikkelista.

Mali-G78 - Outlook

Mali-G78:n näkymät ovat synkät. Näyttää siltä, ​​​​että ARM ei vain ole kiinnostunut tekemään merkittäviä vuosittaisia ​​​​suorituskykyparannuksia samaan muotiin, jota Apple tekee, samassa muotissa, jonka Qualcomm teki aiemmin. Vaikka Qualcommin parannusnopeus on myös hidastunut, sen lähtötaso on korkeammalla kuin ARM. Android-ekosysteemin kannalta näyttää pahalta, kun arvioijat väittävät numeerisilla todisteilla, että A13:n GPU: n jatkuva suorituskyky on parempi kuin Snapdragon 865:n huippusuorituskyky. Suorituskykyero Applen ja Androidin GPU: iden välillä kasvaa, ja se vain kasvaa.

G78 ei siis ole taikaratkaisu ARM: n Malin GPU-ongelmien ratkaisemiseen ja niiden nostamiseen suorituskykytaulukoiden kärkeen. Se sijoittuu edelleen Applen ja Qualcommin GPU: iden alapuolelle. Se on oletusvalinta joillekin SoC: ille vain siksi, että se on ARM: n GPU-IP: n varastossa ja mukautetuilla ratkaisuilla on markkinoille pääsyn esteitä ja ne maksavat enemmän hyvin.

Ensi vuonna on kyseenalaista, päätyykö Samsung Systems LSI todella käyttämään Mali-G78:aa. Samsung on ollut Malin GPU: iden korkean profiilin asiakas, mutta viime vuonna se allekirjoitti kumppanuussopimuksen AMD: n kanssa tuodakseen RDNA GPU -arkkitehtuurin mobiililaitteilleen vuonna 2021. Jos etenemissuunnitelma pysyy raiteilla - eikä meillä tässä vaiheessa ole mitään syytä epäillä, että se ei olisi oikealla tiellä -, Exynos 990:n seuraajassa on AMD RDNA GPU Mali GPU: n sijaan. Se on todellakin suuri suunnittelutappio ARM: lle. Jopa muilla myyjillä, kuten MediaTek, on nykyään enemmän vaihtoehtoja. Imagination Technologiesin uutta A-sarjan GPU-arkkitehtuuri sen suunnittelutavoitteena on korkeampi suorituskyky kuin G78:lla, ja on mahdollista, että MediaTek siirtyy tulevaisuudessa pois Malista. Qualcommilla ei tietenkään ole mitään syytä luopua Adreno GPU -ponnisteluistaan, jotka ovat edelleen jäljellä luokkansa paras suorituskyvyn ja tehokkuuden suhteen, kun puhutaan yksinomaan Androidista älypuhelinmarkkinat.

Näin ollen on selvää, että ARM: n on lisättävä Malin GPU: iden vuosittaisten parannusten määrää voidakseen muuttaa todellista eroa mobiiligrafiikkasuorittimien markkinoilla. Jos se ei pysty tähän, se on vaarassa joutua jälkikäteen premium-lippulaiva-mobiilinäytönohjaimen tilassa.


ARM Ethos N78

Lopuksi ARM on myös julkistanut Ethos N78 -hermoprosessointiyksikön (NPU). Se on N77 NPU: n seuraaja. Se tarjoaa paremmat laitteessa olevat ML-ominaisuudet ja jopa 25 % paremman suorituskyvyn. Konfiguroitavuus on myös vahvuus, koska saatavilla olevat kokoonpanot vaihtelevat 1 TOP/s - 10 TOP/s. Katso lisätietoja ARM: n blogikirjoitus. Tällä NPU: lla on todennäköisesti rajalliset suunnitteluvoitot, koska Qualcommilla, Samsungilla, HiSiliconilla ja MediaTekillä on kaikilla omat hermoprosessointiyksiköt/AI-moottorit.


Lähteet: ARM (1, 2), AnandTech (1, 2)