ARM napoveduje Cortex-A78 CPU, Mali-G78 GPU, Ethos N78 NPU

ARM je napovedal arhitekturo procesorja Cortex-A78 in grafičnega procesorja Mali-G78. Oba sta naslednika procesorja Cortex-A77 in grafičnega procesorja Mali-G77.

Kot del svojega TechDay 2020 je ARM objavil tri pomembne objave. Glavna objava je program Cortex-X Custom (CXC), ki vsebuje novo CPE jedro Cortex-X1. Cortex-X1 prinaša višjo najvišjo zmogljivost kot kateri koli procesor serije Cortex-A, hkrati pa prebija meje PPA serije Cortex-A. Drugi dve objavi, ki ju je objavil ARM, sta bili veliko bolj rutinski. CPU Cortex-A78 in Mali-G78 sta zdaj uradna in delujeta kot naslednika Cortex-A77 CPU in Mali-G77 CPU oz. Oglejmo si te objave eno za drugo:

ARM Cortex-A78

Pri Cortex-A78 se je ARM osredotočil na zahteve glede učinkovitosti, kot so zahteve po daljši življenjski dobi baterije, novi faktorji mobilne oblike in krčenje površin SoC. Trajna zmogljivost je tukaj ključna beseda za Cortex-A78, medtem ko Cortex-X1 strelja za zvezde s ciljem doseganja največje kratkoročne najvišje zmogljivosti.

ARM pravi, da Cortex-78 predstavlja "zelo najboljše" njegovega pogona za vrhunsko zmogljivost pri najboljši učinkovitosti v razredu. Tudi to niso samo prazne besede. V zadnjih nekaj letih sta Cortex-A76 in Cortex-A77 pokazala najboljšo energijsko učinkovitost v svojem razredu in najboljšo PPA (zmogljivost, moč in površina) v svojem razredu. Niso imeli zasnove, potrebne za tekmovanje z Applovimi čipi serije A, ampak zaradi nižjega proizvedene energije, je bila njihova energetska učinkovitost v najslabšem primeru enaka kot Apple in v najboljšem primeru celo višja od Apple.

Izboljšave zmogljivosti A78 pokrivajo primere uporabe produktivnosti, komunikacije, varnosti in opravil, ki temeljijo na kameri, naprednih iger, XR in izkušenj, ki temeljijo na ML.

V trajni zmogljivosti Cortex-A78 prinaša dvomestne izboljšave. Zagotavlja 20-odstotno izboljšanje trajne zmogljivosti v primerjavi s svojim predhodnikom, Cortex-A77, v enakem ovoju mobilne toplotne moči. AnandTech pregledal številke in pojasnil, da je številka 20 % kombinacija 7 % višje IPC v primerjavi z A77, medtem ko je preostalih 13 % povečanja zmogljivosti je pripisanih 5nm procesu, na katerem bodo temeljile vse naslednje generacije sistemov na čipu. izmišljeno. ARM poudarja pomen trajne zmogljivosti z besedami, da imajo mobilne naprave omejeno zmogljivost razpršijo moč, trajna zmogljivost pa se izogne ​​dušenju moči za aplikacije, ki zahtevajo veliko moč. To pa izboljša UX z izogibanjem zamikom ali padcem okvirjev.

Prizadevanje za energetsko učinkovitost pomeni višjo energetsko učinkovitost, saj sta povezana, a različna koncepta. Po navedbah ARM pri visokozmogljivih točkah, kot so tiste, ki so vrhunske za trenutne mobilne naprave, Cortex-A78 ponuja 50-odstotni prihranek energije v primerjavi z napravami iz leta 2019. pri istem nastopu kot Cortex-A77. To je impresivno in zato je A78 najbolj energijsko učinkovit CPU Cortex-A, kar jih je kdaj zasnoval ARM.

Osredotočenost ARM na trajno delovanje bo koristila naslednjemu valu mobilnih inovacij, kot so novi faktorji oblike (zložljivi telefoni), kot tudi izboljšana "digitalna potopitev" prek 5G. Preverjanje realnosti je, da to ne velja za sedanjo generacijo in ne bo veliko pomembno niti v naslednji generaciji.

Eden od primerov uporabe, ki ga bo izboljšal Cortex-A78, je AAA mobilno igranje v kombinaciji z ARM-ovim novim Mali-G78 GPE. Kombinacija obeh želi prinesti visoko zvestobo igralne izkušnje na mobilne naprave. Njihova večja zmogljivost bo skupaj s hitro hitrostjo in visoko pasovno širino 5G omogočila vrhunsko igranje iger na mobilnih napravah. Učinkovitost A78 ima tu prednost, saj bo zagotovil daljšo življenjsko dobo baterije za podaljšano igranje. ARM pravi, da sodeluje tudi z ekosistemom za nadaljnje izboljšanje zmogljivosti in izgradnjo bogatejših igralnih izkušenj, in podaja primer svojega dela z Unityjem, da bi prevedel Burst Compiler v Android.

Učinkovitost strojnega učenja (ML) je še ena prednostna naloga za ARM. CPE je procesor prve izbire za računalništvo ML na mobilnih napravah, čeprav so dandanes vrhunski SoC opremljeni z ločenimi nevronskimi procesnimi enotami (NPU). CPU-ji ARM podpirajo najbolj priljubljene aplikacije ML v resničnem svetu in primere uporabe na pametnih telefonih, kot so filtri družbenih medijev, narekovanje, varnost in varnost. Cortex-A78 porabi v povprečju 8 % manj energije za opravila, ki temeljijo na ML, v primerjavi z A77, kar vodi do 10 % uradnih izboljšav učinkovitosti.

ARM Cortex-A78 - Arhitektura

ARM Cortex-A78 ima enako arhitekturo kot prejšnja generacija (še vedno je jedro ARM v8.2). Vendar pa je ARM dodal mikroarhitekturne funkcije, katerih cilj je povečati zmogljivost na področju in energijsko učinkovit način. ARM varčuje s površino in močjo, hkrati pa ohranja potrebne ravni zmogljivosti. Ponovno se ARM osredotoča na serijo Cortex-A še naprej na površino in energijsko učinkovitost, ne pa na vrhunsko zmogljivost, kar je zdaj naloga programa Cortex-X.

Izboljšave zmogljivosti Cortex-A78 so omogočene z dodatnimi mikroarhitekturnimi funkcijami, ki optimizirajo širino in globino. Širina dekodiranja navodil ostaja 4-širina, enako kot pri A77 in A76. (Širina dekodiranja Cortex-X1 je po drugi strani široka 5, medtem ko ima A13 širino dekodiranja 7.) ARM je dodal večjo napoved vej za pasovno širino in natančnost ter primere fuzije navodil. Te arhitekturne izboljšave omogočajo 7-odstotno povečanje zmogljivosti ene niti v primerjavi z A77.

Učinkovitost je bila povečana z zmanjšanjem struktur z nizko zmogljivostjo in nizko površino, na primer v predpomnilnikih L1-I in L1-D. ARM je optimiziral obstoječe strukture za manjšo porabo energije, kot so strukture za napovedovanje blagovne znamke. ARM pravi, da to vodi do 4 % manj moči za zmogljivost na mW in 5 % manj površine za zmogljivost na mm2 v primerjavi z A77.

A78 ostaja osredotočen na trajno delovanje pri najboljši učinkovitosti v razredu na ravni grozda. Grozd DynamIQ s 4x Cortex-A77 in 4x Cortex-A55 procesorji je mogoče nadgraditi na 4x jedra A78 in 4x jedra A55. To zagotavlja 20-odstotno trajno izboljšanje zmogljivosti na 15-odstotnem manjšem območju. Aplikacije, ki zahtevajo več visokozmogljivih niti vzporedno, kot je igranje iger visoke ločljivosti, bodo imele koristi zaradi trajnega povečanja zmogljivosti.

ARM ugotavlja, da je zaradi povečane učinkovitosti območja grozda A78 DynamIQ idealen za zložljive telefone ter več in večje zaslone. Drugi poudarek je na pripravi pametnih telefonov na 5G z izboljšavami zmogljivosti in energije. 5G naj bi zagotavljal "veliko višje hitrosti", "veliko nižjo zakasnitev" in "veliko hitrejšo in bolj vseprisotno povezljivost za mobilne naprave za aplikacije z visoko pasovno širino". To se lahko zgodi čez nekaj let, vendar trenutno večina teh koristi ni opazna za končne potrošnike.

Na splošno je Cortex-A78 soliden izdelek. Vodilni SoC naslednje generacije bo vključeval več jeder A78, ki bodo dopolnjevala eno samo jedro Cortex-X1, ki ima višje zahteve po moči in površini, nekateri vrednostno usmerjeni SoC pa se bodo celo odločili, da bodo izpustili Cortex-X1 popolnoma. Za trg SoC srednjega razreda bo A78 izbrano CPE jedro za SoC leta 2021, njegova osredotočenost na trajno zmogljivost pa je dobrodošla.


ARM Mali-G78

ARM-jeva serija grafičnih procesorjev Mali ni bila niti približno tako uspešna kot serija procesorjev Cortex, milo rečeno. Grafične procesorje Mali so leto za letom dosledno prekašali Applovi grafični procesorji po meri in Qualcommovi grafični procesorji Adreno po meri tako glede zmogljivosti kot energetske učinkovitosti. Lanska uvedba nove arhitekture Valhall in grafičnega procesorja Mali-G77 tega žal nista spremenila. SoC-ji z ​​Mali-G77 so vključevali Exynos 990 in MediaTek Dimensity 1000L oz. Na žalost sta se zdela oba šibka implementacija, kar je pomenilo, da je njuna zmogljivost GPE lahko ne konkurirajo Qualcommovemu grafičnemu procesorju Adreno 650, ne glede na Applove vodilne grafične procesorje v razredu Apple A12 in A13. Mali je leta zaostajal in njegove izboljšave niso bile dovolj, da bi spremenile status quo v prostoru mobilnih grafičnih procesorjev.

Kljub temu je ARM nič drugega kot optimističen. Ugotavlja, da so njegovi partnerji letno poslali več kot milijardo grafičnih procesorjev Mali, zaradi česar je Mali številka ena na svetu. To število se bo menda samo še povečalo, saj bo veliko več različnih vrst naprav omogočalo grafično intenzivne primere uporabe, kot sta napredno mobilno igranje in XR (VR in AR). Po navedbah ARM je zaradi tega Mali najpogosteje uporabljen GPU za mobilni razvoj v celotnem ekosistemu.

ARM ugotavlja, da je leta 2019 objavil svoj prvi GPE, ki temelji na arhitekturi Valhall - Mali-G77. Leta 2020 bo G77 nasledil Mali-G78, ki prav tako temelji na arhitekturi Valhall. Medtem ko ARM pravi, da je to najzmogljivejši grafični procesor za vrhunske mobilne naprave doslej, številke tega ne podpirajo kljub temu, kar ARM ironično pravi, da je to dejstvo, ki ga podpirajo številke. G78 prinaša 25-odstotno izboljšanje zmogljivosti v primerjavi z G77, kar je milo rečeno skromno. Vrzel v najvišji zmogljivosti grafičnega procesorja med G77 in grafičnim procesorjem Apple A13 je bila velika, kar pomeni, da G78 ne bo mogel dohiteti A13, ne glede na prihajajoči GPE Apple A14. Qualcomm bo še naprej ostal korak pred nami zaradi lastnih postopnih izboljšav zmogljivosti.

Grafika, ki spreminja igre, in celodnevno igranje iger na mobilnih napravah so že možni na drugih grafičnih procesorjih, zato trženje podjetja ARM tukaj zveni nekoliko prazno.

Mali-G78 je izdelan z mislijo na razvijalce in končnega uporabnika, pravi ARM. Omogoča visokokakovostne izkušnje mobilnega igranja s konzolnimi igrami, ki so zdaj na voljo na mobilnih napravah. G78 prinaša daljšo življenjsko dobo baterije vrhunskim mobilnim napravam. Prinaša tudi nadaljnji dvig zmogljivosti ML za bolj zapleteno igranje iger, video, kamero, varnostne funkcije ML na mobilnih napravah.

ARM je optimističen glede možnosti mobilnih iger. Mobilne igre so leta 2019 predstavljale več kot 46 % svetovnega trga iger in dosegle 68,2 milijarde USD prihodkov. Prav tako naj bi še naprej rasel v naslednjih nekaj letih, saj bo prehitel tako računalniške kot igralne konzole. V mobilne naprave prihaja več vrhunskih igralnih naslovov in uporabniki pričakujejo podobno izkušnjo na mobilnih napravah kot na konzolah.

Da bi bile te izkušnje možne, ima Mali-G78 potrebno izboljšano zmogljivost. Ima 15-odstotno izboljšavo gostote zmogljivosti za igralne vsebine v primerjavi z G77. Za enako količino površine kot prejšnja generacija bo G78 zagotovil večjo zmogljivost. To povečanje omogočajo štiri ključne funkcije:

  • Podpora za do 24 jeder
  • Asinhrona najvišja raven
  • Izboljšave ploščic
  • Izboljšano sledenje odvisnosti od fragmentov

Medtem ko je bilo največje število jeder G77 16, je ARM povečal največje število jeder na G78 na največ 24 jeder. Seveda samo zato, ker obstaja maksimum, ne pomeni, da bodo prodajalci mobilnih čipov dejansko vgradili 24 jeder. Najširša jedrna različica G77, ki smo jo videli doslej, je Mali-G77MP11 na Exynosu 990, medtem ko ima Dimensity 1000 Mali-G77MC9.

ARM verjame, da je Asynchronous Top Level funkcija, ki spreminja igro za zmogljivost GPU. To naj bi iz mobilnih iger iztisnilo čim več zmogljivosti in zagotovilo največjo zmogljivost.

Izboljšave Tilerja na drugi strani dodajo dodatno plast kakovosti mobilnim igram. Igre, prenesene iz osebnih računalnikov in konzol, imajo pogosto izjemno zapletena sredstva in prefinjene prizore, kar povzroča težave pri delovanju in ozka grla. Izboljšave ploščic zmanjšajo obremenitev vozlišč GPE za te zapletene prizore in sredstva. To izboljša zmogljivost zapletene igralne vsebine, podobne konzoli.

ARM je izboljšal tudi sledenje odvisnosti od fragmentov na G78. To še posebej vpliva na mobilne igre s kompleksnimi igralnimi prizori, ki vključujejo dim, drevesa in travo. Rezultati so, da je ARM v primerjavi z G77 zabeležil do 17-odstotno izboljšanje zmogljivosti pri vrhunskih mobilnih igrah.

Mali-G78 ima 10 % boljšo energijsko učinkovitost kot njegov predhodnik. Še enkrat, to ne bo dovolj, da bi dohiteli Qualcomm ali Apple. Cilji ARM se zdijo še posebej konzervativni. Funkcija Asynchronous Top Level igra pomembno vlogo pri energetski učinkovitosti, saj omogoča zmanjšanje porabe energije in tako omogoča trajnostno ustvarjanje vsebine. Zato lahko naprava, ko oddaja vsebino z želeno hitrostjo sličic, zniža uro, da prihrani energijo. Povečanje najvišje ravni za to nalogo porabi nekoliko več energije, vendar je prihranek energije zaradi zmanjšanja frekvence jeder senčil veliko večji. To je zato, ker jedra senčil porabijo 90–95 % proračuna energije GPU.

Boljša energetska učinkovitost v G78 je dosežena tudi zahvaljujoč funkciji Fused multiply-add (FMA). Popolnoma je bil preoblikovan od začetka, kar je privedlo do 30-odstotnega zmanjšanja energije v enoti. Enota FMA je odgovorna za večino izračunov, ki se zgodijo znotraj GPE, in zato je bilo smiselno, da jo je ARM usmeril v zmanjšanje energije.

Zaradi zmožnosti vzporedne obdelave podatkov GPE je primeren za izvajanje delovnih obremenitev ML, čeprav ARM priznava, da CPE in GPE ostajata primarna procesorja za ML. Ko postanejo primeri uporabe bolj zapleteni, bodo nekatere delovne obremenitve prenesene na GPE. Glavni primeri uporabe ML za GPE so povezani z varnostnimi funkcijami v napravi, različnimi kamerami in video načini ter aplikacijami s funkcijami AR.

Vloga ML na GPU omogoča izkušnje, kot je sledenje obrazom v okvirju fotografije ali videa, igre, ki uporabljajo funkcije AR, in še več. Za ta opravila, ki temeljijo na ML, ima Mali-G78 15-odstotno povprečno izboljšano zmogljivost za različne delovne obremenitve ML v primerjavi z G77. G77 je prinesel 60-odstotno izboljšanje zmogljivosti ML v primerjavi s prejšnjimi generacijami, zato je letošnje izboljšanje med letom precej manjše. Asinhrona najvišja raven je bistvenega pomena pri povečanju zmogljivosti ML, saj uravnavanje takta jeder senčil pomaga pri različnih primerih uporabe ML na GPE.

Potem je tu še napoved Mali-G68. To ni nič drugega kot ožja različica Mali-G78, tako kot je bil Mali-G57 ožja različica Mali-G77. ARM pravi, da je to prvi sub-premium Mali GPU za naprave leta 2021. Ima vse funkcije G78, kot so izboljšave ploščic in nova enota FMA v izvedbenem motorju, vendar podpira do 6 jeder namesto 24. Cilj te GPE je skoraj vrhunska zmogljivost po nižji ceni.

ARM je razvil to sub-premium raven GPE po poslušanju povratnih informacij partnerjev, ki so želeli vrhunske funkcije v svojem portfelju naprav. G68 ima nižjo površino silicija, kot je bilo pričakovano, in prinaša visoko zmogljivo igranje iger širši publiki razvijalcev in potrošnikov.

Na koncu ARM omenja svoja partnerstva z razvijalci. Razvijalcem olajša optimizacijo svoje vsebine za boljše delovanje na grafičnih procesorjih Mali (teoretično). En primer je Performance Advisor. Drugo je sodelovanje ARM z Unityjem, da bi predstavili Burst Compiler. Podrobnosti o tem lahko preberete v izvornem članku.

Mali-G78 – Outlook

Obeti za Mali-G78 so slabi. Zdi se, kot da ARM preprosto ni zainteresiran za bistvene izboljšave zmogljivosti iz leta v leto v istem kalupu, kot ga izdeluje Apple, v istem kalupu, kot ga je v preteklosti izdelal Qualcomm. Medtem ko se je tudi stopnja izboljšanja Qualcomma upočasnila, je njegova izhodiščna vrednost na višjem mestu kot ARM. Za ekosistem Android je videti slabo, ko ocenjevalci s številčnimi dokazi trdijo, da je trajna zmogljivost grafičnega procesorja A13 višja od najvišje zmogljivosti procesorja Snapdragon 865. Delta zmogljivosti med grafičnimi procesorji Apple in Android narašča in se le še širi.

G78 torej ni čarobna rešitev za rešitev težav ARM-ovega Mali GPU-ja in njihovo postavitev na vrh lestvice zmogljivosti. Še vedno bo uvrščen pod grafične procesorje Apple in Qualcomm. To bo privzeta izbira za nekatere sisteme na čipu samo zato, ker je ARM-ov standard GPU IP, rešitve po meri pa imajo ovire za vstop in so dražje kot dobro.

Naslednje leto je dvomljivo, ali bo Samsung Systems LSI dejansko na koncu uporabljal Mali-G78. Samsung je bil pomemben kupec grafičnih procesorjev Mali, lani pa je podpisal partnerstvo z AMD za uvedbo arhitekture GPE RDNA na svoje mobilne sisteme na čipu leta 2021. Če bo ta načrt ostal na pravi poti – in na tej točki nimamo razloga sumiti, da ni na pravi poti –, bo naslednik Exynos 990 vseboval AMD RDNA GPE namesto Mali GPE. To bo res velika konstrukcijska izguba za ARM. Celo drugi prodajalci, kot je MediaTek, imajo danes več možnosti. Novost Imagination Technologies Arhitektura GPU serije A ima oblikovni cilj večjo zmogljivost kot G78 in možno je, da bo MediaTek v prihodnosti zamenjal Mali. Qualcomm seveda nima razloga, da bi opustil prizadevanja Adreno GPU, ki še vedno ostajajo najboljši v razredu v smislu zmogljivosti in učinkovitosti, če govorimo izključno o Androidu trgu pametnih telefonov.

Tako je jasno, da bo ARM moral povečati stopnjo letnih izboljšav Mali GPU-jev, da bo resnično spremenil trg mobilnih GPE-jev. Če tega ne zmore, se sooči s tveganjem, da bo v vrhunskem vodilnem mobilnem GPU prostoru ostal zanemarjen.


ARM Ethos N78

Končno je ARM napovedal tudi nevronsko procesno enoto (NPU) Ethos N78. Je naslednik N77 NPU. Zagotavlja večje zmogljivosti ML v napravi in ​​do 25 % večjo učinkovitost delovanja. Možnost konfiguracije je tudi prednost, saj razpoložljive konfiguracije segajo od 1 TOP/s do 10 TOP/s. Za več podrobnosti si oglejte Objava v spletnem dnevniku ARM. Ta NPU bo verjetno imel omejene oblikovalske zmage, saj imajo Qualcomm, Samsung, HiSilicon in MediaTek vsi svoje enote za nevronsko obdelavo/motorje AI.


Viri: ARM (1, 2), AnandTech (1, 2)