ARM najavljuje Cortex-A78 CPU, Mali-G78 GPU, Ethos N78 NPU

ARM je najavio Cortex-A78 CPU arhitekturu kao i Mali-G78 GPU. Njih dvoje su nasljednici Cortex-A77 CPU-a i Mali-G77 GPU-a.

Kao dio svog TechDaya 2020, ARM je objavio tri velike najave. Glavna glavna najava je Cortex-X Custom program (CXC), koji sadrži novo CPU jezgra Cortex-X1. Cortex-X1 donosi veće vrhunske performanse od bilo kojeg Cortex-A serije CPU-a, dok probija okvire Cortex-A serije' PPA. Druge dvije najave koje je ARM objavio bile su puno rutinskije. Cortex-A78 CPU i Mali-G78 CPU sada su službeni i djeluju kao nasljednici Cortex-A77 CPU i Mali-G77 CPU odnosno. Pokrijmo ove najave jednu po jednu:

ARM Cortex-A78

S Cortex-A78, ključni fokus ARM-a bio je na zahtjevima učinkovitosti, kao što su zahtjevi za duljim vijekom trajanja baterije, novi čimbenici oblika mobilnih uređaja i smanjenje područja SoC-a. Održiva izvedba ovdje je ključna riječ za Cortex-A78, dok Cortex-X1 stremi ka zvijezdama sa svojim ciljem postizanja maksimalnih kratkoročnih vrhunskih performansi.

ARM kaže da Cortex-78 predstavlja "vrlo najbolje" od njegovog pogona za vrhunske performanse uz najbolju učinkovitost u klasi. Nisu to samo prazne riječi. Posljednjih nekoliko godina Cortex-A76 i Cortex-A77 pokazali su najbolju energetsku učinkovitost u klasi i najbolji PPA (performanse, snaga i područje) u klasi. Nisu imali dizajn potreban za natjecanje s Appleovim čipovima A-serije, ali zbog nižeg generirane energije, njihova energetska učinkovitost bila je u najgorem slučaju ista kao Apple, au najboljem slučaju čak i viša od Jabuka.

Poboljšanja performansi modela A78 pokrivaju slučajeve korištenja produktivnosti, komunikacije, sigurnosti i zadataka temeljenih na kameri, naprednog igranja, XR-a i iskustava temeljenih na ML-u.

Što se tiče održivih performansi, Cortex-A78 donosi dvoznamenkasta poboljšanja. Omogućuje 20% poboljšanja u održivim performansama u odnosu na svog prethodnika, Cortex-A77, u istoj ovojnici mobilne toplinske snage. AnandTech prošao kroz brojeve i objasnio da je brojka od 20% kombinacija 7% višeg IPC-a u odnosu na A77, dok je preostalih 13% poboljšanja performansi pripisuje se 5nm procesu, na kojem će biti sve sljedeće generacije SoC-ova izmišljena. ARM napominje važnost održivog učinka govoreći da mobilni uređaji imaju ograničen kapacitet rasipa snagu, a održive performanse izbjegavaju smanjenje snage za aplikacije koje zahtijevaju puno vlast. To zauzvrat poboljšava UX izbjegavanjem kašnjenja ili pada okvira.

Poticanje na energetsku učinkovitost prevodi se u veću energetsku učinkovitost, jer su to dva povezana, ali različita koncepta. Prema ARM-u, u točkama visokih performansi, poput onih koje su vrhunske za trenutačne mobilne uređaje, Cortex-A78 nudi 50% uštede energije u odnosu na uređaje iz 2019. na istoj izvedbi kao Cortex-A77. Ovo je impresivno i čini A78 energetski najučinkovitijim Cortex-A CPU-om koji je ARM ikada dizajnirao.

ARM-ov fokus na održivu izvedbu doprinijet će sljedećem valu mobilnih inovacija kao što su novi faktori oblika (sklopivi telefoni), kao i poboljšano "digitalno uranjanje" kroz 5G. Provjera stvarnosti je da to nije slučaj za sadašnju generaciju, a neće biti važno niti u sljedećoj generaciji.

Jedan slučaj upotrebe koji će biti poboljšan Cortex-A78 je AAA mobilno igranje, u kombinaciji s ARM-ovim novim Mali-G78 GPU-om. Kombinacija to dvoje ima za cilj donijeti vrhunsko iskustvo igranja na mobitelu. Njihove veće performanse će, u kombinaciji s velikom brzinom i velikom propusnošću 5G, omogućiti vrhunsko igranje na mobilnom uređaju. Učinkovitost modela A78 ovdje ima prednost jer će omogućiti dulje trajanje baterije za produljeno igranje. ARM kaže da također radi s ekosustavom na daljnjem poboljšanju performansi i stvaranju bogatijih doživljaja igranja te daje primjer svog rada s Unityjem kako bi Burst Compiler donio na Android.

Performanse strojnog učenja (ML) još su jedan prioritet za ARM. CPU je procesor prvog izbora za ML računalstvo na mobilnom uređaju, iako ovih dana vrhunski SoC-ovi dolaze s zasebnim jedinicama neuronske obrade (NPU). ARM-ovi procesori podržavaju najpopularnije ML aplikacije u stvarnom svijetu i slučajeve upotrebe na pametnim telefonima, kao što su filtri društvenih medija, diktat, sigurnost i sigurnost. Cortex-A78 u prosjeku koristi 8% manje energije za zadatke temeljene na ML-u u usporedbi s A77, što dovodi do službenih poboljšanja učinkovitosti od 10%.

ARM Cortex-A78 - Arhitektura

ARM Cortex-A78 ima istu arhitekturu kao i prethodna generacija (i dalje je ARM v8.2 jezgra). ARM je, međutim, dodao mikroarhitektonske značajke koje imaju za cilj povećati performanse na prostorno i energetski učinkovit način. ARM štedi površinu i snagu dok održava potrebne razine performansi. Opet, ARM-ov fokus na seriju Cortex-A ostaje na području i energetskoj učinkovitosti, a ne na vrhunskoj izvedbi, što je sada posao koji preuzima Cortex-X program.

Poboljšanja performansi Cortex-A78 omogućena su dodatnim mikroarhitektonskim značajkama koje optimiziraju širinu i dubinu. Širina dekodiranja instrukcija ostaje 4 širine, isto kao kod A77 i A76. (Širina dekodiranja Cortex-X1, s druge strane, iznosi 5 širina, dok A13 ima širinu dekodiranja 7 širina.) ARM je dodao veće predviđanje grananja za propusnost i točnost, kao i slučajeve fuzije instrukcija. Ova arhitektonska poboljšanja omogućuju 7% povećanje performansi jedne niti u odnosu na A77.

Učinkovitost je maksimizirana smanjenjem struktura koje imaju niske performanse i područje, kao što su L1-I i L1-D predmemorije. ARM je optimizirao postojeće strukture da troše manje energije, kao što su strukture za predviđanje robne marke. ARM kaže da to dovodi do 4% manje snage za performanse po mW i 5% manje površine za performanse po mm2 u usporedbi s A77.

A78 zadržava fokus na održivim performansama uz najbolju učinkovitost u klasi na razini klastera. DynamIQ klaster od 4x Cortex-A77 i 4x Cortex-A55 CPU-a može se nadograditi na 4x A78 jezgre i 4x A55 jezgre. To osigurava 20% trajnih poboljšanja performansi na 15% manje površine. Aplikacije koje zahtijevaju nekoliko paralelnih niti visokih performansi, kao što je igranje visoke vjernosti, imat će koristi zbog kontinuiranog povećanja performansi.

ARM napominje da poboljšana učinkovitost područja A78 DynamIQ klastera čini idealnim za sklopive telefone i višestruke i veće zaslone. Drugi fokus je na pripremi pametnih telefona za 5G kroz poboljšanja performansi i energije. 5G navodno pruža "daleko veće brzine", "daleko manju latenciju" i "daleko brže i sveprisutnije povezivanje za mobilne uređaje za aplikacije velike propusnosti". To bi moglo biti slučaj za nekoliko godina, ali trenutačno većina ovih prednosti nije vidljiva krajnjim potrošačima.

Sve u svemu, Cortex-A78 je solidan proizvod. Sljedeća generacija vodećih SoC-ova uključivat će više A78 jezgri koje će nadopuniti jednu jezgru Cortex-X1 koja ima veće zahtjeve za napajanjem i površinom, a neki će vrijednosno orijentirani SoC-ovi čak odlučiti preskočiti Cortex-X1 u cijelosti. Za tržište SoC-a srednje klase, A78 će biti CPU jezgra izbora za SoC-ove 2021., a njegov fokus na održive performanse je dobrodošao.


ARM Mali-G78

ARM-ova Mali serija GPU-a nije bila ni približno uspješna kao Cortex serija CPU-a, blago rečeno. Appleovi prilagođeni GPU-ovi i Qualcommovi prilagođeni Adreno GPU-ovi iz godine u godinu konstantno su nadmašivali Mali GPU-ove iu smislu performansi i energetske učinkovitosti. Prošlogodišnje lansiranje nove Valhall arhitekture i Mali-G77 GPU-a nije učinilo ništa da to promijeni, nažalost. SoC-ovi s Mali-G77 uključivali su Exynos 990 i MediaTek Dimensity 1000L odnosno. Nažalost, oba su imala slabe implementacije što je značilo da bi njihove GPU performanse mogle ne natječu se s Qualcommovim Adreno 650 GPU-om, a kamoli Appleovim GPU-ovima vodećim u klasi u Apple A12 i A13. Mali je zaostao godinama, a njegova poboljšanja nisu bila dovoljna da promijene status quo u prostoru mobilnih GPU-a.

Unatoč tome, ARM je ništa drugo nego optimističan. Napominje da su njegovi partneri isporučili više od milijardu Mali GPU-a godišnje, što Mali čini broj jedan isporučenim GPU-om u svijetu. Ovaj će se broj navodno samo povećavati jer mnogo više različitih vrsta uređaja omogućuje grafički intenzivne slučajeve upotrebe kao što su napredno mobilno igranje i XR (VR i AR). Prema ARM-u, ovo Mali čini najčešće korištenim GPU-om za mobilni razvoj u cijelom ekosustavu.

ARM napominje da je 2019. godine najavio svoj prvi GPU temeljen na Valhall arhitekturi - Mali-G77. U 2020. G77 će naslijediti Mali-G78, koji se također temelji na Valhall arhitekturi. Dok ARM kaže da je to najučinkovitiji GPU za vrhunske mobilne uređaje do danas, brojke to ne potvrđuju unatoč onome što ARM ironično kaže da je to činjenica potkrijepljena brojevima. G78 donosi 25% bolje performanse u odnosu na G77, što je u najmanju ruku malo. Razlika u vrhunskim GPU performansama između G77 i GPU-a Apple A13 bila je značajna, što znači da G78 neće moći dostići A13, a kamoli nadolazeći GPU Apple A14. Qualcomm će također nastaviti ostati korak ispred zbog vlastitih inkrementalnih poboljšanja performansi.

Grafika koja mijenja igru ​​i cjelodnevno igranje na mobitelu već su mogući na drugim grafičkim procesorima, tako da ARM-ov marketing ovdje zvuči pomalo prazno.

Mali-G78 je napravljen imajući na umu programere i krajnjeg korisnika, prema ARM-u. Omogućuje visokokvalitetno iskustvo mobilnog igranja s konzolnim igrama koje su sada dostupne na mobitelu. G78 donosi dulje trajanje baterije vrhunskim mobilnim uređajima. Također donosi dodatno poboljšanje ML performansi za složenije igranje, video, kameru, sigurnosne ML značajke na mobilnim uređajima.

ARM je optimističan po pitanju mogućnosti mobilnog igranja. Mobilno igranje činilo je više od 46% globalnog tržišta igara u 2019., dosegnuvši prihod od 68,2 milijarde dolara. Također je spremno da nastavi rasti tijekom sljedećih nekoliko godina jer će nadmašiti i PC i konzole. Više premium naslova za igre dolazi na mobitele i korisnici očekuju slično iskustvo na mobitelu u usporedbi s konzolama.

Kako bi ova iskustva bila moguća, Mali-G78 dolazi s potrebnim poboljšanjem performansi. Ima 15% poboljšanja gustoće performansi za igrački sadržaj u usporedbi s G77. Za istu količinu površine kao prethodna generacija, G78 će pružiti više performansi. Ovo pojačanje omogućeno je zahvaljujući četiri ključne značajke:

  • Podrška za do 24 jezgre
  • Asinkrona najviša razina
  • Poboljšanja keramičara
  • Poboljšano praćenje ovisnosti fragmenata

Dok je maksimalni broj jezgri G77 bio 16, ARM je povećao maksimalni broj jezgri na G78 na maksimalno 24 jezgre. Naravno, samo zato što postoji maksimum ne znači da će proizvođači mobilnih čipova zapravo ugraditi 24 jezgre. Najšira varijanta jezgre G77 koju smo dosad vidjeli je Mali-G77MP11 na Exynosu 990, dok Dimensity 1000 ima Mali-G77MC9.

ARM vjeruje da je Asynchronous Top Level značajka koja mijenja igru ​​za performanse GPU-a. Kaže se da ovo iz mobilnih igara izvlači što je moguće više performansi, osiguravajući maksimalnu izvedbu.

Poboljšanja Tilera, s druge strane, dodaju dodatni sloj kvalitete mobilnim igrama. Igre preuzete s računala i konzola često imaju iznimno komplicirana sredstva i sofisticirane scene, što uzrokuje probleme u izvedbi i uska grla. Poboljšanja Tilera smanjuju verteksno opterećenje GPU-a za ove složene scene i sredstva. To poboljšava performanse za komplicirane sadržaje poput konzola.

ARM je također poboljšao praćenje ovisnosti o fragmentima na G78. To posebno utječe na mobilne igre sa složenim scenama igranja koje uključuju dim, drveće i travu. Rezultati su da je ARM zabilježio do 17% poboljšanja performansi u vrhunskim mobilnim igrama u usporedbi s G77.

Mali-G78 ima 10% bolju energetsku učinkovitost od svog prethodnika. Opet, to neće biti dovoljno da se uhvati korak ni s Qualcommom ni s Appleom. ARM-ovi ciljevi ovdje izgledaju posebno konzervativni. Značajka Asynchronous Top Level igra važnu ulogu u energetskoj učinkovitosti, jer omogućuje smanjenje snage, čime se omogućuje generiranje sadržaja na održiv način. Stoga, kada uređaj emitira sadržaj sa željenom brzinom sličica u sekundi, može smanjiti sat radi uštede energije. Povećanje najviše razine za ovaj zadatak koristi malo više energije, ali ušteda energije zbog smanjenja frekvencije jezgri shadera daleko je veća. To je zato što shader jezgre koriste 90-95% proračuna energije GPU-a.

Bolja energetska učinkovitost u G78 također je postignuta zahvaljujući Fused multiply-add (FMA). Potpuno je redizajniran iz temelja, što je dovelo do 30% smanjenja energije jedinice. Jedinica FMA odgovorna je za većinu izračuna koji se odvijaju unutar GPU-a i zato je imalo smisla da je ARM usmjeri na smanjenje potrošnje energije.

Mogućnost paralelne obrade podataka GPU-a čini ga prikladnim za pokretanje ML radnih opterećenja, iako ARM priznaje da CPU i GPU ostaju primarni procesori za ML. Kako slučajevi upotrebe postaju složeniji, neka radna opterećenja bit će prebačena na GPU. Glavni slučajevi upotrebe ML-a za GPU povezani su sa sigurnosnim značajkama na uređaju, različitim načinima rada kamere i videa, kao i aplikacijama s AR značajkama.

Uloga ML-a na GPU-u omogućuje iskustva poput praćenja lica unutar foto ili video okvira, igre koje koriste AR značajke i više. Za ove zadatke temeljene na ML-u, Mali-G78 ima 15% prosječnog poboljšanja performansi za različita ML radna opterećenja u usporedbi s G77. G77 je donio 60% poboljšanja u performansama ML-a u odnosu na prethodne generacije, tako da je ovogodišnje poboljšanje u odnosu na prethodnu godinu puno manje. Asinkrona najviša razina ključna je za poboljšanje performansi ML-a jer taktiranje jezgri shadera pomaže u različitim slučajevima upotrebe ML-a na GPU-u.

Zatim, tu je najava Mali-G68. Ovo nije ništa drugo nego uža varijanta Mali-G78, baš kao što je Mali-G57 bio uža varijanta Mali-G77. ARM kaže da je ovo prvi sub-premium Mali GPU za uređaje 2021. Ima sve značajke G78 kao što su poboljšanja tilera i nova FMA jedinica u izvršnom motoru, ali podržava do 6 jezgri umjesto 24. Gotovo vrhunska izvedba po nižoj cijeni je cilj ovog GPU-a.

ARM je razvio ovu sub-premium GPU razinu nakon slušanja povratnih informacija od partnera koji su željeli premium značajke u svom portfelju uređaja. G68 ima nižu površinu silicija, kao što se i očekivalo, i donosi igranje visokih performansi široj publici programera i potrošača.

Na kraju, ARM spominje svoje razvojno partnerstvo. Olakšava programerima da optimiziraju svoj sadržaj kako bi bolje radio na Mali GPU-u (u teoriji). Jedan primjer je Performance Advisor. Drugo je ARM-ova suradnja s Unityjem na donošenju Burst Compiler-a. Pojedinosti o tome možete pročitati u izvornom članku.

Mali-G78 - Outlook

Izgledi za Mali-G78 su sumorni. Čini se kao da ARM jednostavno nije zainteresiran za značajna poboljšanja performansi iz godine u godinu u istom kalupu koji Apple proizvodi, u istom kalupu koji je Qualcomm napravio u prošlosti. Iako se Qualcommova stopa poboljšanja također usporila, njegova je osnovna vrijednost na višem mjestu od ARM-a. Izgleda loše za ekosustav Androida kada recenzenti s brojčanim dokazima navode da je održiva izvedba GPU-a A13 veća od vrhunske izvedbe Snapdragona 865. Delta performansi između Apple i Android GPU-a raste i samo se širi.

G78, dakle, nije čarobno rješenje za rješavanje problema s ARM-ovim Mali GPU-om i njihovo dovođenje na vrh ljestvice performansi. I dalje će biti rangiran ispod Appleovih i Qualcomm GPU-ova. To će biti zadani izbor za neke SoC-ove samo zato što je to ARM-ov standardni GPU IP, a prilagođena rješenja imaju prepreke za ulazak i koštaju više dobro.

Sljedeće je godine dvojbeno hoće li Samsung Systems LSI doista koristiti Mali-G78. Samsung je bio istaknuti kupac Mali GPU-a, ali prošle godine, potpisao je partnerstvo s AMD-om za uvođenje RDNA GPU arhitekture na svoje mobilne SoC-ove 2021. Ako ta mapa puta ostane na pravom putu - a u ovom trenutku nemamo razloga sumnjati da nije na pravom putu - tada će nasljednik Exynosa 990 sadržavati AMD RDNA GPU umjesto Mali GPU-a. To će doista biti veliki gubitak dizajna za ARM. Čak i drugi proizvođači kao što je MediaTek imaju više opcija ovih dana. Novo Imagination Technologies GPU arhitektura serije A ima cilj dizajna za veće performanse od G78, a moguće je da će MediaTek u budućnosti odstupiti od Malija. Qualcomm, naravno, nema razloga napustiti svoje napore na Adreno GPU-u, koji još uvijek postoje najbolji u klasi u smislu performansi i učinkovitosti kada govorimo isključivo o Androidu tržište pametnih telefona.

Stoga je jasno da će ARM morati povećati stopu godišnjih poboljšanja Mali GPU-a kako bi napravio stvarnu razliku na tržištu mobilnih GPU-a. Ako to ne može učiniti, suočava se s rizikom da postane naknadna misao u vrhunskom vrhunskom mobilnom GPU prostoru.


ARM Ethos N78

Konačno, ARM je također najavio Ethos N78 neuronsku procesorsku jedinicu (NPU). To je nasljednik N77 NPU. Pruža veće mogućnosti ML-a na uređaju i do 25% veću učinkovitost performansi. Konfigurabilnost je također prednost budući da se dostupne konfiguracije kreću od 1 TOP/s do 10 TOP/s. Za više detalja pogledajte ARM-ov post na blogu. Ovaj NPU vjerojatno će imati ograničene dizajnerske prednosti jer Qualcomm, Samsung, HiSilicon i MediaTek svi imaju svoje jedinice za neuronsku obradu/AI motore.


Izvori: ARM (1, 2), AnandTech (1, 2)