ARM paziņo par Cortex-A78 CPU, Mali-G78 GPU, Ethos N78 NPU

ARM ir paziņojis par Cortex-A78 CPU arhitektūru, kā arī Mali-G78 GPU. Abi ir Cortex-A77 CPU un Mali-G77 GPU pēcteči.

Savas TechDay 2020 ietvaros ARM ir sniedzis trīs galvenos paziņojumus. Galvenais paziņojums ir par Cortex-X Custom programmu (CXC), kas satur jauno Cortex-X1 CPU kodols. Cortex-X1 nodrošina augstāku maksimālo veiktspēju nekā jebkurš Cortex-A sērijas centrālais procesors, vienlaikus pārkāpjot Cortex-A sērijas PPA. Pārējie divi ARM paziņojumi bija daudz ierastāki. CPU Cortex-A78 un Mali-G78 CPU tagad ir oficiāli, un tie darbojas kā CPU pēcteči. Cortex-A77 CPU un Mali-G77 CPU attiecīgi. Apskatīsim šos paziņojumus pa vienam:

ARM Cortex-A78

Izmantojot Cortex-A78, ARM galvenā uzmanība tika pievērsta efektivitātes prasībām, piemēram, prasībām pēc ilgāka akumulatora darbības laika, jauniem mobilās formas faktoriem un sarūkošām SoC zonām. Noturīga veiktspēja šeit ir Cortex-A78 atslēgvārds, savukārt Cortex-X1 ir zvaigznes ar mērķi sasniegt maksimālu īstermiņa maksimālo veiktspēju.

ARM saka, ka Cortex-78 ir "vislabākais" savā piedziņā augstākās klases veiktspējai ar vislabāko efektivitāti savā klasē. Arī tie nav tikai tukši vārdi. Pēdējo pāris gadu laikā Cortex-A76 un Cortex-A77 ir uzrādījuši savā klasē labāko energoefektivitāti un labāko savā klasē PPA (veiktspēja, jauda un platība). Viņiem nebija tāda dizaina, kas nepieciešams, lai konkurētu ar Apple A sērijas mikroshēmām, bet gan zemākas kvalitātes dēļ saražoto jaudu, to energoefektivitāte sliktākajā gadījumā bija tāda pati kā Apple un labākajā gadījumā pat augstāka nekā Apple.

A78 veiktspējas uzlabojumi aptver produktivitātes, komunikācijas, drošības un uz kameru balstītus uzdevumus, uzlabotas spēles, XR un ML balstītas iespējas.

Noturīgā veiktspējā Cortex-A78 nodrošina divciparu uzlabojumus. Tas nodrošina par 20% uzlabojumu noturīgā veiktspējā salīdzinājumā ar tā priekšgājēju Cortex-A77 tajā pašā mobilajā siltuma jaudas apvalkā. AnandTech izpētīja skaitļus un paskaidroja, ka 20% skaitlis ir kombinācija ar 7% augstāku IPC salīdzinājumā ar A77, savukārt atlikušie 13% veiktspējas uzlabojumi tiek ieskaitīti 5 nm procesā, kurā tiks izmantoti nākamās paaudzes SoC. safabricēts. ARM atzīmē ilgstošas ​​veiktspējas nozīmi, sakot, ka mobilajām ierīcēm ir ierobežota jauda izkliedē jaudu, un ilgstoša veiktspēja ļauj izvairīties no jaudas samazināšanas lietojumprogrammām, kas prasa daudz jauda. Tas savukārt uzlabo UX, izvairoties no nobīdes vai kadru krituma.

Enerģijas efektivitātes palielināšana nozīmē augstāku energoefektivitāti, jo abi ir saistīti, taču atšķirīgi jēdzieni. Saskaņā ar ARM teikto, augstas veiktspējas punktos, piemēram, tajos, kas ir pašreizējo mobilo ierīču maksimums, Cortex-A78 piedāvā 50% enerģijas ietaupījumu salīdzinājumā ar 2019. gada ierīcēm. tajā pašā izpildījumā kā Cortex-A77. Tas ir iespaidīgi, un tas padara A78 par energoefektīvāko Cortex-A CPU ARM, ko jebkad ir izstrādājis.

ARM koncentrēšanās uz ilgstošu veiktspēju nāks par labu nākamajam mobilo inovāciju vilnim, piemēram, jauniem formas faktoriem (salokāmiem tālruņiem), kā arī uzlabotai "digitālajai iegremdēšanai", izmantojot 5G. Realitātes pārbaude ir tāda, ka tas tā nav pašreizējās paaudzes gadījumā, un tam nebūs lielas nozīmes pat nākamajā paaudzē.

Viens lietošanas gadījums, ko uzlabos Cortex-A78, ir AAA mobilās spēles, apvienojumā ar paša ARM jauno Mali-G78 GPU. Abu kombinācijas mērķis ir nodrošināt augstas precizitātes spēļu pieredzi mobilajās ierīcēs. To lielākā veiktspēja apvienojumā ar 5G ātro ātrumu un lielo joslas platumu nodrošinās augstākās kvalitātes spēles mobilajās ierīcēs. A78 efektivitāte šeit ir ieguvums, jo tas nodrošinās ilgāku akumulatora darbības laiku ilgākai spēlēšanai. ARM saka, ka tā arī sadarbojas ar ekosistēmu, lai vēl vairāk uzlabotu veiktspēju un radītu bagātīgāku spēļu pieredzi, un sniedz piemēru savam darbam ar Unity, lai Burst Compiler ieviestu operētājsistēmā Android.

Mašīnmācīšanās (ML) veiktspēja ir vēl viena ARM prioritāte. CPU ir pirmās izvēles procesors ML skaitļošanai mobilajās ierīcēs, lai gan mūsdienās augstākās klases SoC ir aprīkotas ar atsevišķām neironu apstrādes vienībām (NPU). ARM CPU atbalsta populārākās reālās pasaules ML lietojumprogrammas un viedtālruņu lietošanas gadījumus, piemēram, sociālo mediju filtrus, diktātu, drošību un drošību. Cortex-A78, salīdzinot ar A77, ML balstītiem uzdevumiem patērē vidēji par 8% mazāk enerģijas, kas nodrošina oficiālus efektivitātes uzlabojumus par 10%.

ARM Cortex-A78 — arhitektūra

ARM Cortex-A78 ir tāda pati arhitektūra kā iepriekšējai paaudzei (tas joprojām ir ARM v8.2 kodols). Tomēr ARM pievienoja mikroarhitektūras funkcijas, kuru mērķis ir uzlabot veiktspēju apgabalā un energoefektīvā veidā. ARM ietaupa platību un jaudu, vienlaikus saglabājot nepieciešamo veiktspējas līmeni. Atkal ARM galvenā uzmanība uz Cortex-A sēriju joprojām ir vērsta uz platības un jaudas efektivitāti, nevis uz maksimālo veiktspēju, kas tagad ir Cortex-X programmas darbs.

Cortex-A78 veiktspējas uzlabojumi ir iespējoti, izmantojot papildu mikroarhitektūras funkcijas, kas optimizē platumu un dziļumu. Instrukciju dekodēšanas platums paliek 4 platumā, tāpat kā A77 un A76. (No otras puses, Cortex-X1 dekodēšanas platums ir 5 platums, savukārt A13 ir 7 platums.) ARM ir pievienojis lielāku atzaru prognozēšanu joslas platumam un precizitātei, kā arī instrukciju saplūšanas gadījumiem. Šie arhitektūras uzlabojumi ļauj par 7% palielināt viena vītnes veiktspēju salīdzinājumā ar A77.

Efektivitāte ir palielināta, samazinot struktūras, kurām ir zema veiktspēja un platība, piemēram, L1-I un L1-D kešatmiņās. ARM ir optimizējis esošās struktūras, lai patērētu mazāk enerģijas, piemēram, zīmola prognozēšanas struktūras. ARM saka, ka tas nodrošina par 4% mazāku veiktspēju uz mW un par 5% mazāku laukumu veiktspējai uz mm2, salīdzinot ar A77.

A78 koncentrējas uz ilgstošu veiktspēju ar vislabāko efektivitāti savā klasē klasteru līmenī. DynamIQ kopu ar 4x Cortex-A77 un 4x Cortex-A55 centrālajiem procesoriem var jaunināt uz 4x A78 kodoliem un 4x A55 kodoliem. Tas nodrošina par 20% ilgstošus veiktspējas uzlabojumus par 15% mazākā apgabalā. Lietojumprogrammas, kurām paralēli nepieciešami vairāki augstas veiktspējas pavedieni, piemēram, augstas precizitātes spēles, gūs labumu no ilgstošas ​​veiktspējas spiediena.

ARM atzīmē, ka A78 DynamIQ klastera uzlabotā apgabala efektivitāte padara to ideāli piemērotu salokāmiem tālruņiem un vairākiem un lielākiem displejiem. Vēl viena uzmanība tiek pievērsta viedtālruņu 5G gatavības nodrošināšanai, uzlabojot veiktspēju un enerģijas patēriņu. 5G it kā nodrošina "daudz lielāku ātrumu", "daudz mazāku latentumu" un "daudz ātrāku un visuresošāku savienojumu mobilajām ierīcēm liela joslas platuma lietojumprogrammām". Tas var būt gadījums pēc dažiem gadiem, taču šobrīd lielākā daļa šo priekšrocību gala patērētājiem nav pamanāmas.

Kopumā Cortex-A78 ir stabils produkts. Nākamās paaudzes vadošajos SoC būs iekļauti vairāki A78 kodoli, lai papildinātu vienu Cortex-X1 kodolu, kas ir augstākas jaudas un platības prasības, un daži uz vērtību orientēti SoC pat izvēlēsies izlaist Cortex-X1 pilnībā. Vidēja līmeņa SoC tirgū A78 būs 2021. gada SoC izvēlētais CPU kodols, un tā koncentrēšanās uz ilgstošu veiktspēju ir apsveicama.


ARM Mali-G78

ARM Mali GPU sērija, maigi izsakoties, nav bijusi ne tuvu tik veiksmīga kā tās Cortex CPU sērija. Gadu no gada Mali GPU gan veiktspējas, gan jaudas efektivitātes ziņā ir pastāvīgi apsteiguši Apple pielāgotie GPU un Qualcomm pielāgotie Adreno GPU. Diemžēl pagājušā gada jaunās Valhall arhitektūras un Mali-G77 GPU palaišana neko nemainīja. SoCs ar Mali-G77 ietvēra Exynos 990 un MediaTek izmērs 1000L attiecīgi. Diemžēl abiem bija vāja ieviešana, kas nozīmēja, ka to GPU veiktspēja varētu būt iespējama nekonkurēt ar Qualcomm Adreno 650 GPU, neatkarīgi no Apple klases vadošajiem GPU Apple A12 un A13. Mali ir atpalikusi gadiem ilgi, un tās uzlabojumi nav bijuši pietiekami, lai mainītu status quo mobilajā GPU telpā.

Tomēr ARM nav nekas cits, ja ne optimistisks. Tā norāda, ka tās partneri ik gadu ir piegādājuši vairāk nekā vienu miljardu Mali GPU, padarot Mali par piegādāto GPU pirmo vietu pasaulē. Šis skaitlis, domājams, tikai palielināsies, jo daudz vairāk dažādu ierīču nodrošina grafiski intensīvas lietošanas gadījumus, piemēram, uzlabotas mobilās spēles un XR (VR un AR). Saskaņā ar ARM teikto, tas padara Mali par visplašāk izmantoto GPU mobilajai attīstībai visā ekosistēmā.

ARM atzīmē, ka 2019. gadā tā paziņoja par savu pirmo GPU, kura pamatā ir Valhall arhitektūra - Mali-G77. 2020. gadā G77 nomainīs Mali-G78, kas arī ir balstīts uz Valhall arhitektūru. Lai gan ARM saka, ka tas ir līdz šim visefektīvākais GPU augstākās kvalitātes mobilajām ierīcēm, skaitļi to neatbalsta, neskatoties uz to, ka ARM ironiski saka, ka to apstiprina skaitļi. G78 nodrošina par 25% veiktspējas uzlabojumu salīdzinājumā ar G77, kas, maigi izsakoties, ir niecīgs. Atšķirība maksimālā GPU veiktspējā starp G77 un Apple A13 GPU bija ievērojama, kas nozīmē, ka G78 nespēs panākt A13, neņemot vērā gaidāmo Apple A14 GPU. Qualcomm arī turpmāk būs soli priekšā, pateicoties saviem pakāpeniskiem veiktspējas uzlabojumiem.

Spēles mainīga grafika un visas dienas spēles mobilajā ierīcē jau ir iespējamas citos GPU, tāpēc ARM mārketings šeit ir nedaudz tukšs.

Saskaņā ar ARM teikto, Mali-G78 ir veidots, domājot par izstrādātājiem un galalietotāju. Tas nodrošina augstas kvalitātes mobilo spēļu pieredzi ar konsoļu spēlēm, kas tagad ir pieejamas mobilajās ierīcēs. G78 nodrošina ilgāku akumulatora darbības laiku augstākās kvalitātes mobilajām ierīcēm. Tas arī nodrošina papildu ML veiktspējas palielinājumu sarežģītākām spēļu, video, kameru un drošības ML funkcijām mobilajās ierīcēs.

ARM vēršas pret mobilo spēļu izredzēm. Mobilās spēles 2019. gadā veidoja vairāk nekā 46% no pasaules spēļu tirgus, sasniedzot 68,2 miljardus ASV dolāru ieņēmumus. Tas arī turpinās augt dažu nākamo gadu laikā, jo tas apsteigs gan datoru, gan konsoļu spēles. Mobilajās ierīcēs tiek piedāvāts vairāk premium spēļu, un lietotāji sagaida līdzīgu pieredzi mobilajās ierīcēs, salīdzinot ar konsolēm.

Lai šī pieredze būtu iespējama, Mali-G78 ir aprīkots ar nepieciešamo veiktspējas palielinājumu. Tam ir par 15% veiktspējas blīvuma uzlabojums spēļu saturam salīdzinājumā ar G77. Tikpat lielai platībai kā iepriekšējā paaudze, G78 nodrošinās lielāku veiktspēju. Šo palielinājumu nodrošina četras galvenās funkcijas:

  • Atbalsts līdz 24 kodoliem
  • Asinhronais augstākais līmenis
  • Flīžu klājēju uzlabojumi
  • Uzlabota fragmentu atkarības izsekošana

Kamēr G77 maksimālais kodolu skaits bija 16, ARM ir palielinājis maksimālo G78 kodolu skaitu līdz 24 kodoliem. Protams, tikai tāpēc, ka ir maksimums, tas nenozīmē, ka mobilo mikroshēmu pārdevēji faktiski iekļaus 24 kodolus. Plašākais G77 kodola variants, ko līdz šim esam redzējuši, ir Mali-G77MP11 uz Exynos 990, savukārt Dimensity 1000 ir Mali-G77MC9.

ARM uzskata, ka Asinhronais augstākais līmenis ir spēle, kas maina GPU veiktspēju. Tiek apgalvots, ka tas izspiež pēc iespējas lielāku veiktspēju no mobilajām spēlēm, nodrošinot maksimālu veiktspēju.

No otras puses, flīžu uzlabojumi mobilajām spēlēm piešķir papildu kvalitātes līmeni. No datora un konsoles pārņemtajām spēlēm bieži ir ārkārtīgi sarežģīti līdzekļi un izsmalcinātas ainas, kas izraisa darbības traucējumus un vājās vietas. Flīžu uzlabojumi samazina virsotņu slodzi uz GPU šīm sarežģītajām ainām un līdzekļiem. Tas uzlabo sarežģītā konsolēm līdzīga spēļu satura veiktspēju.

ARM ir arī uzlabojis fragmentu atkarības izsekošanu G78. Tas īpaši attiecas uz mobilajām spēlēm ar sarežģītām spēļu ainām, kurās ir dūmi, koki un zāle. Rezultāti liecina, ka ARM ir pieredzējis līdz pat 17% veiktspējas uzlabojumus labākajās mobilajās spēlēs, salīdzinot ar G77.

Mali-G78 energoefektivitāte ir par 10% labāka nekā tā priekšgājējam. Atkal ar to nepietiks, lai panāktu ne Qualcomm, ne Apple. ARM mērķi šeit šķiet īpaši konservatīvi. Asinhronā augstākā līmeņa funkcijai ir svarīga loma energoefektivitātē, jo tā ļauj samazināt jaudu, tādējādi ļaujot ģenerēt saturu ilgtspējīgā veidā. Tāpēc, kad ierīce izvada saturu ar vēlamo kadru ātrumu, tā var samazināt laiku, lai taupītu enerģiju. Augstākā līmeņa paaugstināšana šim uzdevumam patērē nedaudz vairāk enerģijas, taču enerģijas ietaupījums, samazinot ēnotāju serdeņu frekvenci, ir daudz lielāks. Tas ir tāpēc, ka ēnotāju kodoli izmanto 90–95% no GPU enerģijas budžeta.

Labāka energoefektivitāte G78 tiek panākta arī, pateicoties Fused multiply-add (FMA). Tas ir pilnībā pārveidots no paša sākuma, kā rezultātā ierīcei tiek samazināts enerģijas patēriņš par 30%. FMA vienība ir atbildīga par lielāko daļu aprēķinu, kas notiek GPU iekšienē, un tāpēc ARM bija lietderīgi to mērķēt uz enerģijas samazināšanu.

GPU paralēlās datu apstrādes iespējas padara to piemērotu ML darba slodzēm, lai gan ARM atzīst, ka CPU un GPU joprojām ir galvenie ML procesori. Tā kā lietošanas gadījumi kļūst sarežģītāki, dažas darba slodzes tiks pārkrautas uz GPU. Galvenie GPU ML lietošanas gadījumi ir saistīti ar ierīces drošības līdzekļiem, dažādiem kameras un video režīmiem, kā arī lietojumprogrammām ar AR funkcijām.

ML loma GPU nodrošina tādas iespējas kā sejas izsekošana fotoattēla vai video kadrā, spēles, kurās tiek izmantotas AR funkcijas, un citas iespējas. Šiem uz ML balstītiem uzdevumiem Mali-G78 ir par 15% vidējais veiktspējas uzlabojums dažādām ML darba slodzēm salīdzinājumā ar G77. G77 uzlaboja ML veiktspēju par 60%, salīdzinot ar iepriekšējām paaudzēm, tāpēc uzlabojumi salīdzinājumā ar iepriekšējo gadu šogad ir daudz mazāki. Asinhronais augstākais līmenis ir ļoti svarīgs, lai uzlabotu ML veiktspēju, jo ēnotāju kodolu fiksēšana palīdz dažādos ML lietošanas gadījumos GPU.

Pēc tam ir paziņojums par Mali-G68. Tas nav nekas cits kā šaurāks Mali-G78 variants, tāpat kā Mali-G57 bija šaurāks Mali-G77 variants. ARM saka, ka šis ir pirmais augstākās klases Mali GPU 2021. gada ierīcēm. Tam ir visas G78 funkcijas, piemēram, flīzēšanas uzlabojumi un jaunā FMA vienība izpildmehānismā, taču tā atbalsta līdz pat 6 kodoliem, nevis 24. Šī GPU mērķis ir gandrīz izcila veiktspēja par zemākām izmaksām.

ARM izstrādāja šo zemākās klases GPU līmeni, uzklausot atsauksmes no partneriem, kuri savā ierīču portfelī vēlējās augstākās kvalitātes funkcijas. G68, kā paredzēts, ir mazāks silīcija laukums, un tas nodrošina augstas veiktspējas spēles plašākai izstrādātāju un patērētāju auditorijai.

Visbeidzot, ARM piemin savas izstrādātāju partnerības. Tas ļauj izstrādātājiem viegli optimizēt savu saturu, lai tas labāk darbotos Mali GPU (teorētiski). Viens piemērs ir Performance Advisor. Otrais ir ARM sadarbība ar Unity, lai izveidotu Burst Compiler. Sīkāku informāciju par to var izlasīt avota rakstā.

Mali-G78 — Outlook

Mali-G78 perspektīvas ir drūmas. Šķiet, ka ARM vienkārši nav ieinteresēts veikt būtiskus veiktspējas uzlabojumus katru gadu tajā pašā veidnē, ko ražo Apple, tajā pašā veidnē, ko Qualcomm izgatavoja pagātnē. Lai gan Qualcomm uzlabojumu līmenis ir arī palēninājies, tā bāzes līmenis ir augstāks nekā ARM. Android ekosistēmai šķiet slikti, kad recenzenti ar skaitliskiem pierādījumiem norāda, ka A13 GPU ilgstošā veiktspēja ir augstāka par Snapdragon 865 maksimālo veiktspēju. Apple un Android GPU veiktspējas delta pieaug, un tā kļūst tikai plašāka.

Tāpēc G78 nav maģisks risinājums, lai atrisinātu ARM Mali GPU problēmas un izvirzītu tās veiktspējas topu augšgalā. Tas joprojām būs ierindots zem Apple un Qualcomm GPU. Dažiem SoC tā būs noklusējuma izvēle tikai tāpēc, ka tas ir ARM akciju GPU IP, un pielāgotajiem risinājumiem ir šķēršļi ienākšanai tirgū un tie maksā vairāk labi.

Nākamgad ir apšaubāms, vai Samsung Systems LSI patiešām izmantos Mali-G78. Samsung ir bijis Mali GPU augsta līmeņa klients, taču pagājušajā gadā tā parakstīja partnerību ar AMD, lai ieviestu RDNA GPU arhitektūru mobilajām ierīcēm — 2021. gadā. Ja šis ceļvedis turpinās darboties — un šobrīd mums nav iemesla aizdomām, ka tas nav uz pareizā ceļa —, Exynos 990 pēctecis Mali GPU vietā būs aprīkots ar AMD RDNA GPU. Tas patiešām būs liels ARM dizaina zaudējums. Pat citiem pārdevējiem, piemēram, MediaTek, mūsdienās ir vairāk iespēju. Imagination Technologies jaunums A sērijas GPU arhitektūra dizaina mērķis ir nodrošināt augstāku veiktspēju nekā G78, un iespējams, ka MediaTek nākotnē pāriet no Mali. Qualcomm, protams, nav iemesla atteikties no Adreno GPU centieniem, kas joprojām paliek labākais savā klasē veiktspējas un efektivitātes ziņā, runājot tikai par Android viedtālruņu tirgus.

Tādējādi ir skaidrs, ka ARM būs jāpalielina Mali GPU ikgadējo uzlabojumu ātrums, lai panāktu reālas izmaiņas mobilo GPU tirgū. Ja tas to nevar izdarīt, tas saskaras ar risku, ka tas tiks pārdomāts augstākās klases mobilā GPU vietā.


ARM Ethos N78

Visbeidzot, ARM ir arī paziņojis par Ethos N78 neironu apstrādes vienību (NPU). Tas ir N77 NPU pēctecis. Tas nodrošina lielākas ierīces ML iespējas un līdz pat 25% lielāku veiktspējas efektivitāti. Konfigurējamība ir arī priekšrocība, jo pieejamās konfigurācijas ir no 1 TOP/s līdz 10 TOP/s. Lai iegūtu sīkāku informāciju, pārbaudiet ARM emuāra ieraksts. Šim NPU, iespējams, būs ierobežotas dizaina uzvaras, jo Qualcomm, Samsung, HiSilicon un MediaTek visiem ir savas neironu apstrādes vienības/AI dzinēji.


Avoti: ARM (1, 2), AnandTech (1, 2)