Armi uued Cortex X4, A720 ja A520 on ainult 64-bitised tuumad, mis keskenduvad tõhususele

Armi uued tuumad 2023. aasta Total Compute Solutioni osana on välja kuulutatud ja need on päris huvitavad.

Kiirlingid

  • Ainult 64-bitine: "Missioon täidetud"
  • Käepide Cortex-X4: veelgi suurem jõudlus ja parem efektiivsus
  • Käepide Cortex-A720: jõudluse ja energiatarbimise tasakaalustamine
  • Käepide Cortex A520: tõhususe kahekordistamine
  • DSU-120: kuni 14 head arvutuslikku tuuma
  • Tõhusus on uus eesmärk

Arm on ettevõte, mis kujundab peaaegu kõik protsessori tuumad, mida lõpuks teie Android-nutitelefonis kasutatakse, ja igal aastal teatab uutest iteratsioonidest, mis leiavad hiljem tee kiibistikesse, nagu selle aasta lipulaev Snapdragon või järgmine lipulaev MediaTek Mõõtmed. Sel aastal annab see välja lipulaeva Cortex-X4 tuuma, Cortex-A720 jõudlustuumi ja Cortex-A520 efektiivsustuuma. Need tuumad on aluseks ettevõtte uutele Arm v9.2-ga ühilduvatele disainilahendustele ja ettevõtte Total Compute Solution for 2023 ehk TCS23-le. Lisaks näeme ka uut DynamIQ jagatud seadet ja värskendatud Immortalis-G720 GPU-d. Veelgi olulisem on täielik üleminek 64-bitisele andmetöötlusele, kusjuures ükski neist tuumadest ei toeta 32-bitist.

Kõik kolm uut tuuma on eelmise aasta mikroarhitektuuri järglased ja keskenduvad peamiselt IPC juurutamisele ja tõhususe suurendamisele.

Ainult 64-bitine: "Missioon täidetud"

Üks suurimaid muudatusi Armi selle aasta Total Compute Solutionis on üleminek ainult 64-bitisele. Kui eelmise aasta A510R1 toetas 32-bitist AArch32 täitmisrežiimi, nagu ka eelmisel aastal koos TCS22-ga käivitatud A710, siis sel aastal on Armi tuumad ainult AArch64. Kell on Androidi 32-bitiste rakenduste jaoks tiksunud, eriti sellest ajast peale Google ise on kohustanud kõiki rakendusi värskendama alates 2019. aastast laaditakse üles 64-bitiste binaarfailidena.

Nagu Arm ütleb, peetakse 64-bitist üleminekut "ülesandeks täidetuks". Põhjus on selles, et Hiina rakenduste turg on mis hoidis üleminekul ülejäänud tööstust tagasi, kuid enamik Hiina rakenduste poodides olevaid rakendusi ühildub nüüd 64-bitisega, ka.

Viivituse põhjuseks oli homogeniseeritud rakenduste ökosüsteemi puudumine, mis tähendab, et erinevad rakenduste poed nõudsid arendajatelt erinevaid standardeid. Kuna Arm on töötanud Hiinas erinevate rakenduste poodidega, on need rakenduste poed julgustanud ka arendajaid vahetama koos korduvate hoiatustega, et nihe võib juhtuda.

Näib, et nüüd on kätte jõudnud aeg, mil see üleminek peaks toimuma tervikuna, ja igatahes läheb veel paar kuud, enne kui näeme neid Armi tuumasid uutes kiibikomplektides.

Käepide Cortex-X4: veelgi suurem jõudlus ja parem efektiivsus

Armi X-seeria südamikud erinesid A-seeriast mitu aastat tagasi, kusjuures filosoofia järgi on see võimas südamik, millel lastakse vajaduse korral pisut rohkem jõudu ahmida. Tavaliselt lisavad kiibistikutootjad neist maksimaalselt ainult ühe või kaks, kuna nad on energianäljased, isegi hoolimata nende võimalustest.

Nagu ülaltoodud graafikult näha, on Cortex-X4 seni võimsaim Arm tuum, kuid need arvutusvõimalused tulevad energiatarbimise hinnaga. Cortex-X4 sarnaneb eelmise aasta X3-ga ja nagu Arm ütleb, saab seda isegi eelmise aasta tuumaga samadel sagedustel töötada ja kasutada kuni 40% vähem võimsust. See on füüsiliselt vähem kui 10% suurem ja kõige tõhusam Cortex-X tuum, mis eales ehitatud.

Mis puudutab seda, kust need IPC täiustused pärinevad, siis X4-l on mitmeid esi- ja tagaotsa täiustusi. Nendes esiotsa täiustustes tehti palju tööd haruprognooside ümberkirjutamiseks ja täiustamiseks, kuna valed haruennustused on kulukad ja toimivuse seisukohalt. Arm lubab ka, et L2 vahemälu suurus 2 MB annab suurema jõudluse, mitte niivõrd võrdlusalustes, kuivõrd reaalses kasutuses.

Uus Cortex-X4 tuum suurendab aritmeetilise loogikaühiku (ALU) arvu 6-lt 8-le, lisab täiendava haru üksus (kokku 3), lisab täiendava mitmekordse akumulaatori ning torujuhtmed ujukoma ja ruutjuure operatsioonid.

Mis puudutab tagaosa, siis on ka mitmeid täiustusi. Koorma-salve aadressi genereerimine on muutunud kolmelt juhilt neljale tsükli kohta, kuna laadimissalve toru võeti ja jagati. L1-s on ka kahekordistunud tõlkepuhver koos pangakonflikti täiustustega.

Kõik see toob kaasa muljetavaldava Arm's Cortex-X4 jõudluse tõusu. Kokkuvõttes võib Cortex-X4 puhul oodata keskmiselt 15% jõudluse paranemist. Armi jagatavas võimsuse ja jõudluse kõveras ületab X4 nii jõudluse kui ka energiatarbimise poolest X3. Teisisõnu, see 15% jõudluse paranemine toob kaasa üsna märkimisväärse energiatarbe. Tasub siiski mainida, et see pole päris õunte õunte võrdlus; Cortex-X3-l oli eelmisel aastal 1 MB L2 vahemälu, mis tähendab, et kui tootja peaks sel aastal jääma sama L2 vahemälu suuruse juurde, ei pruugi jõudlus 15% suureneda.

Üks on aga kindel ja see, et kui sõidate X4-ga maksimaalsel kiirusel, on see tõenäoliselt suur jõuallikas. Võime näha, et mõned originaalseadmete tootjad jätkavad sel aastal sama tegevust, mida nad tegid eelmisel aastal, ja tõmbavad paljud selle aasta kiibistikud karbist välja. Näiteks OnePlus ja Oppo teevad seda ja energiatõhususe suurenemist, kui töötate samal ajal jõudluspunkte nagu X3, on tõenäoline, et nende ettevõtete tegevuse jätkamine on kasulik nii. Me ei pruugi näha seda 15% jõudluse tõusu kõikjal, kuid võime selle asemel näha järgmise aasta kiibikomplektide tõhusust veelgi.

Käepide Cortex-A720: jõudluse ja energiatarbimise tasakaalustamine

Kui Armi X-seeria südamikud lastakse tavaliselt veidi metsikuks, siis A-seeria tuumade eesmärk on tavaliselt tasakaalustada energiatarbimist ja jõudlust. Cortex-A720-ga lubab Arm 20% tõhusamat südamikku, millel on suurem jõudlus eelmise aasta A715-ga sama võimsusega.

Mis puudutab selle aasta A720 täiustuste päritolu, siis enamik neist on esiotsas. Torustikeid on lühendatud ühe tsükliga, mis on haru valesti prognoositud mootorist eemaldatud, kusjuures väidetavalt põhjustab see ühe tsükli langus võrdlusaluste 1% võrra. Võrdlusnäitajad põhjustavad tavaliselt haruharu kõige vähem valeennustusi, mis tähendab, et see parandab tõenäoliselt üldist tegelikku jõudlust oluliselt (kuid suures osas mõõtmatu) võrra.

Ebakorrapärases tuumas näeme mitmeid struktuurilisi täiustusi, mis aitavad jõudlust parandada, mõjutamata tuuma poolt hõivatud ala või selle tõhusust. Alustuseks, nagu X4 puhul, on ujukomajaotused ja ruutjuurtehted nüüd konveierdatud. Samuti on kiiremad ülekanded ujukoma-, NEON- ja SVE2-numbritelt täisarvudele ning muud üldised täiustused töötlemise kiirendamiseks.

Arm jagas ülaltoodud graafikut, et illustreerida, kuidas A720 on võrreldes eelmise aasta A715-ga jõudluse ja tõhususe poolest, kus SPECint_base2006-s kasutatakse ISO-protsessi ja ISO-sagedust. Vahemälu suurused jäävad samuti samaks, nii et see on õunte ja õunte võrdlus.

Energiatarbimise osas jääb A720 eelmise aasta mudelile paljuski samale tasemele, kuigi see annab sama võimsustaseme juures pisut paremat jõudlust. A720 puhul, nagu ka X4 puhul, näib Arm keskenduvat rohkem sellele, kuidas see paremaks läheb jõudlust eelmise aasta võimsuspiirangutest, selle asemel, et nende tuumade võimsust pidevalt suurendada võimeline.

Käepide Cortex A520: tõhususe kahekordistamine

Muidugi, kui tegemist on Armi tuumadega, ei ole asi ainult jõudluses. Kuna X-seeria kasutab kõike töötlemata arvutusvõimsust ja A7xx tasakaalustab arvutusvajadusi ja energiatarbimist, keskendub A5xx-seeria puhtalt tõhusale töötlemisele. See on Arm v9.2 tuuma väikseim võimsus pindala kohta ja tugineb samale ühendatud tuumaga arhitektuurile, mida nägime A510 puhul.

See ühendatud tuumarhitektuur tähendab seda, et osa ressursse saab jagada kahe tuuma vahel, kus võib olla kaks tuuma rühmitatud "kompleksiks". Selles jagatakse L2 vahemälu, L2 tõlkepuhver ja vektoriteed keeruline. Et olla selge, see ei tähenda seda on ühendada kaheks südamikuks ja tipptulemuse saavutamiseks saab kokku panna ühetuumalise kompleksi. Tegelikult hõlmas üks Armi TCS2023 südamikupaigutustest, mida nad meile näitasid, ühte X4 südamikku, viit A720 südamikku ja kolme A520 südamikku, mis tähendab, et vähemalt üks A520 südamik on isoleeritud.

A520 on tõhususe eesotsas ja sarnaselt teistele tuumadele keskendus Arm suuresti selle tõhususe parandamisele samadel jõuallikatel nagu viimane põlvkond. See hõlmab haru prognooside parandamist, eemaldades või vähendades samal ajal ka mõningaid jõudlusfunktsioone. See jõudlus taastus tänu suuremale tõhususele. Huvitav on ka see, et Arm on eemaldanud kolmanda ALU, mis oli A510-s, säästes energiat loogika väljastamisel ja tulemuste edastamisel.

Reaalsetes tulemustes tundub, et A520 pole oma eelkäijatest nii suur hüpe kui A720 ja X4. Suur osa selle võimetest madalama võimsuse intervalliga kattub ülaltoodud graafiku A510-ga ja tõhususe suurenemist näeme ainult jõudluse ülemises astmes. Kahe tuuma jõudluse ja võimsuse erinevus on paljutõotav, kuid pole selge, kas näeme A520 ja A510 võrdlemisel tegelikku kasu. Lõppude lõpuks on tegelikus maailmas raske nende kahe jõudluse ja tõhususe erinevusi õigesti mõõta.

DSU-120: kuni 14 head arvutuslikku tuuma

DynamIQ Shared Unit ehk DSU integreerib ühe või mitu südamikku L3-mälusüsteemi, juhtimisloogika ja välisliidestega, et moodustada mitmetuumaline klast. See on sisuliselt Arm's kangas, mis võimaldab kõigil neil tuumadel üksteisega suhelda ja ressursse jagada selline, see on üsna oluline osa iga kiibistiku tootja jaoks, kes soovib ehitada Armi põhikujundusega kiipi.

DSU-110-le tuginedes on Arm teinud DSU-120-le mitmeid täiustusi, mis toovad kasu kogu kiibile, millel see on. Alustuseks on nüüd kuni 14 tuuma klastri kohta (kuni 12) ja tugi kuni 32 MB L3 vahemälule. Samuti parandab see oluliselt tõhusust mitmes võtmevaldkonnas, sealhulgas vahemälu vahelejäämise korral, vähendades samal ajal ka vooluleket.

Teatud mõttes on Armi DSU TCS23 selgroog, kuna see on aluseks sellele, kuidas kõik need tuumad üksteisega suhtlevad ja andmeid jagavad. Kõik siin tehtud täiustused toovad kasu kogu klastrile, kuid tundub, et enamik muudatustest on seotud energiatarbimise ja tõhususega.

Tõhusus on uus eesmärk

Näib, et tööstus on mõnda aega muutunud, kuid peamine esmamulje, mille ma nendest tuumadest saan, on see, et nüüd on mängu nimi tõhusus. Kuigi meile räägiti, kui palju kiirem on X4 tuum ja kuidas see on ettevõtte kõigi aegade kiireim tuum, nad märkasid väga kiiresti, et eelmise aasta tipptulemuse juures on tõhususe paranenud selle asemel.

Üldiselt toetas iga jõudluse suurenemist see, kui palju tõhusam see komponent oli, ja enam-vähem kõik DSU muudatused olid tõhususe ja võimsuse lekke osas. Jõudlus on oluline, kuid tundub, et kogu tööstus püüab end ajakohastada arvutuslikud tasemed on tõhusamad, mitte tohutu jõudluse saavutamiseks, aasta-aastalt.

Eeldame, et need tuumad moodustavad MediaTek Dimensity 9400 ja Qualcomm Snapdragon 8 Gen 3 aluse, kuid millises vormis, seda tuleb veel näha. Nagu varem mainitud, rääkis Arm 1+5+3 tuumapaigutuse kasutamisest oma sisetestimisel, kuid see ei tähenda, et partnerid, nagu MediaTek ja Qualcomm, soovivad seda ise teha.