ARMv9-arkitekturen ger SVE2 och nya säkerhetsfunktioner

click fraud protection

ARMs största revidering av sin instruktionsuppsättningsarkitektur på ett decennium är här - ARMv9 - med SVE2 ombord och andra säkerhetsfunktioner.

Tidigare idag, som en del av sitt Vision Day-evenemang, avslöjade ARM några detaljer om sin nya ARMv9-arkitektur, som företaget förväntar sig kommer att användas i över 300 miljarder marker detta årtionde.

Den sista större revisionen av ARMs ISA var v8, som introducerades i oktober 2011 med 64-bitars AArch64-instruktionsuppsättningen. ARM har dock utökat ARMv8 genom åren med nya funktioner som Memory Tagging i ARMv8.5. Med ARMv9 är företaget fortsätter att använda AArch64 som grundinstruktionsuppsättningen men har utökat den med nya funktioner som syftar till att förbättra säkerheten och prestanda.

Enligt ARM, här är de viktigaste nya funktionerna i ARMv9-A-arkitekturen:

  • SVE2: utökar fördelen med skalbara vektorer till många fler användningsfall
  • Realm Management Extension (RME): utökar Confidential Compute on Arm-plattformar till alla utvecklare.
  • BRBE: tillhandahåller profileringsinformation, såsom Auto FDO
  • Embedded Trace Extension (ETE) och Trace Buffer Extension (TRBE): förbättrade spårningsmöjligheter för Armv9
  • TME: stöd för transaktionsminne för hårdvara för Arm-arkitekturen
Källa: ARM. Via: AnandTech.

För en djupare dykning in i förändringarna på hög nivå som kommer med ARMv9, rekommenderar jag att du läser Andrei Frumusanus rapportering kl. AnandTech, men jag kommer att ge en sammanfattning av de viktigaste ändringarna som du bör vara medveten om.

NEON efterträddes av SVE2

NEON är en avancerad arkitekturtillägg för enkelinstruktioner med flera data (SIMD). SIMD hänvisar här till en enda instruktion som arbetar på flera dataobjekt parallellt. Dessa dataelement är organiserade i register som innehåller vektorer av bitar.

Scalable Vector Extensions, eller SVE, är en tillägg till ARMv8.2 eller senare som utökar vektorbehandlingen AArch64:s förmåga att hantera datorkraven för högpresterande beräkningsuppgifter (HPC) och maskin inlärning. Viktigt är att det också tillåter vektorregisterlängder mellan 128 och 2048 bitar. Ur mjukvaruutvecklingssynpunkt är fördelen med en variabel vektorregisterlängd att koden bara behöver kompileras en gång för att dra full nytta av framtida CPU: er med längre vektorregister. På samma sätt kan den koden också köras på processorer med färre SIMD-exekveringspipelines, till exempel de i IoT-enheter.

Eftersom SVE var mer inriktat på HPC-arbetsbelastningar och inte heller var en lika mångsidig instruktionsuppsättning som NEON, introducerade ARM SVE2 i början av 2019 för att ta itu med dessa problem. SVE2 lade till nya instruktioner riktade mot DSP-arbetsbelastningar som fortfarande är beroende av NEON. Nu med ARMv9 efterträder SVE2 NEON som en baslinjefunktion för ARMv9-processorer.

Förbättringar av maskininlärning

ARM ser arbetsbelastningar för maskininlärning bli mer och mer populära under det kommande decenniet, och det är därför tidigare versioner av ARMv8 introducerade nya instruktioner för matrismultiplikation. Dessa kommer att vara baslinjefunktioner för ARMv9-processorer, vilket gör att ML-arbetsbelastningar med mindre omfattning kan köras direkt på CPU: n istället för dedikerade acceleratorer. Självklart är det önskvärt att köra ML-arbetsbelastningar på dedikerade acceleratorer när man föredrar snabb prestanda eller energieffektivitet, men det är inte alltid möjligt att göra det på all hårdvara.

Källa: ARM. Via: AnandTech.

ARMv9:s konfidentiella beräkningsarkitektur

I ett försök att förbättra säkerheten introducerar ARMv9 en ny Confidential Compute Architecture (CCA). Som AnandTech förklarar, ARM: s CCA är ett skifte bort från den nuvarande mjukvarustacksituationen där säkra applikationer som körs på en enhet måste lita på operativsystemet och hypervisorn de körs på. Den nuvarande säkerhetsmodellen bygger på det faktum att mer privilegierade nivåer av programvara kan övervaka exekvering av mindre privilegierade programvarunivåer, vilket kan vara problematiskt när operativsystemet eller hypervisorn är det äventyras.

Hur CCA löser detta problem är genom att dynamiskt skapa "realms", som är säkra, containeriserade exekveringsmiljöer som är ogenomskinliga för operativsystemet eller hypervisorn. Appar inom "realms" kan intyga sin tillförlitlighet för en "realm manager", kod som är en bråkdel av storleken på en hypervisor, som nu är ensam ansvarig för resursallokering och schemaläggning. Fördelen med att använda "sfärer" är att förtroendekedjan minskar, vilket möjliggör säker applikationer som ska köras på vilken enhet som helst oavsett det underliggande operativsystemet som kommer att vara transparent för säkerhetsproblem.

Källa: ARM. Via: AnandTech.

Enligt AnandTechARM beskrev inte exakt hur "sfärer" är separerade från operativsystemet och hypervisorn, men de spekulera i att denna separation härrör från maskinvarustödda adressutrymmen som inte kan interagera med varandra.

Framtida ARM CPU- och GPU-designer

Även om det inte är direkt relaterat till ARMv9, delade ARM sina förväntade prestandaförväntningar för framtida v9-baserade CPU-designer. Under de kommande två generationerna av mobila IP-kärndesigner förväntar ARM en sammanlagd ökning av IPC-prestanda med 30 %. Det betyder att den faktiska generationsökningen i prestanda uppgår till cirka 14 %, som AnandTech förklarar. Uppenbarligen har förbättringstakten avtagit något jämfört med tidigare år.

Vi har sett hur CPU-implementeringar av företag som Qualcomm, Samsung och Huawei inte når de förväntade prestandaprognoserna av nya ARM-kärndesigner, ett faktum som ARM påpekar i en bild som beskriver hur CPU-prestanda kan förbättras genom att förbättra minnesvägen, cacharna eller frekvenserna.

Källa: ARM. Via: AnandTech.

Ändå lovar ARMv9 att ge välkomna förbättringar av prestanda, säkerhet och maskininlärning när nya processorer baserade på ISA levereras i kommersiella enheter i början av 2022.

När det gäller framtida Mali GPU: er har ARM avslöjat att de arbetar med teknologier som variabel hastighetsskuggning (VRS) och strålspårning. Dessa funktioner har blivit populära bland avancerad PC GPU-hårdvara och den nionde generationens videospelskonsoler som t.ex. Sonys PlayStation 5 och Microsofts Xbox Series X/S.

Källa: ARM. Via: AnandTech.

Utvalda bildkrediter: ARM via AnandTech