ARMv9-arkitektur bringer SVE2 og nye sikkerhedsfunktioner

click fraud protection

ARMs største revision af sin instruktionssætarkitektur i et årti er her - ARMv9 - med SVE2 ombord og andre sikkerhedsfunktioner.

Tidligere i dag, som en del af sin Vision Day-begivenhed, afslørede ARM nogle detaljer om sin nye ARMv9-arkitektur, som virksomheden forventer vil blive brugt i over 300 milliarder chips i dette årti.

Den sidste større revision af ARMs ISA var v8, som blev introduceret i oktober 2011 med 64-bit AArch64 instruktionssættet. ARM har dog udvidet ARMv8 gennem årene med nye funktioner såsom Memory Tagging i ARMv8.5. Med ARMv9 er virksomheden fortsætter med at bruge AArch64 som basisinstruktionssættet, men har udvidet det med nye funktioner, der har til formål at forbedre sikkerheden og ydeevne.

Ifølge ARM er her de vigtigste nye funktioner i ARMv9-A-arkitekturen:

  • SVE2: udvidelse af fordelene ved skalerbare vektorer til mange flere use cases
  • Realm Management Extension (RME): udvidelse af Confidential Compute on Arm-platforme til alle udviklere.
  • BRBE: leverer profileringsoplysninger, såsom Auto FDO
  • Embedded Trace Extension (ETE) og Trace Buffer Extension (TRBE): forbedrede sporingsmuligheder for Armv9
  • TME: hardware transaktionshukommelsesunderstøttelse til Arm-arkitekturen
Kilde: ARM. Via: AnandTech.

For et dybere dyk ned i de ændringer på højt niveau, der følger med ARMv9, anbefaler jeg at læse Andrei Frumusanus rapportering kl. AnandTech, men jeg vil give en oversigt over de vigtigste ændringer, som du bør være opmærksom på.

NEON efterfulgt af SVE2

NEON er en avanceret single instruction multiple data (SIMD) arkitekturudvidelse. SIMD refererer her til en enkelt instruktion, der fungerer på flere dataelementer parallelt. Disse dataelementer er organiseret i registre, der indeholder vektorer af bit.

Scalable Vector Extensions, eller SVE, er en udvidelse til ARMv8.2 eller nyere, der udvider vektorbehandlingen AArch64's evne til at imødekomme computerkravene til high performance computing (HPC) opgaver og maskine læring. Det er vigtigt, at det også giver mulighed for vektorregisterlængder mellem 128 og 2048 bit. Fra et softwareudviklingssynspunkt er fordelen ved en variabel vektorregisterlængde, at kode kun skal kompileres én gang for at få fuld fordel af fremtidige CPU'er med længere vektorregistre. På samme måde kan den kode også køres på CPU'er med færre SIMD-udførelsespipelines, såsom dem i IoT-enheder.

Da SVE var rettet mere mod HPC-arbejdsbelastninger og heller ikke var et så alsidigt instruktionssæt som NEON, introducerede ARM SVE2 i begyndelsen af ​​2019 for at løse disse problemer. SVE2 tilføjede nye instruktioner rettet mod DSP-arbejdsbelastninger, der stadig er afhængige af NEON. Nu med ARMv9 efterfølger SVE2 NEON som en basisfunktion i ARMv9 CPU'er.

Maskinlæringsforbedringer

ARM ser maskinlæringsarbejdsbelastninger blive mere og mere populære i det næste årti, og det er derfor tidligere revisioner af ARMv8 introduceret nye matrix multiplikationsinstruktioner. Disse vil være grundlæggende funktioner i ARMv9 CPU'er, hvilket gør det muligt for mindre omfang at køre ML-arbejdsbelastninger direkte på CPU'en i stedet for dedikerede acceleratorer. Det er klart, at man ønsker at køre ML-arbejdsbelastninger på dedikerede acceleratorer, når man foretrækker hurtig ydeevne eller strømeffektivitet, men det er ikke altid muligt at gøre det på al hardware.

Kilde: ARM. Via: AnandTech.

ARMv9's fortrolige beregningsarkitektur

I et forsøg på at forbedre sikkerheden introducerer ARMv9 en ny Confidential Compute Architecture (CCA). Som AnandTech forklarer, ARM's CCA er et skift væk fra den nuværende softwarestak-situation, hvor sikre applikationer, der kører på en enhed, skal stole på det operativsystem og hypervisor, de kører på. Den nuværende sikkerhedsmodel er bygget på det faktum, at mere privilegerede niveauer af software kan overvåge udførelse af mindre privilegerede softwarelag, hvilket kan være problematisk, når OS eller hypervisor er det kompromitteret.

Hvordan CCA løser dette problem er ved dynamisk at skabe "riger", som er sikre, containeriserede eksekveringsmiljøer, der er uigennemsigtige for OS eller hypervisor. Apps inden for "riger" kan attestere deres troværdighed over for en "realm manager", kode, der er en brøkdel af størrelsen af ​​en hypervisor, som nu er eneansvarlig for ressourceallokering og planlægning. Fordelen ved at bruge "riger" er, at tillidskæden reduceres, hvilket giver mulighed for sikker applikationer, der skal køres på enhver enhed uanset det underliggende OS, som vil være gennemsigtigt for sikkerhedsproblemer.

Kilde: ARM. Via: AnandTech.

Ifølge AnandTechARM detaljerede ikke præcist, hvordan "riger" er adskilt fra OS og hypervisor, men de spekulerer i, at denne adskillelse stammer fra hardware-understøttede adresserum, som ikke kan interagere med hinanden.

Fremtidige ARM CPU- og GPU-design

Selvom det ikke er direkte relateret til ARMv9, delte ARM sine forventede præstationsforventninger til fremtidige v9-baserede CPU-designs. I løbet af de næste to generationer af mobile IP-kernedesigner forventer ARM en samlet stigning på 30 % i IPC-ydelse. Det betyder, at den faktiske generationsstigning i præstationer udgør omkring 14 %, som AnandTech forklarer. Det er klart, at forbedringshastigheden er aftaget noget i forhold til tidligere år.

Vi har set, hvordan CPU-implementeringer af virksomheder som Qualcomm, Samsung og Huawei ikke når de forventede ydeevneprognoser af nye ARM-kernedesigns, et faktum, som ARM påpeger i et dias, der beskriver, hvordan CPU-ydelsen kan forbedres ved at forbedre hukommelsesstien, cachen eller frekvenserne.

Kilde: ARM. Via: AnandTech.

Alligevel lover ARMv9 at bringe kærkomne forbedringer til ydeevne, sikkerhed og maskinlæring, når nye CPU'er baseret på ISA leveres i kommercielle enheder i begyndelsen af ​​2022.

Hvad angår fremtidige Mali GPU'er, har ARM afsløret, at det arbejder på teknologier såsom variabel hastighedsskygge (VRS) og strålesporing. Disse funktioner er blevet populære blandt avanceret PC GPU-hardware og niende generation af videospilkonsoller som f.eks. Sonys PlayStation 5 og Microsofts Xbox Series X/S.

Kilde: ARM. Via: AnandTech.

Udvalgte billedkreditter: ARM via AnandTech