Die ARMv9-Architektur bringt SVE2 und neue Sicherheitsfunktionen

ARMs größte Überarbeitung seiner Befehlssatzarchitektur seit einem Jahrzehnt ist da – ARMv9 – mit integriertem SVE2 und anderen Sicherheitsfunktionen.

ARM hat heute im Rahmen seiner Vision Day-Veranstaltung einige Details zu seiner neuen ARMv9-Architektur bekannt gegeben, die nach Einschätzung des Unternehmens in diesem Jahrzehnt in über 300 Milliarden Chips zum Einsatz kommen wird.

Die letzte größere Überarbeitung der ISA von ARM war v8, die im Oktober 2011 mit dem 64-Bit-Befehlssatz AArch64 eingeführt wurde. Allerdings hat ARM ARMv8 im Laufe der Jahre um neue Funktionen wie Memory Tagging in ARMv8.5 erweitert. Mit ARMv9 ist das Unternehmen verwendet weiterhin AArch64 als Basisbefehlssatz, hat ihn jedoch um neue Funktionen zur Verbesserung der Sicherheit erweitert Leistung.

Laut ARM sind hier die wichtigsten neuen Funktionen der ARMv9-A-Architektur:

  • SVE2: Ausweitung der Vorteile skalierbarer Vektoren auf viele weitere Anwendungsfälle
  • Realm Management Extension (RME): Ausweitung von Confidential Compute on Arm-Plattformen auf alle Entwickler.
  • BRBE: Bereitstellung von Profilierungsinformationen, z. B. Auto FDO
  • Embedded Trace Extension (ETE) Und Trace-Puffer-Erweiterung (TRBE): Erweiterte Trace-Funktionen für Armv9
  • TME: Hardware-Transaktionsspeicherunterstützung für die Arm-Architektur
Quelle: ARM. Über: AnandTech.

Für einen tieferen Einblick in die allgemeinen Änderungen, die ARMv9 mit sich bringt, empfehle ich die Lektüre der Berichterstattung von Andrei Frumusanu unter AnandTech, aber ich werde eine Zusammenfassung der wichtigsten Änderungen bereitstellen, die Sie kennen sollten.

Nachfolger von NEON wurde SVE2

NEON ist eine erweiterte SIMD-Architekturerweiterung (Single Instruction Multiple Data). SIMD bezieht sich hier auf einen einzelnen Befehl, der mehrere Datenelemente parallel bearbeitet. Diese Datenelemente sind in Registern organisiert, die Bitvektoren enthalten.

Scalable Vector Extensions (SVE) ist eine Erweiterung für ARMv8.2 oder höher, die die Vektorverarbeitung erweitert Fähigkeit von AArch64, die Rechenanforderungen von Hochleistungsrechneraufgaben (HPC) und Maschinen zu erfüllen Lernen. Wichtig ist, dass es auch Vektorregisterlängen zwischen 128 und 2048 Bit ermöglicht. Aus Sicht der Softwareentwicklung besteht der Vorteil einer variablen Vektorregisterlänge darin, dass der Code nur einmal kompiliert werden muss, um die Vorteile zukünftiger CPUs mit längeren Vektorregistern voll auszunutzen. Ebenso kann dieser Code auch auf CPUs mit weniger SIMD-Ausführungspipelines ausgeführt werden, beispielsweise in IoT-Geräten.

Da SVE eher auf HPC-Workloads ausgerichtet war und auch kein so vielseitiger Befehlssatz wie NEON war, führte ARM Anfang 2019 SVE2 ein, um diese Probleme zu beheben. SVE2 hat neue Anweisungen hinzugefügt, die auf DSP-Workloads abzielen, die immer noch auf NEON basieren. Mit ARMv9 tritt SVE2 nun die Nachfolge von NEON als Basisfunktion von ARMv9-CPUs an.

Verbesserungen beim maschinellen Lernen

Aus diesem Grund geht ARM davon aus, dass Workloads für maschinelles Lernen im nächsten Jahrzehnt immer beliebter werden frühere Versionen von ARMv8 führte neue Anweisungen zur Matrixmultiplikation ein. Hierbei handelt es sich um Basisfunktionen von ARMv9-CPUs, die es ermöglichen, ML-Workloads mit kleinerem Umfang direkt auf der CPU statt auf dedizierten Beschleunigern auszuführen. Offensichtlich ist die Ausführung von ML-Workloads auf dedizierten Beschleunigern wünschenswert, wenn man schnelle Leistung oder Energieeffizienz bevorzugt, aber das ist nicht immer auf jeder Hardware möglich.

Quelle: ARM. Über: AnandTech.

Die vertrauliche Rechenarchitektur von ARMv9

Um die Sicherheit zu verbessern, führt ARMv9 eine neue Confidential Compute Architecture (CCA) ein. Als AnandTech erklärt, stellt ARMs CCA eine Abkehr von der aktuellen Software-Stack-Situation dar, bei der sichere Anwendungen, die auf einem Gerät ausgeführt werden, dem Betriebssystem und Hypervisor vertrauen müssen, auf dem sie ausgeführt werden. Das aktuelle Sicherheitsmodell basiert auf der Tatsache, dass privilegiertere Softwareebenen das überwachen können Ausführung weniger privilegierter Softwareebenen, was problematisch sein kann, wenn das Betriebssystem oder der Hypervisor vorhanden sind kompromittiert.

CCA behebt dieses Problem durch die dynamische Erstellung von „Realms“, sicheren, containerisierten Ausführungsumgebungen, die für das Betriebssystem oder den Hypervisor undurchsichtig sind. Apps innerhalb von „Realms“ können ihre Vertrauenswürdigkeit gegenüber einem „Realm Manager“ bestätigen, einem Code, der nur einen Bruchteil der Größe eines Hypervisors hat und nun allein für die Ressourcenzuweisung und -planung verantwortlich ist. Der Vorteil der Verwendung von „Realms“ besteht darin, dass die Vertrauenskette reduziert wird, was Sicherheit ermöglicht Anwendungen können auf jedem Gerät ausgeführt werden, unabhängig vom zugrunde liegenden Betriebssystem, für das transparent ist Sicherheitsprobleme.

Quelle: ARM. Über: AnandTech.

Entsprechend AnandTechARM hat nicht genau beschrieben, wie „Realms“ vom Betriebssystem und Hypervisor getrennt sind, aber sie spekulieren, dass diese Trennung auf hardwaregestützte Adressräume zurückzuführen ist, mit denen keine Interaktion möglich ist gegenseitig.

Zukünftige ARM-CPU- und GPU-Designs

Obwohl es nicht direkt mit ARMv9 zusammenhängt, teilte ARM seine prognostizierten Leistungserwartungen für zukünftige v9-basierte CPU-Designs mit. Für die nächsten beiden Generationen mobiler IP-Core-Designs erwartet ARM eine Steigerung der IPC-Leistung um insgesamt 30 %. Das bedeutet, dass der tatsächliche Generationszuwachs an Leistung etwa 14 % beträgt AnandTech erklärt. Offensichtlich hat sich die Verbesserungsrate etwas verlangsamt im Vergleich zu den Vorjahren.

Wir haben gesehen, dass CPU-Implementierungen von Unternehmen wie Qualcomm, Samsung und Huawei nicht die erwarteten Leistungsprognosen erreichen neuer ARM-Kerndesigns, eine Tatsache, auf die ARM in einer Folie hinweist, die detailliert beschreibt, wie die CPU-Leistung durch Verbesserung des Speicherpfads, der Caches oder der Frequenzen verbessert werden kann.

Quelle: ARM. Über: AnandTech.

Dennoch verspricht ARMv9 willkommene Verbesserungen bei Leistung, Sicherheit und maschinellem Lernen, wenn Anfang 2022 neue CPUs auf ISA-Basis in kommerziellen Geräten ausgeliefert werden.

Was zukünftige Mali-GPUs betrifft, hat ARM bekannt gegeben, dass es an Technologien wie Variable Rate Shading (VRS) und Raytracing arbeitet. Diese Funktionen sind bei High-End-PC-GPU-Hardware und der neunten Generation von Videospielkonsolen beliebt geworden, z Sonys PlayStation 5 Und Microsofts Xbox Series X/S.

Quelle: ARM. Über: AnandTech.

Ausgewählte Bildnachweise: ARM via AnandTech