L'architettura ARMv9 offre SVE2 e nuove funzionalità di sicurezza

La più grande revisione di ARM dell'architettura del set di istruzioni degli ultimi dieci anni è qui - ARMv9 - con SVE2 integrato e altre funzionalità di sicurezza.

Oggi, nell'ambito dell'evento Vision Day, ARM ha rivelato alcuni dettagli sulla sua nuova architettura ARMv9, che l'azienda prevede sarà utilizzata in oltre 300 miliardi di chip in questo decennio.

L'ultima revisione importante dell'ISA di ARM è stata la v8, introdotta nell'ottobre del 2011 con il set di istruzioni AArch64 a 64 bit. Tuttavia, ARM ha esteso ARMv8 nel corso degli anni con nuove funzionalità come Memory Tagging in ARMv8.5. Con ARMv9, l'azienda lo è continuando a utilizzare AArch64 come set di istruzioni di base, ma lo ha esteso con nuove funzionalità volte a migliorare la sicurezza e prestazione.

Secondo ARM, ecco le principali novità dell'architettura ARMv9-A:

  • SVE2: estendere il vantaggio dei vettori scalabili a molti più casi d'uso
  • Estensione della gestione del regno (RME): estendere il Confidential Compute sulle piattaforme Arm a tutti gli sviluppatori.
  • BRBE: fornire informazioni di profilazione, come Auto FDO
  • Estensione della traccia incorporata (ETE) E Estensione del buffer di traccia (TRBE): funzionalità di traccia migliorate per Armv9
  • TME: supporto della memoria transazionale hardware per l'architettura Arm
Fonte: ARM. Attraverso: AnandTech.

Per un approfondimento sui cambiamenti di alto livello in arrivo con ARMv9, consiglio di leggere il rapporto di Andrei Frumusanu su AnandTech, ma fornirò un riepilogo delle principali modifiche di cui dovresti essere a conoscenza.

NEON succeduto da SVE2

NEON è un'estensione avanzata dell'architettura SIMD (Single Instruction Multiple Data). SIMD qui si riferisce a una singola istruzione che opera su più dati in parallelo. Questi elementi di dati sono organizzati in registri che contengono vettori di bit.

Scalable Vector Extensions, o SVE, è un'estensione di ARMv8.2 o successiva che estende l'elaborazione vettoriale capacità di AArch64 di soddisfare i requisiti di elaborazione delle attività e delle macchine HPC (High Performance Computing). apprendimento. È importante sottolineare che consente anche lunghezze di registro vettoriale comprese tra 128 e 2048 bit. Dal punto di vista dello sviluppo software, il vantaggio di una lunghezza di registro vettoriale variabile è che il codice deve essere compilato solo una volta per sfruttare appieno le future CPU con registri vettoriali più lunghi. Allo stesso modo, quel codice può essere eseguito anche su CPU con meno pipeline di esecuzione SIMD, come quelle nei dispositivi IoT.

Poiché SVE era rivolto maggiormente ai carichi di lavoro HPC e non era un set di istruzioni così versatile come NEON, ARM ha introdotto SVE2 all'inizio del 2019 per risolvere questi problemi. SVE2 ha aggiunto nuove istruzioni destinate ai carichi di lavoro DSP che si basano ancora su NEON. Ora con ARMv9, SVE2 succede a NEON come caratteristica di base delle CPU ARMv9.

Miglioramenti dell'apprendimento automatico

ARM prevede che i carichi di lavoro di machine learning diventeranno sempre più popolari nel prossimo decennio, ecco perché revisioni precedenti di ARMv8 introdotte nuove istruzioni per la moltiplicazione di matrici. Queste saranno le caratteristiche di base delle CPU ARMv9, consentendo l'esecuzione di carichi di lavoro ML di ambito più piccolo direttamente sulla CPU anziché su acceleratori dedicati. Ovviamente, l'esecuzione di carichi di lavoro ML su acceleratori dedicati è auspicabile quando si preferiscono prestazioni veloci o efficienza energetica, ma non è sempre possibile farlo su tutto l'hardware.

Fonte: ARM. Attraverso: AnandTech.

Architettura di elaborazione riservata di ARMv9

Nel tentativo di migliorare la sicurezza, ARMv9 introduce una nuova Confidential Compute Architecture (CCA). COME AnandTech spiega, il CCA di ARM rappresenta un allontanamento dall'attuale situazione dello stack software in cui le applicazioni sicure in esecuzione su un dispositivo devono fidarsi del sistema operativo e dell'hypervisor su cui sono in esecuzione. L'attuale modello di sicurezza si basa sul fatto che livelli di software più privilegiati possono monitorare i dati esecuzione di livelli software meno privilegiati, che possono essere problematici quando lo sono il sistema operativo o l'hypervisor compromesso.

Il modo in cui CCA risolve questo problema è creando dinamicamente "regni", che sono ambienti di esecuzione sicuri, containerizzati e opachi per il sistema operativo o l'hypervisor. Le app all'interno dei "regni" possono attestare la propria affidabilità a un "reame manager", un codice che è una frazione delle dimensioni di un hypervisor, che ora è l'unico responsabile dell'allocazione e della pianificazione delle risorse. Il vantaggio dell'utilizzo dei "regni" è che la catena di fiducia viene ridotta, consentendo la sicurezza applicazioni da eseguire su qualsiasi dispositivo indipendentemente dal sistema operativo sottostante a cui sarà trasparente problemi di sicurezza.

Fonte: ARM. Attraverso: AnandTech.

Secondo AnandTech, ARM non ha spiegato esattamente come i "regni" sono separati dal sistema operativo e dall'hypervisor, ma loro ipotizzare che questa separazione derivi da spazi di indirizzi supportati da hardware con cui non è possibile interagire l'un l'altro.

Futuri progetti di CPU e GPU ARM

Sebbene non sia direttamente correlato ad ARMv9, ARM ha condiviso le sue aspettative prestazionali previste per i futuri progetti di CPU basati su v9. Nelle prossime due generazioni di progetti core IP mobili, ARM prevede un aumento complessivo del 30% nelle prestazioni IPC. Ciò significa che l'effettivo aumento generazionale delle prestazioni ammonta a circa il 14%. AnandTech spiega. Chiaramente, il tasso di miglioramento è leggermente rallentato rispetto agli anni precedenti.

Abbiamo visto come le implementazioni della CPU da parte di aziende come Qualcomm, Samsung e Huawei non raggiungano le proiezioni prestazionali previste di nuovi progetti di base ARM, un fatto che ARM sottolinea in una diapositiva che descrive in dettaglio come le prestazioni della CPU possono essere migliorate migliorando il percorso della memoria, le cache o le frequenze.

Fonte: ARM. Attraverso: AnandTech.

Tuttavia, ARMv9 promette di apportare miglioramenti graditi a prestazioni, sicurezza e apprendimento automatico quando le nuove CPU basate su ISA verranno distribuite nei dispositivi commerciali all'inizio del 2022.

Per quanto riguarda le future GPU del Mali, ARM ha rivelato che sta lavorando su tecnologie come il variable rate shading (VRS) e il ray tracing. Queste funzionalità sono diventate popolari tra l'hardware GPU per PC di fascia alta e la nona generazione di console per videogiochi come PlayStation 5 di Sony E Xbox Serie X/S di Microsoft.

Fonte: ARM. Attraverso: AnandTech.

Crediti immagine in primo piano: ARM via AnandTech