ARM の命令セット アーキテクチャのここ 10 年で最大の改訂版である ARMv9 は、SVE2 オンボードおよびその他のセキュリティ機能を備えています。
本日、ビジョン デイ イベントの一環として、ARM は新しい ARMv9 アーキテクチャに関する詳細をいくつか明らかにしました。同社は、この ARMv9 アーキテクチャは、この 10 年間に 3,000 億以上のチップで使用されると予想しています。
ARM の ISA の最後のメジャー リビジョンは v8 で、2011 年 10 月に 64 ビット AArch64 命令セットとともに導入されました。 ただし、ARM は、ARMv8.5 のメモリ タグ付けなどの新機能により、長年にわたって ARMv8 を拡張してきました。 ARMv9 により、企業は ベースライン命令セットとして AArch64 を使用し続けていますが、セキュリティとセキュリティの向上を目的とした新機能で AArch64 を拡張しています。 パフォーマンス。
ARM によると、ARMv9-A アーキテクチャの主な新機能は次のとおりです。
- SVE2: スケーラブルなベクターの利点をさらに多くのユースケースに拡張
- レルム管理拡張機能 (RME): Arm プラットフォーム上の Confidential Compute をすべての開発者に拡張します。
- ブルベ: Auto FDO などのプロファイリング情報を提供します。
- エンベデッド トレース拡張機能 (ETE) そして トレースバッファ拡張(TRBE): Armv9 の強化されたトレース機能
- TME: Arm アーキテクチャのハードウェア トランザクション メモリのサポート
ARMv9 に伴う高レベルの変更についてさらに詳しく知りたい場合は、Andrei Frumusanu のレポートを読むことをお勧めします。 アナンドテック, ただし、知っておくべき主な変更点の概要を説明します。
NEON は SVE2 に引き継がれました
NEON は、高度な単一命令複数データ (SIMD) アーキテクチャ拡張機能です。 ここでの SIMD は、複数のデータ項目を並行して処理する単一の命令を指します。 これらのデータ項目は、ビットのベクトルを保持するレジスタに編成されます。
Scalable Vector Extensions (SVE) は、ベクトル処理を拡張する ARMv8.2 以降の拡張機能です。 ハイ パフォーマンス コンピューティング (HPC) タスクとマシンのコンピューティング要件に対処する AArch64 の機能 学ぶ。 重要なのは、128 ビットから 2048 ビットまでのベクトル レジスタ長も許容することです。 ソフトウェア開発の観点から見ると、可変ベクトル レジスタ長の利点は、コードを 1 回コンパイルするだけで、より長いベクトル レジスタを備えた将来の CPU を最大限に活用できることです。 同様に、そのコードは、IoT デバイスなどの SIMD 実行パイプラインが少ない CPU 上でも実行できます。
SVE は HPC ワークロードをよりターゲットにしており、NEON ほど汎用性の高い命令セットでもなかったため、ARM はこれらの問題に対処するために 2019 年初頭に SVE2 を導入しました。 SVE2 には、依然として NEON に依存している DSP ワークロードを対象とした新しい命令が追加されました。 ARMv9 では、SVE2 が ARMv9 CPU のベースライン機能として NEON の後継となっています。
機械学習の改善
ARM は、機械学習ワークロードが今後 10 年間でますます人気が高まると見ています。 ARMv8 の以前のリビジョン 新しい行列乗算命令を導入しました。 これらは ARMv9 CPU のベースライン機能となり、より小規模な ML ワークロードを専用アクセラレータではなく CPU 上で直接実行できるようになります。 高速なパフォーマンスや電力効率を優先する場合には、専用のアクセラレータで ML ワークロードを実行することが望ましいことは明らかですが、すべてのハードウェアで常に実行できるとは限りません。
ARMv9 の Confidential Compute アーキテクチャ
セキュリティを向上させるための取り組みとして、ARMv9 には新しい Confidential Compute Architecture (CCA) が導入されています。 として アナンドテック ARM の CCA は、デバイス上で実行される安全なアプリケーションが、実行されている OS とハイパーバイザーを信頼する必要がある現在のソフトウェア スタックの状況からの転換であると説明します。 現在のセキュリティ モデルは、より特権のあるソフトウェア層がセキュリティを監視できるという事実に基づいて構築されています。 権限の低いソフトウェア層の実行。これは、OS またはハイパーバイザーが無効になっている場合に問題となる可能性があります。 妥協した。
CCA は、OS やハイパーバイザーに対して不透明な、安全なコンテナ化された実行環境である「レルム」を動的に作成することでこの問題を解決します。 「レルム」内のアプリは、ハイパーバイザーの数分の一のサイズのコードである「レルム マネージャー」に対してその信頼性を証明できます。このコードは現在、リソースの割り当てとスケジューリングのみを担当しています。 「レルム」を使用する利点は、信頼の連鎖が軽減され、安全なアクセスが可能になることです。 アプリケーションは、基盤となる OS に関係なく、任意のデバイス上で実行され、透過的に実行されます。 セキュリティ上の問題。
出典: ARM。 経由: アナンドテック.
によると アナンドテック, ARM は、「レルム」が OS およびハイパーバイザーからどのように分離されているかについては詳しく説明していませんが、 この分離は、ハードウェアによってバックアップされたアドレス空間が相互作用できないことに起因すると推測されます。 お互い。
将来の ARM CPU および GPU の設計
これは ARMv9 とは直接関係ありませんが、ARM は将来の v9 ベースの CPU 設計に対する予測パフォーマンスの期待を共有しました。 ARM は、今後 2 世代のモバイル IP コア設計で、IPC パフォーマンスが合計 30% 向上すると予想しています。 つまり、実際の世代間のパフォーマンスの向上は約 14% になります。 アナンドテック と説明します。 明らかに改善速度は若干鈍化している 前年と比較して.
クアルコム、サムスン、ファーウェイなどの企業による CPU 実装が、期待されるパフォーマンス予測にどのように達していないのかを私たちは見てきました。 新しいARMコア設計のこの事実は、メモリ パス、キャッシュ、または周波数を改善することで CPU パフォーマンスを向上させる方法を詳しく説明したスライドで ARM が指摘している事実です。
出典: ARM。 経由: アナンドテック.
それでも、ARMv9 は、2022 年初頭に ISA ベースの新しい CPU が商用デバイスに出荷される際に、パフォーマンス、セキュリティ、機械学習に歓迎すべき改善をもたらすと約束しています。
将来の Mali GPU に関して、ARM はバリアブル レート シェーディング (VRS) やレイ トレーシングなどの技術に取り組んでいることを明らかにしました。 これらの機能は、ハイエンド PC GPU ハードウェアや、次のような第 9 世代ビデオ ゲーム コンソールの間で普及しています。 ソニーのプレイステーション5 そして マイクロソフトのXboxシリーズX/S.
注目の画像クレジット: ARM via アナンドテック