Arm の新しい Immortalis G720 は、パフォーマンスと効率において大きな向上をもたらすはずです

Arm は Immortalis G720、Mali G720、および Mali G620 を発表しましたが、これらは非常に有望です。

Cortex-X4、A720、および A520 の形で 2023 年に向けた Arm の新しいトータル コンピューティング ソリューションが発売されることに加えて、来年向けの Arm の GPU も検討されています。 これには新しいものが含まれます イモータルズ G720、マリ G720、マリ G620。 これらは Arm の第 5 世代 GPU であり、これは Arm GPU の新しい命名規則でもあります。 「ヴァルホール」や「ビフロスト」はもう必要ありません。 まさに「第5世代」です。

これらの GPU はそれぞれ、以前の GPU に比べて比較的簡単に増分されており、Immortalis G720 は Arm のこれまでで最高の GPU です。 コアと同様に、ここでの GPU も効率の向上が特にもてはやされていますが、かなり大きなパフォーマンスの向上も見られます。 Arm によれば、ハイパワー ゲームによる消費電力の 3 分の 1 はメモリ アクセスによるもので、メモリ帯域幅の使用量は最大 40% 削減されました。

昨年の Immortalis G715 が非常に優れていたことから、GPU に関しては Arm が本当に手ごわい競争相手になり始めていることは明らかです。

イモータリスとマリの区別

Arm の新しい GPU について詳しく説明する前に、Immortalis と Mali の違いがどこにあるのかを区別することが重要です。特に、共通の部品名を示す線が多少ぼやけているためです。 Arm に尋ねたところ、OEM が自社のチップセットに Arm GPU を装備する場合、その GPU は Immortalis として販売されるとのことでした。 しなければならない Mali G720 にはレイトレーシング ユニットが搭載されていますが、 できる しかし必須ではありません。

さらに、Mali G720 は 6 ~ 9 個のコアを搭載できるのに対し、Immortalis G720 は最大 16 個のコアを搭載できます。 Mali G620 に関しては、最大 5 コアに制限されていますが、これもかなり低価格の GPU です。

Arm の Immortalis G720 はこれまでで最高の GPU です

Arm の最新 GPU の大きな革命は、Deferred Vertex Shading (DVS) です。 Arm はバリアブル レート シェーディングとレイ トレーシングですでに先頭に立っており、改善のための次のステップは帯域幅と消費電力でした。 これらの改善の結果、Arm はワットあたりのパフォーマンスが最大 15% 向上し、ピーク パフォーマンスも平均 15% 向上すると宣伝しています。

実際のパフォーマンスでは、Arm は Immortalis G715 と比較して最大 20% のパフォーマンス向上を測定しました。その大部分は DVS による帯域幅の節約によるものと考えられます。 これらの帯域幅の節約により、リアルタイムのダイナミック ライティング、ブルーミング、被写界深度、スクリーン スペース アンビエント オクルージョンなどの PC レベルの効果を追加できます。 実際、これに伴い、Unreal Engine 5 のデスクトップ レンダラーが今年後半に Android に導入される予定です。

遅延頂点シェーディングは G720 の「ヘッドライン機能」であり、レンダラが (タイルごとの) フラグメント シェーディングまで頂点のシェーディングを遅延できるようにします。 ポリゴン リストでは順序が維持されており、フレームレートは G715 と比較して (平均 15%) 増加しています。 レンダリング パイプラインが中間頂点データを保存する必要がないため、ユーザーは帯域幅の使用量が削減されるというメリットが得られます。 メモリ。 Arm 氏は、これはフレームタイムにも影響しないため、安定したゲーム体験が得られると保証してくれました。 これは GPU に組み込まれているため、開発者はその使用法を組み込むために何もする必要はありません。

また、Arm は具体的な数値を明らかにしませんでしたが、これはレイ トレーシングを使用する際のパフォーマンスにも利益をもたらします。 Arm が Immortalis GPU ですでにこの分野でリードしていることを考えると、競合他社が大幅に躍進しない限り、この差はさらに広がることになるでしょう。 Arm は 2x MSAA モジュールも追加しました。以前は、開発者が GPU に 2x MSAA を要求すると、自動的に 4x MSAA にジャンプしていました。

GPU にも他の改善が加えられましたが、規模は小規模です。 コマンド ストリーム フロントエンド (CSF) では、ストリーミング処理用の追加の作業レジスタによっていくつかの改善が見られ、その他のユニットでは全体的にスループットが向上しました。 CSF は、独自の計算機能を使用してスケジューリングと描画呼び出しを処理します。

Arm によれば、昨年の GPU と同じ電力制約のもとで、より強力な GPU が得られ、同じ電力量でより効率的な GPU にスケールダウンされます。

コアと同様に、GPU 効率も重要です

今年の Arm は効率性を重視しているようですが、GPU に関してもそれはまったく同じです。 明らかに、パフォーマンスの向上が目標ではないというわけではありません (そして、同社はまだ追いつきつつあります) が、効率はほとんどの人にとって重要です。 今回はパフ​​ォーマンスが向上する可能性が非常に大きいですが、おそらくほとんどの人は全体的なバッテリー寿命の向上を期待するでしょう。

そうは言っても、帯域幅の 40% の向上は過小評価することはできず、平均フレームレートの 15% の向上は嘲笑されるものではありません。 今後どのようなチップセットにこの GPU が組み込まれるのか、また、今年後半にリリースされる Snapdragon 8 Gen 3 などのチップセットの今後の GPU とどのように比較されるのかを楽しみにしています。