ARMはMali-G77 GPUを発表しました。 2016 年に導入された Bifrost アーキテクチャを引き継ぐ、まったく新しい Valhall アーキテクチャが導入されました。
ARM は毎年恒例の TechDay で、Cortex-A77 CPU とともに Mali-G77 GPU を発表しました。 Cortex-A77 は前世代の Cortex-A76 に比べて大幅に世代が進歩していますが、Mali-G77 GPU はまったく異なるものです。 これは、2016 年に Bifrost アーキテクチャを導入した Mali-G71 以来、新しい GPU アーキテクチャを導入した ARM の Mali ラインナップの中で最初の GPU です。 Mali-G77 は、まったく新しい「Valhall」アーキテクチャをもたらします。
ARM の CPU IP はこれまで、スマートフォンの幅広い分野で非常に競争力があったものの、 同社の Mali GPU ラインナップは、クラス最高のソリューションとの競争に苦戦してきました。 年。 Mali シリーズの GPU は、パフォーマンスと電力効率の点で、Adreno および Imagination Technologies の PowerVR GPU よりも劣ることが何度も証明されました。 Bifrost アーキテクチャは Midgard アーキテクチャを継承し、ベクトル型からスカラー型に切り替わりました。 残念ながら、大きくなりつつあるように見えたパフォーマンスと電力効率の差を克服することはできませんでした。 Mali-G71 と Mali-G72 は、過度に高い電力消費とスロットリングに悩まされていました。 クアルコムの Adreno GPU や Apple のカスタム GPU (Apple から始まる) よりも劣っています。 A11)。
GPU パフォーマンスの低下は非常に重大な問題となったため、ベンダーは 1 世代後に達成される GPU のわずかな向上の見通しを軽視していました。 の エクシノス 9810たとえば、Mali-G72MP18 GPU は、前世代からわずかに改善されました。 ファーウェイの HiSilicon グループは、マリの GPU でかなりの程度に苦戦しました。 ハイシリコン キリン960 そしてその キリン970
GPU が異常に大量の電力を消費する一方で、提供する電力は比較的少ないため失望しました。 ファーウェイが型破りなスロットリングメカニズムの導入を余儀なくされるほど、パフォーマンスが低下しました。 それがつながった ベンチマーク不正行為が発見される 昨年はいくつかの Huawei 社の携帯電話で使用されました。昨年の Mali-G76 は、ありがたいことに、パフォーマンスと電力効率の両方の面で大幅な改善をもたらしました。 Mali-G76 の 10 コア バージョンを使用することで、HiSilicon は 46% のパフォーマンス向上を約束できました。同社はそのパフォーマンス数値を達成したにもかかわらず、 まだ GPU パフォーマンス (ピークパフォーマンスと持続パフォーマンスの両方) を引き継ぐことができませんでした。 パワー効率クラウンも同様です。 Samsung Systems LSI は、Exynos 9820 に 12 コア バージョンの GPU を実装しました。 結果的に差を縮めた に クアルコム Snapdragon 855 の Adreno 640 GPU. Qualcomm の Adreno GPU は Android 市場のクラスリーダーであり続けていますが、Apple は昨年、Apple A12 のカスタム GPU でさらに優れた成績を収めました。 Apple はピークパフォーマンスと持続パフォーマンスの両方でクアルコムに勝つことができ、電力効率も競争力があることを示しました。 現在、A12 の GPU が依然としてリーダーであり、Snapdragon 855 の Adreno 640 GPU はほとんどのベンチマークで 2 位に位置しています。
この競争環境に直面して、ARM は課題に対処するために強化する必要がありました。
その結果、Mali-G77 と新しい Valhall アーキテクチャが誕生しました。 ARM によれば、パフォーマンス密度が 30% 向上し、エネルギー効率が 30% 向上し、機械学習 (ML) が 60% 向上しました。 ARM は、Mali-G77 ベースがモバイル デバイスのピーク グラフィックス パフォーマンスを 40% 向上させると期待しています。
同社は、Mali-G77 が携帯電話にさらにハイエンドのゲームをもたらすと期待しており、2018 年は モバイル ゲームの収益が初めてコンソールおよび PC ベースのゲームの収益を上回った年 時間。
ML に関して ARM は、Mali-G77 は「ますます複雑になる」ML タスクをデバイス上でより高速に実行する機能をデバイスに提供し、パフォーマンス密度が 60% 向上すると述べています。 これは、処理のためにデータをクラウドに送信するよりも優れています。クラウドに送信すると、セキュリティ上の懸念が増大し、パフォーマンスが低下し、待ち時間が長くなります。
新しい Valhall アーキテクチャは、Mali-G77 および将来の Mali GPU の基礎です。 ARM は、Valhall の次の機能により、Valhall が「斬新なアーキテクチャ」になっていると述べています。
- 「エネルギー効率とパフォーマンス密度のさらなる飛躍を実現する新しいスーパースカラ エンジン
- よりコンパイラに優しい新しい命令セットを備えた簡素化されたスカラー ISA
- 命令の新しい動的スケジューリング
- Vulkan などの最新の API に合わせてデータ構造を再加工しました。
- さまざまな進歩や新機能が数多くありますが、主な 2 つの機能は、Mali-G77 の実行エンジンとテクスチャ マッパーです。」
ARM によると、Mali-G77 の幅広い実行エンジンは、多数のレーンで制御を共有することでパフォーマンス密度を向上させます。 Mali-G76 には、シェーダー コアあたり 8 ワイド ワープと合計 24 の FMA レーンがありますが、Mali-G77 には、16 ワイド ワープ、32 レーン (実行エンジンあたり 16 FMA の 2 つのクラスター)、およびシェーダー コアあたり 1 つのエンジンがあります。 同社によれば、これにより、G76 と比較して同じ領域でのコンピューティング能力が 33% 増加します。
ARM はまた、Mali-G77 のゲーム パフォーマンスの向上はクアッド テクスチャ マッパーに関連しているとも述べています。 これは 4 テクセル/サイクルを提供します。これは、Mali-G76 よりも 2 倍、Mali-G76 よりも 4 倍優れたスループットです。 G72。 これは、高忠実度のゲームとカジュアル ゲーム全体に改善をもたらすと言われていますが、特にテクスチャの重いゲームに大きな影響を与えるでしょう。 ARM によると、G77 のコンピューティング能力が向上したため、マシンのバランスを保つためにテクスチャ能力も向上させる必要がありました。 最終目標は? 以前よりも平方ミリメートルあたりのパフォーマンスが向上しました。
Mali-G77 は、新しい 16 ワイド実行エンジンとクアッド テクスチャ マッパーに適合するように最適化されています。 この最適化には、パフォーマンス密度とエネルギー効率に重点を置いた LSC と属性パイプの再設計が含まれます。
ARMはエネルギー効率の向上に「重点を置いている」と述べ、Mali-G77は2年前のMali-G72の50%のエネルギーで同じ作業ができると宣伝している。 同社によれば、Valhall アーキテクチャと Mali-G77 により、すべてのワークロードのエネルギー効率が向上し、 「幅広いコンテンツ」全体で 1.3 倍の改善。つまり、ユーザーはプレミアムでバッテリー寿命が長くなります。 デバイス。
ARM は、動的命令スケジューリングがハードウェアで処理されるようになり、パフォーマンスが向上すると述べています。 動的スケジューラは、どのワープからどの命令を実行するかを決定し、その作業はスーパースカラ スタイルで独立した並列 ALU に発行されると言われています。
最後に、ARM は、Valhall アーキテクチャが AFBC 1.3 を通じて ARM フレーム バッファ圧縮の進化を続けていることを指摘しています。 これは、ARM のブログ投稿で読むことができるいくつかの新機能をもたらします。
ARM は Mali-G77 に対していくつかの大きな約束をしており、複雑な AR と ML で大幅なパフォーマンス向上をもたらすと宣言しています。 「妥協のないグラフィックス パフォーマンスと効率の向上」を実現します。 この主張が現実になれば、ついに ARM Mali GPU が実用化されることになるかもしれません。 同世代の Adreno GPU と互角か、あるいはそれを上回っており、モバイル GPU 市場はさらに大きくなっています。 競争力。
ソース: 腕
経由: アナンドテック