クアルコムが Snapdragon 855 でパフォーマンス、ゲーム、AI をどのように改善したか

新しい Qualcomm Snapdragon 855 モバイル プラットフォームは、パフォーマンス、ゲーム、AI の面で大幅な改善をもたらし、それがどのように実現されたのかを詳しく説明します。

クアルコムのSnapdragon Summit 2018で、同社は 最新のプレミアム層の主力チップセット、Snapdragon 855 プラットフォームを発表. この新製品は、2019 年の多作な主力製品のほとんどの中心となり、Snapdragon X50 モデムによる驚異的なデータ速度の約束をもたらします。 しかし、それを超えて、Snapdragon 855 はすべてのシステムオンチップ ブロックに多くの改善をもたらします。 一部のコンピューティング ユニットでは、近年、前年比で最大のパフォーマンスと電力効率の向上が見られています。 歴史。

Spectra 380 ISP-CV についてはすでに説明しました。たとえば、これによりスマートフォンの写真撮影がさらに向上すると同時に、ユーザーはバッテリーを健全に節約できます。 ヘキサゴン DSP などの周辺コンポーネントへの注目が高まっていますが、愛好家が最も注目しているコアブロックです。 CPU と GPU への注目も、アーキテクチャの改善と新しいプロセスへの移行により、控えめ以上の向上が見られました。 ノード。 この記事では、Snapdragon 855 の CPU、GPU、DSP の新機能と既知の機能、および改善と新機能がどのような影響を与える可能性があるかを簡単にまとめます。 あなたの 2019年のユーザーエクスペリエンス。


A76 ベースの Kryo 485 CPU と 7nm への移行

Snapdragon 855 は、TSMC の最新の 7nm FinFET 製造プロセスに移行します。 通常、ダウンサイズやサイクル途中の最適化 (「低電力初期」からの移行など) を伴うノードの改訂が 1 ~ 2 年ごとに行われます。 (LPE) から Samsung-LSI ノードの「Low-Power Plus」(LPP) まで)、これらのメトリクスについて何らかのニュースで聞いたことがあるでしょう。 記事。 しかし、それは何を意味するのでしょうか? これに関連して、プロセッサのトランジスタの機能のサイズが説明され、それによって、新世代ごとにどのようなトランジスタ密度の向上が期待できるかがわかります。 単位面積あたりのトランジスタの数が増えると、プロセッサのパフォーマンスが向上します。 この機能は、プロセス ノードが小さいほどプロセッサ設計をより小規模で実装できるため、また重要です。 プロセッサの要素間のスペースが縮小し、結果として電子が移動しなければならない距離が短縮されます。 計算。 これにより、パフォーマンスが向上し、プロセスが小さくなると静電容量も低くなります。つまり、トランジスタのオン/オフをより短いレイテンシーとより低いエネルギーで行うことができます。 参考までに、TSMC は、7nm プロセスへの移行により、 

パフォーマンスと電力効率はそれぞれ 20% と 40% 程度, ただし、これはTSMC独自の10nm FinFETプロセスと比較したものです.

過去数回のSnapdragonフラッグシップチップセットでは、クアルコムがサムスンと協力し、14nmおよび10nmのLPP/LPEプロセスを実装しているのを見てきました。 ただし、Samsung の 7nm プロセスが 10月に量産に入ったばかりただし、当時は5G Qualcommチップセットがその上に構築されると報告されていました。 さらに、サムスンの 7LPP 設計は、極端紫外線リソグラフィー (EUVL) として知られる改良されたリソグラフィー技術に基づいて製造されています。 10nm FinFET と比較して、同等の設計複雑さで面積を 40% 削減し、速度を 20% 高速化し、消費電力を 50% 削減します。 先人たち。 より小さなプロセス ノードへの新しいジャンプは、達成することが非常に難しいため、祝われます。 たとえば、トランジスタが小さくなるにつれて、「リーク」または「オフ」のトランジスタを流れる電流が増加し、アイドル状態での静的電力消費が増加する可能性があります。 また、より高密度のトランジスタ数を備えた小型のチップでは、特定のシリコン ウェーハを最大限に活用できる可能性がありますが、歩留まりは低くなる傾向があります。 前述のリークに加えて、(高い) リファレンスで実行される「より高いビンに分類された」プロセッサを入手することが困難であるためです。 周波数。 これらはただ いくつかの もちろん、新しいプロセス ノードが量産に入るまでに解決される多くの開発のハードルはありますが、 つまり、新しいプロセスサイズを導入するには、多くの研究開発と製造上の課題があり、コストが増加します。 市場。

Kryo 485 用にライセンスされた最新の ARM A76 アーキテクチャも、Qualcomm Snapdragon 855 で見られる前年比の大幅な向上に大きく貢献しています。 A76 コアは、ARM のオースティン オフィスからのまったく新しい白紙の設計で、ARM が「ラップトップ クラスのパフォーマンス」と呼ぶものを提供するためにゼロから構築された新しいマイクロ アーキテクチャを特徴としています。 これはまだセミカスタム設計であり、クアルコムは効率を高めるために最適化されたデータのプリフェッチや、より大規模なアウトオブオーダー実行などの改善を行っています。 窓。 この新しいデザインは、Snapdragon 845 の Gold コアのベースとなっている A75 に比べて大幅なパフォーマンスの向上をもたらします。 パフォーマンスが 35% 向上し、電力効率が 40% 向上. 同じパワーエンベロープで 10nm プロセスの A75 と 7nm プロセスの A76 を比較すると、 750mW/コア、新しいコアのおかげでパフォーマンスの利点が 40% に増加し、エネルギー節約も向上します 50%まで。 さらに、非対称単一命令複数データ (ASIMD) パイプラインと 内積命令 畳み込みニューラル ネットワークでの推論などの機械学習タスクのパフォーマンスが合計で最大 3.9 倍向上します。 これらはすべて、業界をリードする面積あたりのパフォーマンスに相当し、クアルコムの 2.84GHz の「プライム コア」が ARM の 3GHz リファレンス クロック速度に近づいているため、新しい 7nm プロセスを大幅に補完します。 使っていた 新しいコアの詳細を説明するとき。 全体として、 クアルコムは CPU パフォーマンスの 45% 大幅な向上を約束 845を上回っており、前年比の増加としてはこれまでで最大となった。

Snapdragon 855 の「Prime コア」について言えば、大幅な改善を考慮すると、Qualcomm がこの新しいクラスター設定に移行するのも驚くべきことではありません。 ARM によって実現された LITTLE ダイナムIQ テクノロジープラットフォーム。 本質的に、DynamIQ により、マルチコア プロセッサ設計の柔軟性と拡張性が向上し、特定のクラスタ内で複数のコア設計が可能になるだけでなく、コアごとのきめ細かい電圧制御が可能になります。 (編集: Q&A で、クアルコムは、Prime コアがパフォーマンス クラスターとパワー ドメインを共有しており、ここで説明されているユーティリティが制限されていることを確認しました)。 A76 は、シングルスレッドの限界を押し上げることを考えると、独自のクロックを備えたこのような孤立したプレミアム コアに特に適しています。 A75 よりもクロックあたりの整数命令数が 25% 多く、ASIMD および浮動小数点のパフォーマンスが 35% 高く、同時に 90% 高いパフォーマンスを実現します。 メモリ帯域幅。 つまり、A76 は前世代よりも大きな世代の向上をもたらしており、それがクアルコムの成長にも貢献したことは間違いありません。 Snapdragon 855 の前年比パフォーマンスは通常より大きく向上しました (参考までに、Qualcomm は 845 以降のパフォーマンスが 25 ~ 30% 向上したと述べています) 835)。 これは、Qualcomm Snapdragon 855 の結果として得られるパフォーマンスを、Exynos 9810 に搭載されている Samsung LSI の Mongoose 3 (M3) コアよりも上回るには十分かもしれません。 ただし、その特定の設計では、クアルコムのチップには見られない電力効率の問題があり、Snapdragon 855 には問題が発生する可能性が高いです。 どちらか。

それはエンドユーザーにとって何を意味するのでしょうか? もちろん、ベンチマーク コアの増加を期待する必要があります。ARM は、モバイルの Geekbench スコアが 28% 向上し、JavaScript のパフォーマンスが 35% 向上すると予測しています。 エンドユーザーエクスペリエンスとはほとんど関係のないベンチマークを超えて、A76 は A75 の焦点を引き継ぎます。 持続的なパフォーマンスつまり、ユーザーは、長時間のゲームセッション中にスロットリングが少なくなることが期待できます。 7nm への移行と新しいコア設計の組み合わせにより、間違いなく顕著なバッテリー性能が得られます。 エンド ユーザーの生活が向上します。これがおそらくこのセットの最も魅力的な機能です。 アップグレード。 新しい 'Prime' コアも興味深いものです。トップのシングルスレッド パフォーマンスに重点を置いた単独のコアでは、 を適切に活用するように設定されていないアプリケーションやプロセス全体で有益であることが証明されています。 マルチスレッド。 もちろん、7nm 製造プロセスは Snapdragon 855 の他のブロックにもさらに影響を及ぼし、同様の省電力化を実現します。 スマートフォン写真の画像処理など、日常のユーザー エクスペリエンスにも関与する他のコンピューティング ユニットに接続します。


「Snapdragon Elite Gaming Experience」と Adreno 640 GPU

今回、Qualcomm Snapdragon 855 はゲームに重点を置いており、タイトルの人気を考えると驚くべきことではありません。 Fortnite や PlayerUnknown’s Battlegrounds のほか、アジアでのモバイル eスポーツの人気の高まり (はい、これは事実です) などです。 クアルコムが示した数字によると、 Newzoo 2017 世界ゲーム市場レポート, モバイル ゲームは増加傾向にあり、2018 年の予想総収益は 703 億ドルで、前年比 25.5% 増のおかげで全ゲーム収益の 51% を占めます。

Adreno 640 GPU は健全なパフォーマンスをもたらします。 グラフィックスパフォーマンスが20%向上これにより、この特定の分野におけるクアルコムの競合他社に対する優位性がさらに高まりました。 ただし参考までに、Snapdragon 845 は Snapdragon 835 よりも 30% 向上し、Snapdragon 835 自体も Snapdragon 821 よりも 30% 向上しました。 それでも、この点でクアルコムがグラフィックスパフォーマンス、そして最も重要なことに、その面でも改善できれば、ワットあたりのパフォーマンスで優位を保つことができるはずです。 この数字を超えて、クアルコムは Adreno に関してはこれまでと同様に秘密主義です。 電源管理用のマイクロコントローラー、および 640 がどのようにドライバーのオーバーヘッドが最も低いかについて、同社は言及しましたが、 を含める 算術論理演算ユニットが 50% 増加 (ALU) これにより、AI のパフォーマンスがさらに加速されます。

クアルコムが説明会で多くの時間を費やして話したことの 1 つは、より多くのモバイル ゲーム体験に「物理ベース レンダリング」(PBR) を導入したいという願望です。 PBR は、リアルなグラフィックス レンダリングを可能にするシェーディング モデルであり、テクスチャや表面のテッセレーションで表現されたマテリアルに従って光の流れを正確にモデリングします。 これにより、ゲーム内オブジェクトは、擦り傷や鏡面ハイライトなどの微細な表面の適切なレンダリングなど、現実世界のマテリアルの視覚的特性を適切に模倣することができます。 ただし、最も顕著な改善点は、平らで不透明な (シミュレートされた) マテリアルのものも含め、すべての表面の反射率と光沢をより正確に描写できるようになった点です。

クアルコムと人気の Unity Engine の開発者は、PBR をよりアクセスしやすくすることに取り組んできました。 しかし、同社は他のエンジン開発者やゲーム開発者とも協力して、モバイル ゲームを Snapdragon 向けに最適化しています。 デバイス。 たとえば、Unity、Unreal、Messiah、NeoX などのゲーム エンジンはすでに Snapdragon デバイス用に最適化されており、Snapdragon 855 は新しいグラフィックス API などの最新のグラフィックス API をサポートしています。 バルカン 1.1. Lineage II: Revolutions を開発した NetMarble のようなスタジオも、Snapdragon プラットフォームの強みを最大限に発揮するために、過去に Qualcomm と協力してきました。 さらに、 スナップドラゴン675、までを達成するカスタムアルゴリズムの話を見ました。 ジャンクが 90% 減少 最適化のない同じプラットフォームと比較すると、同じ変更が Snapdragon 855 にも加えられています。 これらの最適化が何を伴うのかはまだ明らかではなく、それらが次のような分野に適用されるとは期待していません。 すべてのゲームで、少なくともより大きなタイトルでは間違いなくパフォーマンスが向上することを意味します。 アンドロイド。

さらに、Snapdragon 835 と 845 では、(それぞれ) の再生とキャプチャが可能でした。 10 ビットの真の HDR ビデオである Qualcomm Snapdragon 855 は、 真のHDRゲーム。 これには、真の HDR 対応ディスプレイが必要になりますが、幸運なことに、フラッグシップ スマートフォンでは、このディスプレイがますます一般的になってきています。 このため、ユーザーは、より深い色調、より高いダイナミック レンジ (名前が示すとおり)、および改善されたコントラストを備えたより豊かな色を期待できます。 これは必ずしも必須の機能ではありませんが、現在の HDR ゲームを考慮すると確かに便利です セットアップには高価な HDR 対応のテレビとモニター、さらに高性能のコンピューターと特定のゲームが必要です コンソール。 Qualcomm Snapdragon 855 により、ゲームにおける HDR はおそらく、よりアクセスしやすく便利になります (もちろん、タッチスクリーン コントロールはありません)。


AI ワークロード用の新しい Hexagon 690 DSP

同社はマーケティング資料でこれを「ニューラル プロセッシング ユニット」と明示的に呼んでいませんが、AI ワークロードも新しく改良された Hexagon 690 DSP の恩恵を受けるでしょう。 クアルコムは、何世代も前にこれらのコプロセッサを密かに導入しました (QDSP6 v6 の適切な導入とともに) 820 と並んで)、しかし彼らがそれらをより優れた SoC ブロックの一部として売り込み始めたのは最近になってからです。 あい。 もともとイメージング ワークロードを高速化するために設計された DSP のアーキテクチャは、特に Hexagon Vector eXtensions (HVX) を組み込むことで、ML タスクに最適になりました。 DSP は、固定機能のハードウェアよりもプログラム可能でありながら、パフォーマンスとパフォーマンスの一部を維持します。 アプリケーション固有のプロセッサ ブロックを特徴付ける効率上のメリットにより、スカラーとベクトルが大幅に高速化されます。 オペレーション。 これは、DSP にオフロードできる、絶えず変化する画像処理アルゴリズムにとって優れていることが証明されましたが、当然 AI ワークロードにも適しています。 Hexagon DSP は、 機械学習に恩恵をもたらす 優れたハードウェアレベルのマルチスレッドと並列コンピューティングにより、エッジデバイス上で数千ビットのデータを処理できます。 平均的な CPU コアのサイクルあたり数百ビットと比較して、処理サイクルあたりのベクトル単位数が多く、複数のオフロードを処理します セッション。

Hexagon DSP は、デバイスの DDR メモリ コントローラーをバイパスして、イメージング センサーから DSP のローカル メモリ (L2 キャッシュ) にデータを直接ストリーミングできるため、イメージング タスクに特に適しています。 たとえば、Google は、独自のアルゴリズムを導入する前に、Hexagon DSP の画像処理を使用して Pixel および Pixel 2 の HDR+ アルゴリズムを強化しました。 ピクセルビジュアルコア. また、Hexagon 対応デバイスでもあり、人気の Google カメラ ポートから最高の結果が得られます。 ここ. これは仮想現実と拡張現実のワークロードで使用されており、 今はなき プロジェクト タンゴ レノボ Phab 2 プロ そして ASUS ZenFone AR. とはいえ、Snapdragon の主力デバイスを実装しているほとんどの OEM は、何らかの方法で画像処理に Hexagon DSP を利用しており、これは次のようなツールを使用して検証できます。 スナップドラゴンプロファイラー.

では、新しい DSP の何が新しいのでしょうか? Hexagon 690 では、ベクトル アクセラレータ (HVX) の数が 2 つから 4 つに倍増し、4 つのスカラー スレッドと連携して動作し、パフォーマンスも 20% 向上しました。 それに加えて、Hexagon 690 は、モバイル向け初のテンソル アクセラレータを搭載しています。 ヘキサゴン テンソル アクセラレータ (HTA). これは重要な追加機能です。高価な行列乗算のハードウェア アクセラレーションとして機能します。 また、非線形関数 (シグモイドや ReLU など) をハードウェア レベルで統合し、さらに高速化します。 推論。 DSP に対するこれらの変更は次のように変換されます。 音声アシスタントのパフォーマンスが向上、ホットワード検出からデバイス上のコマンド解析まで、たとえばエコー キャンセルやノイズ抑制の向上を実現します。 クアルコムは、AI ワークロードの活用を可能にする完全なヘテロジニアス コンピューティング プラットフォームを提供していることを強調します。 CPU、GPU、DSP、または 3 つのブロックの任意の組み合わせ -- クアルコムのゲイリー・ブロットマン氏の言葉を借りれば、これは その 「複数のコア、それはハードウェアを超えた、完全なシステムです」. 第 4 世代の「Qualcomm AI Engine」はハードウェアを超えており、Snapdragon Neural Processing SDK と Hexagon NN へのアクセスもサポートされています。 前述のブロック、Android NN API、Caffe/Caffe 2、TensorFlow/Lite、ONNX (Open Neural Network) などの一般的な ML フレームワーク 交換)。 合計すると、Snapdragon 855 は次のことを提供できます。 生の AI パフォーマンスの 3 倍 前世代の(Huaweiと比較して2倍)、上回っています 1 秒あたり 7 兆オペレーション (TOP). ただし、クアルコムは単一の専用ブロックに重点を置くのではなく、ヘテロジニアス コンピューティング ソリューションに引き続き重点を置いていることに留意してください。

Hexagon DSP について詳しくは、こちらをご覧ください。 去年の作品 AI ワークロードにどのように役立つかを詳しく説明します。


要約すると、Snapdragon 855 のコンピューティング パッケージは、近年見られるより大きな影響力のある年々の改善をもたらしています。 Spectra 380 ISP-CV、 これについては別の記事で説明しましたまた、パフォーマンスと電力効率が大幅に向上し、4K 60FPS HDR ビデオ録画などの優れた新機能が可能になります。 ポートレート モードまたは背景の交換 (非常に柔軟です!)。

この記事で説明したように、これらの進歩と新機能は、ユーザー エクスペリエンス全体を通じて明確に感じられるはずです。 私たちは Qualcomm Snapdragon 855 を楽しみにしており、間もなく詳細なテストができることを楽しみにしています。最新の Snapdragon 855 ニュースと分析については XDA-Developers にご注目ください。