本日の GeForce Beyond 基調講演で、Nvidia は最新の Ada Lovelace アーキテクチャを搭載した GeForce RTX 40 シリーズを紹介しました。 Ada Lovelace GPUは、TSMCの新しい4nmプロセスで構築されており、Nvidiaによれば、GPU向けに最適化されており、シェーダーコア、RTコア、Tensorコア全体にわたって多くの改善が詰め込まれています。 GPU には新しい GDDR6X メモリも搭載されています。
Nvidia GeForce RTX 40 シリーズのスペック
さっそくですが、Nvidia の Ada Lovelace GPU には、いくつかの優れたスペックが備わっています。 シェーダー側では、Nvidia Ada Lovelace GPU には、シェーディングのみで最大 83 TFLOPS のパフォーマンスをサポートする新しいストリーミング マルチプロセッサーが搭載されています。 既存の Nvidia GPU の最大 2 倍のパフォーマンスを実現でき、これはかなり重要なアップグレードです。
レイ トレーシング用に、Nvidia GeForce RTX 40 シリーズには第 3 世代の RT コアが搭載されており、高いパフォーマンスを約束します。 レイ トレーシング パフォーマンスの効果 TFLOPS は 191 に達し、前世代と比較して 2.8 倍に向上しました。 最後に、人工知能に関しては、これらの GPU には第 4 世代 Tensor コアが搭載されており、驚異的なパフォーマンスを実現します。 1.32 Tensor PFLOPS (ペタフロップス)、FP8 を使用した場合、前世代と比較して 5 倍の大幅な増加 加速度。
これらすべてに加えて、Nvidia はシェーダー実行順序変更と呼ばれる新機能を有効にしました。 名前が示すように、これにより、GPU をより有効に活用する方法で、GPU がオンザフライでシェーダー ワークロードを並べ替えることができます。 通常、ワークロードは GPU に順番に配信され、そのすべてが GPU の能力を最大限に活用するわけではありません。 これらの GPU は、順序を変更することで、より多くのワークロードを一度に処理し、その能力を最大限に活用してより優れたパフォーマンスを実現できます。 Nvidia は、これによりレイ トレーシングのパフォーマンスが 3 倍向上し、ゲームのフレーム レートが 25% 向上すると主張しています。
このようなパフォーマンスの向上にもかかわらず、TSMC と協力して設計された新しい 4nm プロセスのおかげで、Nvidia は前世代の 2 倍の電力効率を約束しています。 このようなパフォーマンスの向上は、消費電力の大幅な増加を伴うものではありません。最新の GPU がすでに電力を大量に消費していることを考えると、これは良いニュースです。
GPU には、AV1 エンコードのサポートに加えて、ビデオのエクスポート時間を半分に短縮するデュアル Nvidia エンコーダ (NVENC) も搭載されています。 Intel は Arc GPU での AV1 エンコーディングのサポートを最初に宣伝しましたが、現在は Nvidia が追いつきつつあります。
DLSS3
Nvidia GeForce RTX 40 シリーズの大きな新機能の 1 つは、Nvidia のディープラーニング スーパーサンプリング テクノロジの第 3 世代である DLSS 3 のサポートです。 DLSS 3 には、フレームレートをさらに向上させるためのさらなる改良が加えられており、DLSS フレーム生成を使用して GPU がフレーム全体を単独でレンダリングできるようにすることで CPU の制限を克服します。 のような CPU バウンドのゲームでは マイクロソフト フライト シミュレータ、DLSS フレーム生成のおかげで 2 倍のフレームレートを得ることができます。
\r\n https://www.youtube.com/watch? v=cJlo2I7CiD0\r\n
また、新しい Ada オプティカル フロー アクセラレータにより、DLSS 3 のニューラル ネットワークがシーン内の動きを予測できるようになり、画質を維持しながらフレーム レートをさらに向上させることができます。 Nvidia によれば、DLSS 3 を使用すると、従来のレンダリング技術と比較して、ゲームで最大 4 倍のパフォーマンスが得られるとのことです。
さらに、DLSS 3 は Nvidia Reflex を統合し、CPU と GPU がより緊密に連携できるようにすることでシステムの遅延を短縮します。 Nvidiaによれば、これによりシステムの応答性が2倍になる可能性があるという。
すでに 35 以上のゲームやアプリが DLSS 3 のサポートを発表しています。 マイクロソフト フライト シミュレータ, サイバーパンク 2077、Unity や Unreal Engine などのツール。 さらに、Nvidia は、レイ トレーシングと DLSS 3 を念頭に設計された Portal の新しいバージョンである Portal RTX も発表しました。
Nvidia GeForce RTX 4090 および 4080
これらの機能はすべて、Nvidia の次世代 GPU の一部であり、Nvidia GeForce RTX 4090 がデビューし、数週間後には RTX 4080 が続きます。 Nvidia GeForce RTX 4090 は、GeForce RTX 3090 Ti の最大 4 倍のパフォーマンスを約束します。 DLSS 3 のおかげで完全にレイトレーシングされたゲーム、または同じ 450W の電力を使用しながら 2 倍のパフォーマンス 力。
一方、Nvidia GeForce RTX 4080 には 2 つのバージョンがあり、1 つは 16 GB のメモリを搭載し、もう 1 つは 12 GB のメモリを搭載します。 16 GB モデルの場合、Nvidia は、Nvidia GeForce RTX 3080 Ti の最大 2 倍のパフォーマンスと、より少ない電力での RTX 3090 Ti よりも高いパフォーマンスを約束します。 12GB バージョンは RTX 3090 Ti よりも高速ですが、そのためにより多くの電力を消費します。 もちろん、これはすべて DLSS 3 を使用していることを前提としています。 これらのカードの仕様は次のとおりです。
GPUモデル |
CUDAコア |
メモリ |
価格 |
---|---|---|---|
Nvidia GeForce RTX 4090 |
16,384 |
24GB GDDR6X |
$1,599 |
Nvidia GeForce RTX 4080 16GB |
9,728 |
16GB GDDR6X |
$1,199 |
Nvidia GeForce RTX 4080 12GB |
7,680 |
12GB GDDR6X |
$899 |
Nvidia GeForce RTX 4090 は、10 月 12 日に発売される最初の製品になります。 2 つの RTX 4080 構成は 11 月に発売される予定です。 Nvidia によれば、Asus、Colorful、MSI、Zotac などのパートナーも、これらのカードの独自バージョンを発売することが予想されます。 聞いたことがあるかもしれませんが、 EVGA は Nvidia と連携しなくなりました, したがって、その会社から何も期待しないでください。
Nvidia RTX 6000
ゲーマーではない方のために説明しておくと、Nvidia の Ada Lovelace が新しい Nvidia RTX 6000 プロフェッショナル GPU でデビューします。 この GPU には、48GB の GDDR6 メモリと Ada Lovelace のすべての改良点が搭載されています。 RT コアにより前世代の最大 2 倍のスループットが約束され、第 4 世代 Tensor コアも AI トレーニングで 2 倍のパフォーマンスを実現します。 さらに、XR ワークロードに関して、Nvidia はビデオ エンコーディング パフォーマンスが最大 3 倍になると宣伝しています。
Nvidia RTX 6000は12月から発売される予定だが、Nvidiaは価格については言及していない。