오늘 GeForce Beyond 기조연설에서 Nvidia는 최신 Ada Lovelace 아키텍처로 구동되는 GeForce RTX 40 시리즈를 소개했습니다. Ada Lovelace GPU는 TSMC의 새로운 4nm 프로세스를 기반으로 구축되었습니다. Nvidia는 이 프로세스가 GPU에 최적화되어 있으며 셰이더 코어, RT 코어 및 Tensor 코어 전반에 걸쳐 많은 개선 사항이 포함되어 있다고 말합니다. GPU에는 새로운 GDDR6X 메모리도 함께 제공됩니다.
Nvidia GeForce RTX 40 시리즈 사양
Nvidia의 Ada Lovelace GPU는 즉시 몇 가지 인상적인 사양을 제공합니다. 셰이더 측면에서 Nvidia Ada Lovelace GPU에는 최대 83 TFLOPS의 성능을 지원하는 새로운 스트리밍 멀티프로세서가 함께 제공되며 이는 셰이딩에만 해당됩니다. 기존 Nvidia GPU보다 최대 2배의 성능을 제공할 수 있는데, 이는 상당히 중요한 업그레이드입니다.
레이 트레이싱을 위해 Nvidia GeForce RTX 40 시리즈에는 3세대 RT 코어가 탑재되어 있습니다. 191 효과 TFLOPS의 레이 트레이싱 성능을 제공하며 이전 세대에 비해 2.8배 증가했습니다. 마지막으로, 인공 지능의 경우 이 GPU에는 4세대 Tensor 코어가 함께 제공됩니다. 1.32 Tensor PFLOPS(페타플롭스), FP8 사용 시 이전 세대에 비해 5배 증가 가속.
무엇보다도 Nvidia는 Shader Execution Reordering이라는 새로운 기능을 활성화했습니다. 이름에서 알 수 있듯이 이를 통해 GPU는 GPU를 더 잘 활용하는 방식으로 즉시 셰이더 작업 부하를 재정렬할 수 있습니다. 일반적으로 워크로드는 순차적으로 GPU에 전달되며, 모든 워크로드가 GPU의 전체 성능을 사용하는 것은 아닙니다. 이러한 GPU는 순서를 변경함으로써 더 많은 작업 부하를 한 번에 처리하고 최대 성능을 사용하여 더 나은 성능을 제공할 수 있습니다. Nvidia는 이것이 광선 추적 성능을 3배까지 향상시키고 게임의 프레임 속도를 25%까지 높일 수 있다고 주장합니다.
이러한 성능 향상에도 불구하고 TSMC와 협력하여 설계된 새로운 4nm 공정 덕분에 Nvidia는 이전 세대보다 두 배의 전력 효율성을 약속합니다. 이러한 성능 향상은 전력 소비의 엄청난 증가로 이어져서는 안 됩니다. 이는 이미 전력을 많이 소비하는 최신 GPU의 상황을 고려하면 좋은 소식입니다.
GPU에는 AV1 인코딩을 지원할 뿐만 아니라 비디오 내보내기 시간을 절반으로 줄이는 듀얼 Nvidia 인코더(NVENC)도 함께 제공됩니다. Intel은 Arc GPU에서 AV1 인코딩 지원을 처음으로 홍보했지만 이제는 Nvidia가 따라잡고 있습니다.
DLSS 3
Nvidia GeForce RTX 40 시리즈의 가장 큰 새로운 기능 중 하나는 Nvidia 딥 러닝 슈퍼샘플링 기술의 3세대인 DLSS 3에 대한 지원입니다. DLSS 3에는 GPU가 DLSS 프레임 생성을 사용하여 전체 프레임을 자체적으로 렌더링할 수 있도록 함으로써 CPU 제한을 극복하고 프레임 속도를 더욱 높이는 향상된 기능이 제공됩니다. 다음과 같은 CPU 바인딩 게임에서는 마이크로소프트 플라이트 시뮬레이터, DLSS 프레임 생성 덕분에 프레임 속도를 두 배로 높일 수 있습니다.
\r\n https://www.youtube.com/watch? v=cJlo2I7CiD0\r\n
또한 DLSS 3의 신경망이 장면의 움직임을 예측하여 이미지 품질을 유지하면서 프레임 속도를 더욱 높일 수 있는 새로운 Ada Optical Flow Accelerator도 있습니다. Nvidia는 DLSS 3를 사용하면 기존 렌더링 기술에 비해 게임 성능을 최대 4배까지 높일 수 있다고 말합니다.
또한 DLSS 3은 Nvidia Reflex를 통합하여 CPU와 GPU가 더욱 긴밀하게 작동하도록 하여 시스템 대기 시간을 줄입니다. Nvidia는 이것이 시스템 응답성을 두 배로 늘릴 수 있다고 말합니다.
다음을 포함하여 35개 이상의 게임과 앱이 이미 DLSS 3 지원을 발표했습니다. 마이크로소프트 플라이트 시뮬레이터, 사이버펑크 2077, Unity 및 Unreal Engine과 같은 도구가 있습니다. 또한 Nvidia는 레이 트레이싱과 DLSS 3를 염두에 두고 설계된 Portal의 새로운 버전인 Portal RTX도 발표했습니다.
엔비디아 지포스 RTX 4090 및 4080
이러한 모든 기능은 Nvidia GeForce RTX 4090을 선보이고 몇 주 후에 RTX 4080을 출시하는 Nvidia의 차세대 GPU의 일부입니다. Nvidia GeForce RTX 4090은 GeForce RTX 3090 Ti보다 최대 4배 향상된 성능을 약속합니다. DLSS 3 덕분에 완전히 레이 트레이싱된 게임을 즐기거나 동일한 450W를 사용하면서 성능이 두 배 향상됩니다. 힘.
한편, Nvidia GeForce RTX 4080은 16GB 메모리와 12GB의 두 가지 버전으로 제공됩니다. 16GB 모델의 경우 Nvidia는 Nvidia GeForce RTX 3080 Ti 성능의 최대 2배, RTX 3090 Ti보다 더 적은 전력을 사용하면서 더 높은 성능을 약속합니다. 12GB 버전은 여전히 RTX 3090 Ti보다 빠르지만 이를 위해 더 많은 전력을 사용합니다. 물론 이는 모두 DLSS 3를 사용한다고 가정한 것입니다. 이 카드의 사양은 다음과 같습니다.
GPU 모델 |
CUDA 코어 |
메모리 |
가격 |
---|---|---|---|
엔비디아 지포스 RTX 4090 |
16,384 |
24GB GDDR6X |
$1,599 |
엔비디아 지포스 RTX 4080 16GB |
9,728 |
16GB GDDR6X |
$1,199 |
엔비디아 지포스 RTX 4080 12GB |
7,680 |
12GB GDDR6X |
$899 |
Nvidia GeForce RTX 4090은 10월 12일에 출시되는 첫 번째 제품이 될 것입니다. 두 가지 RTX 4080 구성은 11월에 출시될 예정입니다. Nvidia는 Asus, Colourful, MSI, Zotac과 같은 파트너도 이러한 카드의 자체 버전을 출시할 것으로 기대할 수 있다고 말합니다. 여러분도 들으셨겠지만, EVGA는 더 이상 Nvidia와 협력하지 않습니다, 그러니 그 회사에서 아무것도 볼 것이라고 기대하지 마십시오.
엔비디아 RTX 6000
게이머가 아니라면 Nvidia의 Ada Lovelace가 새로운 Nvidia RTX 6000 전문 GPU에서 데뷔합니다. 이 GPU에는 48GB의 GDDR6 메모리와 Ada Lovelace의 모든 개선 사항이 함께 제공됩니다. RT 코어에서 이전 세대보다 최대 2배의 처리량을 약속하며, 4세대 Tensor 코어는 AI 훈련에서도 2배의 성능을 제공합니다. 또한 XR 워크로드의 경우 Nvidia는 비디오 인코딩 성능이 최대 3배 향상된다고 선전합니다.
Nvidia RTX 6000은 12월부터 출시될 예정이지만 Nvidia는 가격에 대해서는 언급하지 않았습니다.