DirectStorage가 GPU 성능을 향상시키는 방법

PCIe 5.0 SSD는 향후 우수한 게임 성능을 달성하는 데 핵심적인 부분이 될 수 있습니다.

DirectStorage는 게임에서 SSD가 사용되는 방식을 현대화하기 위한 Microsoft의 솔루션입니다. 현재의 SSD는 데이터 전송 속도와 관련하여 소프트웨어에 의해 매우 제한적입니다. DirectStorage는 단순히 병목 현상을 제거하고 게임이 NVMe/PCIe의 모든 기능을 사용하도록 하는 방법일 뿐입니다. 드라이브. 심지어 GPU가 CPU를 완전히 우회하여 SSD에 직접 액세스할 수도 있습니다. 로딩 시간을 줄이는 데 매우 유용할 것이라는 말을 들어보셨을 것입니다. 대부분의 수사가 여기에 집중되어 있습니다.

그러나 DirectStorage는 로딩 시간에만 국한된 것이 아니며, 사실 로딩 시간은 이 새로운 기술의 주요 초점도 아니라고 생각합니다. DirectStorage의 진정한 목적은 SSD를 GPU에 연결하고 더 높은 프레임 속도를 위해 그래픽 성능을 높이는 것입니다. 이는 PC 게임에 정말 유용할 수 있으며 게이머가 PCIe 5.0 SSD를 최대한 활용할 수 있도록 해줍니다(현재는 게임에 그다지 유용하지 않습니다.) 또는 최신 GPU를 더욱 끔찍하게 만드는 또 다른 것일 수도 있습니다.

DirectStorage가 SSD를 CPU 및 GPU만큼 중요하게 만드는 방법

분명히 SSD와 GPU는 상당히 다른 하드웨어입니다. 하나에 게임을 저장하고 다른 하나에 게임을 실행하는데, 더 빠른 SSD가 로딩 시간 외에 더 나은 게임 성능을 의미한다는 것은 확실하지 않습니다. 그러나 모든 GPU에는 한 가지, 즉 메모리, 더 구체적으로 말하면 VRAM. 기본적으로 VRAM은 SSD와 같은 데이터 저장 매체일 뿐이며, GDDR은 NAND 플래시와 상당히 다르지만 둘 다 대역폭이라는 한 가지 공통점이 있습니다.

메모리 대역폭은 GPU의 핵심 사양입니다. 이는 메모리 버스 폭, 주파수의 조합에 의해 결정됩니다. 전체 메모리 버스를 활용하려면 일정 수의 메모리 칩이 필요하므로 메모리 칩이 몇 개나 사용되고 있는지 알 수 있습니다. 작은 조각. 저가형 GPU는 일반적으로 처리 가능한 대역폭이 최소 100GB/s이고, 고급 GPU는 1TB/s에 불과합니다. SSD의 대역폭은 SSD 제조업체가 광고하는 경향이 있는 전송 속도입니다.

이제 여러분은 PCIe 5.0 SSD가 이론적으로 100GB/s와는 거리가 먼 16GB/s로 제한된다는 점을 알고 계실 것입니다. 그러나 이는 단지 원시 데이터일 뿐입니다. DirectStorage의 비결은 데이터 압축 해제에 CPU가 아닌 GPU를 사용할 수 있다는 점입니다. 따라서 이제 SSD에서 직접 데이터를 압축하여 GPU에 제공하는 것이 가능해졌습니다. 이는 또한 CPU의 부하를 줄이는 추가적인 부작용도 있습니다.

Microsoft는 DirectStorage가 어느 정도 압축할 수 있는지 아직 발표하지 않았지만 제가 수집한 바에 따르면 압축률은 아마도 5배 또는 그 이상일 것입니다. 이는 본질적으로 대역폭의 5배입니다. 이는 미래의 가장 빠른 PCIe 5.0 SSD가 최대 80GB/s의 추가 대역폭을 제공할 수 있음을 의미합니다.

저가형 및 중급 GPU의 경우 이는 매우 큰 문제입니다. 80GB/s의 추가 대역폭은 RTX 4060의 경우 30% 개선되고 RX 7600의 경우 약 25% 개선됩니다. 고급 GPU의 이점은 덜 명확하지만 최소한 약간의 추가 효과가 있습니다. PCIe 6.0 SSD는 이를 160GB/s의 추가 대역폭으로 증가시키며 이는 훨씬 더 큰 문제가 될 것입니다. 도대체 휴대용 게임용 PC에 PCIe 4.0 SSD를 장착하면 통합 그래픽 성능이 크게 향상될 것입니다. 스팀 데크.

DirectStorage는 훌륭한 것일 수도 있고 향후 GPU를 방해하는 또 다른 이유일 수도 있습니다.

출처: 엔비디아

DirectStorage에 대해 제가 걱정하는 것 중 하나는 있으면 좋은 기능이라기보다는 성능이 좋지 않을 수 있다는 것입니다. -빠른 SSD 일종의 특수 효과. 제가 특히 걱정하는 이유 중 하나는 GPU 제조업체(여기서는 주로 Nvidia와 AMD)가 한동안 GPU의 메모리를 줄여 비용을 절약하려고 노력해왔기 때문입니다. 그 중 대부분은 용량과 관련이 있습니다., 대역폭에 관한 것이기도합니다.

최근 몇 년 동안 우리는 놀라울 정도로 작은 메모리 버스 폭을 갖춘 매우 빠른 GPU가 출시되는 것을 보았습니다. 예를 들어, 256비트 또는 192비트 버스는 미드레인지의 표준이 되는 경향이 있었지만 이제는 다음과 같은 미드레인지 카드가 사용되었습니다. RX 7600과 RTX 4060은 128비트 버스에 불과하며, 이는 많은 업계에서 가장 느린 GPU용으로 예약되어 있었습니다. 시리즈. RTX 4090에도 RTX 3080 Ti와 마찬가지로 384비트 폭의 버스만 있습니다.

물론 Nvidia와 AMD가 버스 폭을 줄이려는 데는 타당한 이유가 있습니다. 생산 비용이 더 저렴하고 더 넓은 버스는 전체 폭을 채우고 전체를 얻으려면 더 많은 메모리 칩이 필요합니다. 성능. 그래도 이는 궁극적으로 비용 절감 조치이며, 최대한 많은 돈을 절약하는 것이 가장 좋습니다. 목표를 달성하지 못하면 결국 제품의 무결성을 타협하려는 인센티브를 창출하게 됩니다. 선. Nvidia는 최근 GPU의 VRAM을 통해 이를 수행했으며 일부 게임에서는 실제로 RTX 3070과 같은 400달러 이상의 GPU에서 VRAM이 부족할 수 있습니다.

가장 큰 우려는 DirectStorage가 이 기술이 표준이 되거나 충분히 널리 보급되면 GPU에서 정상적인 성능을 얻기 위한 요구 사항이 될 것이라는 점입니다. AMD가 최소한의 레인을 배치했기 때문에 좋은 성능을 위해 PCIe 4.0이 필요한 저가형 GPU인 RX 6400의 훨씬 더 나쁜 버전과 같을 것입니다. GPU를 예상대로 실행하기 위해 모든 사람이 최고급 PCIe 5.0 SSD가 필요한 경우 하드웨어를 구매할 수단이 부족한 게이머를 위한 또 다른 진입 장벽.

그래도 기술은 확실히 멋지네요

DirectStorage가 GPU 설계에 어떤 인센티브를 제공할지 걱정되지만, 게임을 실제로 향상시킬 수 있는 힘을 가질 수 있다고 생각합니다. 분명히 게임 개발자는 하드웨어 작업이 더 쉬운 Xbox의 DirectStorage에서 많은 용도를 추출할 수 있지만 제가 들은 바에 따르면 이 기술은 플러그 앤 플레이 방식이므로 다양한 하드웨어가 설치된 PC에서 잘 작동할 것 같습니다. 구성.

저는 특히 DirectStorage가 휴대용 게임 PC와 같은 통합 그래픽에 대해 무엇을 할 수 있는지에 대해 매우 기대하고 있습니다. ROG Ally의 메모리는 약 100GB/s에 불과합니다. 대역폭이 향상되었으며 DirectStorage는 가장 빠른 2230 크기의 PCIe 4.0 SSD를 사용하여 25GB/s 정도를 추가할 수 있습니다. 더 빠른 2230 크기의 드라이브가 출시되면 최대 40GB/s가 될 수 있습니다. 밖으로. 노트북이나 미니 PC의 iGPU가 빠른 PCIe 4.0 또는 5.0 SSD를 사용하면 얼마나 빨라질 수 있는지 생각해 보세요(방열판 없이 실행될 수 있을 만큼 충분히 냉각된 경우). 이는 게임용 저가형 통합 GPU의 생존 가능성을 실제로 향상시킬 수 있으며, 저는 그것을 보고 싶습니다.